'Statistics'에 해당되는 글 4건

  1. 2010.05.17 Odd ratio란
  2. 2010.05.17 코호트 연구란?
  3. 2010.05.05 SPSS 분석 종류
  4. 2010.03.22 로지스틱 회귀분석
2010. 5. 17. 11:31

2*2는 가로, 세로 각각 2개의 범주 (0, 1)로 되어있는데, 가로의 1이 0에 비해 세로의 1을 증가시키는 위험도라고나 할까요.

예를 들어
가로: 커피를 안마심, 마심
세로: 심장병 없음, 있음
이라면 OR은 커피를 마시는게 안마시는것에 비해 심장병의 위험을 OR배 증가시킨다는 의미를 갖습니다.  뉴스에 나오는 통계는 보통 OR일겁니다.

OR = 1이면 아무연관이 없는겁니다.

'Statistics' 카테고리의 다른 글

코호트 연구란?  (0) 2010.05.17
SPSS 분석 종류  (0) 2010.05.05
로지스틱 회귀분석  (0) 2010.03.22
Posted by moshima
2010. 5. 17. 11:17

코호트 연구란?  

질병의 원인에 관해 공통적인 특성을 갖고 있는 인구집단을 코호트(cohort)라 하며, 코호트 연구(cohort studies)란 특정 코호트로부터 질병 발생에 관여하리라 의심되는 어떤 특성이나 원인 인자에 노출된 정보를 수집한 후, 이 코호트 집단에서 해당 질병이 발생될 때 까지 추적-관찰함으로써 요인에 노출되지 않은 집단에 비해 노출된 집단에서의 질병 발생률을 비교하는 역학적 연구방법이다.
코호트 연구는 시작 단계에서 연구의 목적을 연구가설에 명확히 설정하여야 한다. 코호트 연구에서는 대규모 인구집단을 장기간에 걸쳐 추적하여야 하기 때문에 일반적으로 연구에 소요되는 시간과 경비가 막대하다. 따라서 코호트 연구에 비해 비교적 시간과 비용이 적게 드는 형태의 역학적 연구, 예를 들어 사전에 단면적 연구나 환자-대조군 연구 같은 연구를 통해 연구가설을 도출한 후, 확실한 연구가설을 가지고 코호트 연구를 수행해야 한다.

코호트 연구에서는 어떤 인구집단을 대상으로 할까 결정하는 과정에서 코호트 연구의 특성상 반드시 연구가설과 연구의 실제적 수행 가능성이란 두 가지 관점에서 판단해야 한다. 코호트 대상은 지역 주민과 같은 ① 일반 인구집단이 될 수도 있고, 혹은 보다 적은 규모이지만 대상의 확인과 향후 추적조사가 어렵지 않은 ② 특정 인구집단을 대상으로 할 수도 있는데, 예를 들어 의료보험가입자, 의사 혹은 간호사처럼 특수 전문직 인구집단이 가능하다. 혹은, ③ 특정 원인에 노출된 집단을 코호트 연구의 대상으로 하기도 하는데, 원자폭탄 피해지역 주민이나 특수 산업장 근로자 혹은 항암요법을 받은 환자 등도 코호트로서 가능한 집단이다.

주요 장점은;

① 위험요인에 노출 여부를 질병이 생기기 이전에 측정하므로 질병 발생에 있어서 비뚤림을 방지한다.
② 노출 정도가 희귀한 경우에도 코호트를 적절히 선택하여 연구할 수 있다.
③ 하나의 노출 요인에 대해 다수의 결과(질병)를 동시에 연구할 수 있다.
④ 질병의 발생을 노출군과 비노출군에서 직접 측정할 수 있다.

주요 단점은;

① 전향적으로 수행되므로 비용과 시간이 많이 든다.
② 시간 경과에 따라 노출상태와 진단기준이 변하게 되어 대상자 분류에 영향을 미칠 수 있다.
③ 대상자의 노출 상태를 미리 알고 있는 경우에는 결과 확인에 영향을 줄 수 있다.
④ 추적관찰 누락으로 선택 비뚤림이 개입될 수 있다.


암 역학 연구에 있어서 코호트 연구는 일반적으로 오랜 기간 많은 수의 대상자를 추적-관찰하게 된다. 따라서 매우 많은 비용이 소요되며 긴 시간이 소요되는 경향이 있다. 따라서 연구에 소요되는 비용을 줄이기 위한 다양한 방법이 강구되어야 한다.

① 후향적으로 적절한 연구대상을 선정하고 노출에 대한 정보를 얻되 기존의 자료나 생체시료를 이용한다 (후향적 코호트 연구).
② 사망자료나 암 등록자료와 같이 이용 가능한 조사체계를 추적-관찰하는데 이용한다.
③ 국가나 지역 인구의 질병 비율을 비노출군으로 삼아 비교한다.
④ 코호트 내 환자-대조군 연구를 수행한다.
 

'Statistics' 카테고리의 다른 글

Odd ratio란  (0) 2010.05.17
SPSS 분석 종류  (0) 2010.05.05
로지스틱 회귀분석  (0) 2010.03.22
Posted by moshima
2010. 5. 5. 16:25

1)이변량 상관계수는 두 변수간에 상관관계(선형성)를 보는 분석방법입니다.(두변수 모두 구간형 척도일때 활용합니다) 예를들어 키와몸무게의 상관관계(두자료 모두 구간형이죠?), 광고액과 매출액의 상관관계(이것도 구간형)등이요

 

2)회귀분석의 경우 앞서 말한 상관분석 결과 유의한 결과를 얻었다면(예를들어 광고액이 높으면 매출액도 높더라) 그중 독립변수라고 생각되는 것이 종속변수를 얼마나 설명할까를 수식으로 표현한 것입니다.

물론 기본적으로 종속변수가 구간형 자료일때 사용가능합니다. 하지만 로지스틱 회귀분석이라고

종속변수가 범주형일때 사용가능한 회귀분석도 있습니다

 

3)교차분석 자료가 아래 표와같이 범주형자료로서 교차표를 작성 가능할때 사용합니다.

위자료는 제가 방금 조작해서 만든거고요, 교차분석의 경우 직업과 선호교통수단이 어떤 연관관계가

있을까 하는 궁금증이 들때 사용합니다.

 

4)일표본T검정의 경우 한 변수의 모평균을 검정해 내는 것입니다.

예를들어 제가 고등학생 100명의 키를 가지고 있다면 이자료를 가지고 모집단(우리나라 전체 고등학생)의

키를 검정해보는 자료입니다. 물론 모든 T검정은 종속변수가 구간형일때 가능합니다.

 

5)독립표본T검정의 경우 일표본과는 달리 다 집단간의 평균차이가 존재하는지 검정합니다.

예를들어 남자,여자간에 키의 차이가 다를까? 학생과 직장인 사이에 토익점수에 차이가 있을까? 등등요

 

6)대응표본T검정의 경우 독립T검정처럼 두 집단간의 평균차이가 존재하는지 검정하는 것이지만,

종속적인 집단간의 비교라는 점이 다릅니다. 예를들어

학원다니기 전 1반 학생들의 영어 점수 VS 학원다닌 후 1반 학생들의 영어 점수

똑같은 사람인데 어떤 교육 전과 후 등의 차이를 검정할때 사용합니다. 독립은 남/여 등 아예 다른 집단이었죠?

 

7)일원배치분산분석은 독립T테스트의 연장선이라고 이해하시면 됩니다. 독립T테스트가 두 집단간의 평균차이를검정했다면 일원배치 분산분석의 경우 세개 이상집단의 평균차이를 검정할 때 사용합니다.

예를들어 미국인,한국인,일본인들의 키 차이.

 

8)카이제곱 검정은 동질성 검정과 독립성 검정 두가지로 나눠집니다. 독립성검정은 앞서 말씀드린 교차분석때

실시하는 것이고요, 동질성의 경우 비율이 같은지 검정하는 것입니다. 예를들어 우리나라가 이번 올림픽때

메달을 땄는데, 금,은,동 메달의 비율이 같을까?를 알아볼때 사용합니다~~

 

9)일표본 K-S검정은 분포모양을 알아볼때 사용합니다(별로 안쓰실 꺼에요)-구간형일때

 

10)독립2-표본비모수 검정 = 독립T검정의 비모수적 검정법

독립2-표본비모수 검정은 독립T검정과 같은 목적일때 사용하고요, 이걸 쓰는 이유는 모집단의 분포를

모르거나 정규분포가 아닐때, 또는 가지고있는 자료의 숫자가 너무 적을때 사용합니다. 일반적으로

중심극한정리에 의해 자료의 개수가 30이상이면 정규분포를 따르므로 30개 이하일때 이 검정을 사용하시면

됩니다.

 

11)독립K-표본 비모수 검정=일원배치분산분석(사용이유는 위와 동일)

 

12)대응 2-표본 비모수 검정=대응T테스트(사용이유는 위와 동일)

 

'Statistics' 카테고리의 다른 글

Odd ratio란  (0) 2010.05.17
코호트 연구란?  (0) 2010.05.17
로지스틱 회귀분석  (0) 2010.03.22
Posted by moshima
2010. 3. 22. 13:26

로지스틱 회귀분석이란, 종속변수가 0, 1의 값만을 가지고 있을 때 사용하는 분석입니다. 예를 들어, 일반회귀분석이 상정하는 종속변수라는 것은 1) 그 범위가 제한되어 있지 않으며, 2) 척도간의 거리가 등간이라는 것입니다. 그러나, 많은 사회현상들은 그러한 조건들을 만족시켜주지 못합니다.

 

예를 들어, 투표를 했다/안했다 라든지, 병이 나았다/안나았다 같은 이항반응 (binary response)들이 많은데, 이것들을 일반 회귀분석에 넣어서 사용하게 되면, 여러가지 문제점들이 발생하게 되지요. 그래서, 특별한 분석 테크닉이 필요로 하게 되는 것이고, 이 테크닉들을 일반적으로 이항반응 회귀분석(binary response regression)이라고 부릅니다. 로지스틱 회귀나 프로빗 회귀 같은 것들이 이에 해당되겠습니다.

 

구체적인 내용은 책을 보셔야 되겠습니다만, 기본 얼개만 간단히 적으면, 일단 직접적인 0과 1을 종속변수로 놓는 것이 아니라, 성공할 확률(즉 1이 될 확률) P를 상정합니다. 그리고, 로지스틱 분석에서는 이것의 승산비(odds ratio)인 P/(1-P)를 로그를 취해서 이것을 종속변수로 사용합니다. 물론 종속변수인 P는 직접적인 독립변수가 아니므로, 최대우도비분석 (Maximum Likelihood)을 가지고 계산을 하게 됩니다. 물론, 직접적으로 SPSS같은 팩키지를 돌릴 때, 이러한 모든 과정은 다 컴퓨터가 해 주고 우리는 답만 보게 되는 것이지요.

 

추가 질문을 하신 p-value는 그냥 간단하게 영가설(귀무가설)을 기각할 수 있는 확률을 말하는 것입니다. 따라서 그 값이 작으면 작을수록 우리의 연구가 영가설을 더 확신을 가지고 기각을 할 수 있다, 혹은 우리의 연구결과가 통계적으로 유의미하다 고 말할 수 있습니다.

'Statistics' 카테고리의 다른 글

Odd ratio란  (0) 2010.05.17
코호트 연구란?  (0) 2010.05.17
SPSS 분석 종류  (0) 2010.05.05
Posted by moshima