4.2 로지스틱 회귀분석(Logistic Regression Analysis)
4.2 로지스틱 회귀분석(Logistic Regression Analysis)
- 목표변수가 이항형 또는 다항형인 경우 사용
4.2.1 로지스틱 단순 회귀모형
-
y가 이항형일 경우(y=0 또는 1) 단순선형 회귀식 사용의 문제
-
y= 0.1 + 0.01x 인 경우
- x = 1000 이라면, y = 10.1로 범위를 벗어남.
- y에 대한 확률분포가 이항변수를 가지는 베르누이 분포에 의해 모형화되지 않고, 흔히 정규분포로 모형화 됨.
-
-
로짓변환(logit transformation)
- ln(P(y=1|x)/(1-P(y=1|x)) = α + βx
4.2.2 로지스틱 회귀분석
-
다중 로지스틱 회귀분석
- ln(P(y=1|x1, ... , xp)/(1-P(y=1|x1, ... , xp)) = α + β1x1 + ... + βpxp
- 판별분석과 비교하여 로지스틱 판별분석(logistic discrimination)이라고도 함.
-
오즈비(Odds Ratio)
-
Odds Ratio = exp[α + β1x1 + ... + βi(xi + 1) + ... βpxp] / exp[α + β1x1 + ... + βi(xi) + ... βpxp] = exp(βi)
- Odds Ratio가 1보다 작으면(βi < 0) 입력변수 xi가 감소방향으로 영향을 미침
- Odds Ratio가 1보다 크면(βi > 0) 증가방향으로 영향을 미침
-
History
Last edited on 08/18/2008 17:22 by tadoli
Comments (0)