3.1 의사결정나무의 개념
3.1 의사결정나무의 개념
- 탐색과 모형화라는 두가지 특성 소유
- 모수적 모형(판별분석, 회귀분석)을 분석 전에 이상치(outlier)와 분석에 필요한 변수 또는 모형에 포함되어야 할 상호작용의 효과를 검색
- 그 자체로 분류 또는 예측모형으로 사용
-
의사결정규칙(decision rule)을 나무구조로 도표화하여 분류(classification)와 예측(prediction) 수행
- 나무구조에 의한 추론규칙(induction rule)에 의해 표현되므로, 과정을 쉽게 이해하고 설명 가능
3.1.1 의사결정나무의 구성요소
- Root Node: 나무구조가 시작되는 node. 분석대상이 되는 전체 자료로 이루어짐.
- Child Node: 하나의 node로부터 분리된 2개 이상의 마디들을 의미.
- Parent Node: 자식node의 상위node.
-
Terminal Node(잎, leaf): 각 나무줄기 끝에 위치하고 있는 Node.
- 분류규칙의 수 = Terminal Node의 수
- Internal Node: Root Node와 Terminal Node를 제외한 Node.
- Branch: 한 Node로부터 끝마디까지 연결된 일련의 Node, 가지를 이루는 Node의 수를 Depth라고 한다.
3.1.2 의사결정나무의 형성과정
-
알고리즘
- CHAID(Kass, 1980)
- CART(Breiman et al., 1984)
- C4.5(Quinlan, 1993)
-
의사결정나무분석 단계
-
의사결정나무의 형성
- 적절한 분리기준(split criterion), 정지규칙(stopping rule)을 지정
-
가지치기
- 분류오류(classification error)를 크게 할 위험(risk)이 높거나 부적절한 추론규칙(induction rule)을 가지는 branch 제거
-
타당성 평가
- 이익도표(gains chart)나 위험도표(risk chart)와 같은 모형평가 도구 이용
- test data 에 의한 교차타당성(cross validation) 이용
-
해석 및 예측
- 의사결정나무를 해석하고 예측모형을 구축
-
History
Last edited on 07/31/2008 10:52 by tadoli
Comments (0)