Header

  1. View current page

    tadoli님의 노트

Profile_img_60x60_01
3

3.1 의사결정나무의 개념

3.1 의사결정나무의 개념

  • 탐색과 모형화라는 두가지 특성 소유
  • 모수적 모형(판별분석, 회귀분석)을 분석 전에 이상치(outlier)분석에 필요한 변수 또는 모형에 포함되어야 할 상호작용의 효과를 검색
  • 그 자체로 분류 또는 예측모형으로 사용
  • 의사결정규칙(decision rule)을 나무구조로 도표화하여 분류(classification)와 예측(prediction) 수행

    • 나무구조에 의한 추론규칙(induction rule)에 의해 표현되므로, 과정을 쉽게 이해하고 설명 가능

 

3.1.1 의사결정나무의 구성요소

  • Root Node: 나무구조가 시작되는 node. 분석대상이 되는 전체 자료로 이루어짐.
  • Child Node: 하나의 node로부터 분리된 2개 이상의 마디들을 의미.
  • Parent Node: 자식node의 상위node.
  • Terminal Node(잎, leaf): 각 나무줄기 끝에 위치하고 있는 Node.

    • 분류규칙의 수 = Terminal Node의 수
  • Internal Node: Root Node와 Terminal Node를 제외한 Node.
  • Branch: 한 Node로부터 끝마디까지 연결된 일련의 Node, 가지를 이루는 Node의 수를 Depth라고 한다.

 

3.1.2 의사결정나무의 형성과정

  • 알고리즘

    • CHAID(Kass, 1980)
    • CART(Breiman et al., 1984)
    • C4.5(Quinlan, 1993)
  • 의사결정나무분석 단계

    • 의사결정나무의 형성

      • 적절한 분리기준(split criterion),  정지규칙(stopping rule)을 지정
    • 가지치기

      • 분류오류(classification error)를 크게 할 위험(risk)이 높거나 부적절한 추론규칙(induction rule)을 가지는 branch 제거
    • 타당성 평가

      • 이익도표(gains chart)나 위험도표(risk chart)와 같은 모형평가 도구 이용
      • test data 에 의한 교차타당성(cross validation) 이용
    • 해석 및 예측

      • 의사결정나무를 해석하고 예측모형을 구축

 

History

Last edited on 07/31/2008 10:52 by tadoli

Comments (0)

You must log in to leave a comment. Please sign in.