8.3 군집분석의 특징과 적용상의 문제점
8.3 군집분석의 특징과 적용상의 문제점
8.3.1 군집분석의 장점
-
탐색적인 기법
- 대용량 데이터에 대한 탐색적 기법
- 내부구조에 대한 사전적인 정보 없이 의미 있는 자료구조를 찾아냄
- 이후의 여러가지 모형화(회귀분석, 의사결정나무, 신경망분석 등)을 위한 분석에 사용
-
다양한 형태의 데이터에 적용가능
- 개체들 간의 거리를 적절히 정의하면 거의 모든 형태의 데이터에 대하여 적용 가능
-
분석방법의 적용 용이성
- 사전 정보를 거의 요구하지 않으므로 적용이 쉬움
- 개체들 사이의 거리만이 분석에 필요한 입력자료
8.3.2 군집분석의 단점
-
가중치와 거리의 정의
- 가중치와 거리를 정의하는 것은 매우 어려운 일이다.(특히, 자료 유형이 다양한 경우)
-
초기 군집수의 설정
- 사전에 정의된 군집수 k가 적합하지 않으면 결과가 좋지 않다.
- 그러므로 여러 번의 탐색적인 군집분석의 절차가 이어져야 함.
-
결과해석의 어려움
- 사전에 주어진 목적이 없으므로 결과 해석이 어렵다.
군집분석은 대용량 데이터에 대해 데이터마이닝을 수행하기 위한 초기 작업으로서 복잡한 데이터를 요약
History
Last edited on 06/18/2008 16:31 by tadoli
Comments (0)