데이터 마이닝(Data Mining) 개요

Posted by

데이터 마이닝이란?

데이터 마이닝

많은 데이터 가운데 숨겨져 있는 유용한 상관관계를 발견하여 미래에 실행 가능한 정보를 추출해 내고 의사 결정에 이용하는 과정을 말한다.

두산백과

데이터 마이닝(Data Mining)은 용어 자체로 마이닝의 핵심이 되는 모든 구성 요소를 정확히 표현하지 못한다.

그래서 많은 사람들은 데이터로부터 지식 발견(KDD, Knowledge Discovery from Data)라는 용어를 사용하기도 한다.

의미가 명확하게 전달되는 용어는 KDD이지만, 여기서는 이미 많은 사람들이 사용하고, 두산백과와 마찬가지로 의미가 굳어진 데이터 마이닝이라는 용어로 통일하여 앞으로 사용하도록 하겠다.

데이터 마이닝 과정

이러한 데이터 마이닝은 아래와 같이 여러 단계들을 순서대로 반복하는 과정이다.

[그림] Data Mining Process
  1. 데이터 정제: 노이즈와 일치하지 않는 데이터의 제거
  2. 데이터 통합: 다양한 데이터 소스 결합
  3. 데이터 선택: 분석 작업과 관련된 데이터를 데이터베이스에서 가져옴
  4. 데이터 변환: 데이터 요약 또는 집계 작업을 수행하여 마이닝 분석에 적합한 형태로
    변환하고 통합
  5. 데이터 마이닝: 데이터 패턴을 추출하기 의한 지능적 분석 방법 적용
  6. 패턴 평가: 관심도에 근거하여 해당 지식을 나타내는 패턴을 식별
  7. 지식 프리젠테이션: 마이닝한 지식을 사용자에게 제시하기 위해 시각화와
    지식 표현 기술을 활용

지아웨이 한, 미셸린 캠버, 지안 페이 (2015), 데이터 마이닝 개념과 기법, 에이콘 출판

Leave a Reply

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다