목록머신러닝 (12)
hyeori
| 분류 규칙 이해 분류 규칙(Classification rules) 클래스를 레이블이 없는 예시에 할당하는 논리적인 if-else문 형태로 지식을 표현한다. 조건부(antecedent) 와 결론부(consequent)를 명시한다. 가지의 결정에 따라 적용되는 트리와 달리 규칙은 독립된 사실을 서술한 것처럼 읽을 수 있는 명제다. 규칙 학습자는 일반적으로 특징이 주로 또는 전체적을 명목형인 문제에 적용된다. 희고한 사건이 특징 값 사이에 매우 특정한 상호작용에서 발생하더라도 규칙 학습자는 희소 사건을 잘 식별한다. | 분리 정복 분류 규칙 알고리즘은 분리 정복(separate and conquer)으로 알려진 휴리스틱을 활용한다. 규칙이 추가되면서 데이터의 부분집합도 추가적으로 분리되고, 전체..
단순한 선택 과정을 거쳐 복잡한 결정을 한다. | 의사 결정 트리의 이해 * 루트노드 (root node) * 결정 노드 (decision node) * 분기 (branches) * 잎 노드 (terminal node, leaf node, 일련의 결정이 이뤄진 결과로 수행할 액션 나타냄) 장점) 사람이 읽을 수 있는 형식 어떻게, 왜 특정 작업에 잘 작동하는지 혹은 잘 작동하지 않는지에 대한 통찰력 제공 결정이 많아질 경우 복잡해지며, 의사 결정 트리가 데이터에 과적합되는 경향 갖게 됨 | 분할 정복 재귀분할(recursiving) 이라고 불리는 휴리스틱 사용 → 분할 정복(divide and conquer) 처음에 루트노드는 분할이 일어나지 않았기 때문에 전체 데이터 셋을 표현하고 있..
| 머신러닝의 기원 데이터를 지능적인 행동으로 변환하는 컴퓨터 알고리즘의 개발에 관심을 갖는 연구 분야를 머신러닝 이라고 한다. 머신러닝과 밀접하게 관련된 주제인 데이터 마이닝은 커다란 데이터베이스에서 새로운 통찰력을 얻는 것과 관련돼 있다. 데이터 마이닝은 실행 가능한 지능 덩어리를 체계적으로 추적한다. 머신러닝이 문제를 해결하고자 컴퓨터에게 데이터의 사용법을 가르치는 데 집중하는 반면, 데이터 마이닝은 문제를 해결하고자 컴퓨터에게 사람이 사용할 패턴을 찾도록 가르치는데 집중한다. | 머신러닝의 사용과 남용 대용량 데이터 베이스에서 감지하기 힘든 패턴을 찾는 것은 사람보다 컴퓨터가 더 적합할지 몰라도 분석에 동기를 부여하고 결과를 의미있는 실해으로 전환하려면 아직까지는 사람이 필요하다. 요즘 머..