파이썬 라이브러리를 활용한 머신러닝 정리(2)
* 이 글의 내용은 O'REILLY의 '파이썬 라이브러리를 활용한 머신러닝' 책을 기반으로 한다. 1. 결정 트리 복잡도 제어 (1) 사전 가지 치기 : 트리 생성을 중단 (2) 사후 가지 치기 : 트리를 만든 후 데이터 포인트가 적은 노드 삭제 혹은 병합 2. 결정 트리 깊이 제한 : max_depth 3. 특성 중요도 : 각 특성의 중요도 평가 (전체 합 1) 4. 외삽 : 훈련 데이터의 범위 밖의 포인트 5. 앙상블(ensemble) : 여러 머신러닝 모델을 연결하여 강력한 모델을 만드는 기법 앙상블 방법론 : 부스팅, 배깅 6. 배깅(Bootstrap aggregation):중복을 허용한 랜덤 샘플링으로 만든 훈련 세트를 사용하여 분류기를 각기 다르게 학습 대표적인 모델 (1)랜덤 포레스트(Ran..