Label Encoding
Cori
개요Label Encoding이 무엇인지, 어떻게 사용되는지에 대해 알아본다. 내용 정리0. 범주형 데이터 -> scikit-learn의 머신러닝 API들은 Feature나 Label의 값들이 숫자 (정수 / 실수)인 것만 처리할 수 있기 때문에, 문자열일 경우 숫자형으로 변환하여 처리해야 한다. * 범주형이 아닌 단순 문자열인 경우, 일반적으로 제거함 1. 레이블 인코딩 (Label Encoding)0) 정의-> 문자열(범주형) 값을 오름차 순으로 정렬 후 0부터 1씩 증가하는 값으로 변환한다. 숫자의 차이가 모델에 영향을 주지 않는 트리 계열 모델(의사결정나무, 랜덤포레스트)에 적용하며,숫자의 차이가 모델에 영향을 미치는 선형 계열 모델 (로지스틱회귀, SVM, 신경망)에는 사용할 수 없다. 1..