이상치1 [머신러닝] #2 머신러닝을 위한 데이터 전처리 // 특성공학, 결측값, 범주형 변수 처리 오늘은 머신러닝을 위한 데이터 전처리 이론을 학습하였다. 다음 시간에는 오늘 배운 것을 활용하여, 실습을 진행할 것이다.[Part 1] 데이터 전처리란?1. 데이터 전처리와 특성 공학(Feature Engineering)과적합과 편향을 방지할 수 있도록 데이터를 분석함에 있어서 가장 중요한 부분이다. - 데이터 전처리: 분석 결과/인사이트와 모델 성능에 직접적인 영향을 미치는 과정 - 특성 공학: 컴퓨터가 잘 이해할 수 있도록 변수들의 형태를 변형하거나 처리하는 과정 2. 데이터 정제 (Data Cleansing): 레코드 세트, 테이블, DB에서 손상되거나 부정확한 레코드를 감지 및 수정하는 프로세스 1) 특징· 데이터의 불완전성, 부정확성, 비연관 데이터를 교체, 수정 삭제 · Data Wrangli.. 2023. 9. 9. 이전 1 다음