본문 바로가기

머신러닝2

[머신러닝] #2 머신러닝을 위한 데이터 전처리 // 특성공학, 결측값, 범주형 변수 처리 오늘은 머신러닝을 위한 데이터 전처리 이론을 학습하였다. 다음 시간에는 오늘 배운 것을 활용하여, 실습을 진행할 것이다.[Part 1] 데이터 전처리란?1. 데이터 전처리와 특성 공학(Feature Engineering)과적합과 편향을 방지할 수 있도록 데이터를 분석함에 있어서 가장 중요한 부분이다. - 데이터 전처리: 분석 결과/인사이트와 모델 성능에 직접적인 영향을 미치는 과정 - 특성 공학: 컴퓨터가 잘 이해할 수 있도록 변수들의 형태를 변형하거나 처리하는 과정 2. 데이터 정제 (Data Cleansing): 레코드 세트, 테이블, DB에서 손상되거나 부정확한 레코드를 감지 및 수정하는 프로세스 1) 특징· 데이터의 불완전성, 부정확성, 비연관 데이터를 교체, 수정 삭제 · Data Wrangli.. 2023. 9. 9.
[머신러닝]#1 머신러닝의 이해 // 데이터 종류, 스팸 필터, 머신러닝 특징 오늘은 주특기 과정 중에서도 머신러닝의 첫수업이다. 머신러닝에 대한 전체적인 개념과 이론에 대해 배운다. 1. 머신러닝의 개념 지능은 본능적이나 자동적으로 행동하는 대신에 생각하고 이해하여 행동하는 능력을 말한다. 즉, 인공지능에 접해봤을 때는 어떤 문제가 주어졌을 때, 합리적으로 사고하여 문제를 해결하는 능력이다. 머신러닝은 직역하면 '학습하는 기계'이다. 학습이란 반복적인 경험을 토대로 미지의 문제를 추론하고 틀린 것은 다시 연습하는 것이다. 예를 들어, 아기는 무엇이든 입어 넣어본다. 그러나 다양한 경험을 하면서 뽀죡하고 딱딱한 것은 입에 넣었을 때 아프기에 해서는 안되고, 달콤한 것은 맛있다는 사실 등을 깨닫게 된다. 그리고 이러한 학습을 기반으로 경험하지 않은 것도 판단이 가능하다. 초콜릿을 먹.. 2023. 9. 5.