일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- kt에이블스쿨
- 데이터크롤링
- CRISP-DM
- explained AI
- 크롤링
- 인공지능
- 키워드 기반 뉴스 조회
- CNN
- 데이터처리
- Pooling Layer
- OneHotEncoding
- 모델평가
- Convolution Neural Network
- plot_model
- fashion mnist
- bias
- 딥러닝
- Neural Network
- 데이터
- 뉴스웨일
- learning_rate
- AI
- CIFAR-10
- NewsWhale
- MaxPooling2D
- AWS 입문자를 위한 강의
- 머신러닝
- 데이터분석
- pandas
- CNN 실습
- Today
- Total
목록데이터처리 (2)
jjinyeok 성장일지

앞선 강의는 데이터를 정리하고 이해하는 과정이었다. 이번 과정은 모델링을 위한 데이터 전처리에 관한 과정이다. 1. 전처리가 필요한 이유는? 모델링을 위해 데이터는 필수적인 요건 2가지와 선택적인 요건 1가지를 지닌다. 모든 셀은 값이 있어야 한다. 모든 셀의 값은 숫자여야 한다. (필요에 따라) 숫자의 범위가 일치해야 한다. 따라서 우리는 NaN 조치 가변수화 (필요에 따라) 스케일링 위 3가지 전처리 방법을 통해 하나의 잘 정리 정제된 데이터프레임을 만들어야 한다. 2. NaN 조치 NaN이란 Not a Number 즉 빈 값이라는 의미이다. 모델링 과정에서 NaN은 존재하면 안되기 때문에 중요해서 버릴 수 없는 데이터라면 반드시 데이터 처리 과정에서 NaN에 대한 조치를 취해주어야 한다. NaN을 ..

아직 모델링 과정보다 데이터 처리와 데이터 분석에 중점으로 수업이 진행되고 있는데 8월 8일부터 9일까지는 데이터 처리에 대한 강의가 진행되었다. 멋쟁이사자처럼 해커톤을 준비하며 조금씩 밀렸지만 연휴를 기점으로 다시 정리하는 시간을 가져보고자 한다. 1. CRISP-DM CRISP-DM은 Cross-industry standard process for data mining의 준말로 전 세계에서 가장 많이 사용되는 데이터 마이닝 표준 방법론이라고 한다. 에이블스쿨에서 가장 많이 본 그림이자 많이 볼 그림이 될 것 같다. CRISP-DM에 대해서는 8월 10일에 더 진하게 다루었었기 때문에 8월 10일차 강의를 정리할 때 다시 정리하도록 하겠다. 이번 강의의 목표는 CRISP-DM에서 Data Prepara..