일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- Neural Network
- 인공지능
- CNN
- AI
- 데이터분석
- 데이터크롤링
- 데이터처리
- CRISP-DM
- AWS 입문자를 위한 강의
- Convolution Neural Network
- learning_rate
- pandas
- MaxPooling2D
- OneHotEncoding
- Pooling Layer
- CIFAR-10
- 모델평가
- 크롤링
- 데이터
- 뉴스웨일
- CNN 실습
- fashion mnist
- 딥러닝
- 키워드 기반 뉴스 조회
- bias
- kt에이블스쿨
- NewsWhale
- plot_model
- explained AI
- 머신러닝
- Today
- Total
목록데이터분석 (4)
jjinyeok 성장일지

1. 개별 변수 분석하기 (단변량 분석) EDA & CDA를 통해 데이터를 분석하는 과정에서 개별 변수를 분석하는 과정을 정리한다. 개별적인 모든 변수들은 (feature와 target 모두) 숫자형 데이터와 범주형 데이터로 나눌 수 있다. 또한 데이터를 분석하는 방법으로 기초 통계량을 사용하는 방법과 그래프를 사용하는 방법이 있다. 따라서 방법은 다음과 같이 나눌 수 있다. 기초통계량 그래프 시각화 숫자형 데이터 mean median mode 4분위 수 ... 히스토그램 밀도함수 그래프 박스플롯 ... 범주형 데이터 범주형 빈도수 범주형 비율 ... barchart ... 2. 숫자형 데이터 단변량 기초통계량으로 분석하기 기초통계량이라는 것은 자료를 대표하는 값이다. 숫자형 데이터에서 기초통계량을 통해..

수 많은 데이터를 한 눈에 파악하는 방법은 그래프와 통계량이다. 그래프와 통계량을 통해 데이터를 분석하고 의미를 찾는 과정을 배웠고 이제 정리하고자 한다. 먼저 우리가 다루는 데이터는 비즈니스를 담고 있다. 따라서 그래프와 통계량을 통한 데이터 시각화 목적은 아름다운 그래프를 만드는 것이 아니라 비즈니스 인사이트를 한눈에 파악할 수 있도록 하는 것이다. 시각화는 데이터를 요약하기 때문에 데이터를 한 눈에 파악하기 쉽다는 장점이 있다. 그러나 요약은 관점에 따라 결과가 달라지고 정보의 손실이 발생한다는 것을 유의해두자. 1. matplotlib matplotlib의 pyplot은 파이썬에서 그래프를 그릴 때 기본이 되는 라이브러리이다. 강의에서는 matplotlib에 대해 오래 다루었고 실습 또한 많이 진..

지난 게시글에 이어 8월 1일부터 8월 2일까지 배운 데이터분석에서 중요한 라이브러리 중 하나인 pandas 라이브러리를 정리하고자 한다. 이전에 나는 pandas에 대해 드문드문 알고 있었지만 이번 강의를 통해 pandas에 대한 정리가 확실히 되었다. 1. 판다스의 구조 판다스는 데이터프레임(Dataframe)과 시리즈(Series)로 구성할 수 있다. 데이터프레임에서 열(정보)를 띄어낸 것이 시리즈이고 반대로 시리즈의 집합체가 데이터프레임이다. 먼저 데이터프레임을 살펴보도록 하자. 데이터프레임은 관계형 데이터베이스의 테이블 또는 엑셀 시트와 같은 2차원 구조 형태이다. 앞선 게시글의 분석할 수 있는 데이터의 모양과 같다. 먼저 행은 각각의 데이터 관측치를 의미한다. 각각의 행은 분석단위가 된다. 열..

에이블스쿨에서 세번째 수업으로 8월 1일부터 8월 2일까지 수업이 진행되었다. (두번째 수업이었던 수업은 크게 새롭거나 어려운 내용이 없어 정리하지 않았다.) 수업에서 인공지능 개발에 필수적인 numpy, pandas, matplotlib 라이브러리에 대해 공부하였다. 1. 데이터를 통한 문제 해결 AI 개발을 비롯하여 데이터를 통한 문제 해결의 큰 그림은 ¹⁾어떤 문제를 해결하기 위해 (Business Understanding) ²⁾어떤 데이터를 사용하고 (Data Understanding) ³⁾데이터를 어떻게 준비하여 (Data Preparation) ⁴⁾모델링하고 (Modeling) ⁵⁾평가하여 (Evaluation) ⁶⁾배포하는 (Deployment) 것이다. 2. 데이터 분류 과정 속 핵심은 데..