본문 바로가기
Book/IT

머신러닝 기초] 파이썬 라이브러리를 활용한 머신러닝 기초 목차

by KyoD 2021. 6. 30.
반응형

* 파이썬 라이브러리를 활용한 머신러닝 기초 

초반 설명 정리

 

http://www.kyobobook.co.kr/product/detailViewKor.laf?ejkGb=KOR&mallGb=KOR&barcode=9791162241646&orderClick=LEa&Kc= 

 

파이썬 라이브러리를 활용한 머신러닝 - 교보문고

사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서 | 실제 문제에 대한 해법을 찾는 머신러닝 기술자를 위한 본격 머신러닝 입문서 사이킷런 최신 버전을 반영한 풀컬러 번역개정판 이

www.kyobobook.co.kr

 

※ 홍익대학교 빅데이터 인재 양성과정 머신러닝 수업을 기반으로 작성

 

 

파이썬 라이브러리를 활용한 머신러닝 기초.md
0.01MB

1장. 
머신러닝과 머신러닝 애플리케이션의 기초개념을 소개 및 사용환경 
1_1 왜 머신러닝인가?
1_2 왜 파이썬인가?
필수 라이브러리 도구들
주피터 노트북
Numpy
SciPy
matplotlib
pandas
mglearn
1_3 scikit-learn
1_4 파이썬 2 vs 파이썬3
1_5 이 책에서 사용하는 소프트웨어 버전
1_6 첫 번째 애플리케이션: 붓꽃의 품종 분류
1_6_1 데이터 적재 
1_6_2 성과측정: 
훈련데이터와 테스트 데이터
1_6_3 가장 먼저 할일:
데이터 살펴보기
1_6_4 첫 번째 머신러닝 모델:
K-최근접 이웃 알고리즘
1_6_5 예측하기
1_6_6 모델 평가하기
1_7 요약 및 정리

2장. 
지도 학습 알고리즘
2_1 분류와 회귀
2_2 일반화, 과대적합, 과소적합
모델 적합도와 데이터셋 크기의 관계
2_3 지도 학습 알고리즘
2_3_1 예제에 사용할 데이터셋
2_3_2 K-최근접 이웃
2_3_3 선형모델
2_3_4 나이브 베이즈 분류기
2_3_5 결정 트리
2_3_6 결정 트리의 앙상블
2_3_7 베깅, 엑스트라 트리, 에이다 부스트
2_3_8 커널 서포트 벡터 머신
2_3_9 신경망
2_4 분류 예측의 불확실성 추정
2_4_1 결정함수
2_4_2 예측 확률
2_4_3 다중 분류에서의 불확실성
2_5 요약 및 정리

3장.
비지도 학습 알고리즘
3_1 비지도 학습의 종류
3_2 비지도 학습의 도전 과제
3_3 데이터 전처리와 스케일 조정
3_3_1 여러가지 전처리 방법
3_3_2 데이터 변환 적용하기
3_3_3 Quantile Transformer와 Power Transformer
3_3_4 훈련 데이터와 테스트 데이터의 스케일을 같은 방법으로 조정하기
3_3_5 지도 학습에서 데이터 전처리 효과
3_4 차원 축소, 특성 추출, 매니폴드 학습
3_4_1 주성분 분석(PCA)
3_4_2 비음수 행렬 분해(NMF)
3_4_3 t-SNE를 이용한 매니폴드 학습
3_5 군집
3_5_1 K-평균 군집
3_5_2 병합군집
3_5_3 DBSCAN
3_5_4 군집 알고리즘의 비교와 평가
3_5_5 군집 알고리즘 요약
3_6 요약 및 정리

4장.
머신러닝에서 데이터를 표현하는 방법
4.1 범주형 변수
4.1.1 원-핫-인코딩(가변수)
4.1.2 숫자로 표현된 범주형 특성
4.2 OneHotEncoder와 ColumnTransformer: scikit-learn으로 범주형 변수 다루기
4.3 make_column_transformer로 간편하게 ColumnTransformer 만들기
4.4 구간 분할, 이산화 그리고 선형 모델, 트리 모델
4.5 상호작용과 다항식
4.6 일변량 비선형 변환
4.7 특성 자동 선택
4.7.1 일변량 통계
4.7.2 모델 기반 특성 선택
4.7.3 반복적 특성 선택
4.8 전문가 지식 활용
4.9 요약 및 정리

5장.
모델 평가와 매개변수 튜닝을 위한 교차 검증과 그리드 서치
5.1 교차 검증
5.1.1 scikit-learn의 교차 검증
5.1.2 교차 검증의 장점
5.1.3 계층별 k-겹 교차 검증과 그외 전략들
5.1.4 (한국어판 부록) 반복 교차 검증
5.2 그리드 서치
5.2.1 간단한 그리드 서치
5.2.2 매개변수 과대적합과 검증 세트
5.2.3 교차 검증을 사용한 그리드 서치
5.3 평가 지표와 측정
5.3.1 최종 목표를 기억하라
5.3.2 이진 분류의 평가 지표
5.3.3 다중 분류의 평가 지표
5.3.4 회귀의 평가 지표
5.3.5 모델 선택에서 평가 지표 사용하기
5.4 요약 및 정리

6장.
모델을 연결하고 워크플로를 캡슐화하는 파이프라인 개념
6.1 데이터 전처리와 매개변수 선택
6.2 파이프라인 구축하기
6.3 그리드 서치에 파이프라인 적용하기
6.4 파이프라인 인터페이스
6.4.1 make_pipleline을 사용한 파이프라인 생성
6.4.2 단계 속성에 접근하기
6.4.3 그리드 서치 안의 파이프라인 속성에 접근하기
6.5 전처리와 모델의 매개변수를 위한 그리드 서치
6.6 모델 선택을 위한 그리드 서치
6.6.1 중복 계산 피하기
6.7 요약 및 정리

7장.
텍스트 데이터에 적용하는 방법과 텍스트에 특화된 처리 기법
7.1 문자열 데이터 타입
7.2 예제 애플리케이션: 영화 리뷰 감성 분석
7.3 텍스트 데이터를 BOW로 표현하기
7.3.1 샘플 데이터에 BOW 적용하기
7.3.2 영화 리뷰에 대한 BOW
7.4 불용어
7.5 tf?idf로 데이터 스케일 변경하기
7.6 모델 계수 조사
7.7 여러 단어로 만든 BOW(n-그램)
7.8 고급 토큰화, 어간 추출, 표제어 추출
7.8.1 (한국어판 부록) KoNLPy를 사용한 영화 리뷰 분석
7.9 토픽 모델링과 문서 군집화
7.9.1 LDA
7.10 요약 및 정리

8장.
개괄적인 정리와 어려운 주제에 대한 참고 자료 안내
8.1 머신러닝 문제 접근 방법
8.1.1 의사 결정 참여
8.2 프로토타입에서 제품까지
8.3 제품 시스템 테스트
8.4 나만의 추정기 만들기
8.5 더 배울 것들
8.5.1 이론
8.5.2 다른 머신러닝 프레임워크와 패키지
8.5.3 랭킹, 추천 시스템과 그 외 다른 알고리즘
8.5.4 확률 모델링, 추론, 확률적 프로그래밍
8.5.5 신경망
8.5.6 대규모 데이터셋으로 확장
8.5.7 실력 기르기
8.6 마치며

반응형