티스토리 뷰

파이썬의 기초 문법 정도만 알고 숙달되지 않은 나 같은 초보 개발자에게 파이썬을 이용해 데이터를 처리하여 비즈니스 지원하는 방법을 제시한 도서이다. 기초적일 내용부터 고급 활용까지 세세하고 쉽게 설명하고 있으며 특히 컬러 그림을 활용하고 있어 더욱 이해하기 용이한 것 같다. 데이터 과학 분야에서 많이 사용되고 있는 파이썬 라이브러리를 제시하고 사용법을 친절하게 설명하고 있어 초보자들에게 더욱 유용하다.

빅데이터 시대, 왜 데이터 과학인가?데이터를 분석해 의미를 찾는 것이 중요하다! 모두의 데이터 과학 with 파이썬 은 초보자와 비전공자가 배울 수 있게 최대한 전문 용어와 복잡한 수학을 사용하지 않고 설명한다. 먼저 데이터 과학의 개념을 알아보고, 데이터 과학에서 주로 사용하는 파이썬의 핵심 내용을 살펴본다. 또한 HTML, CSV, JSON 파일, 수치형 및 테이블형 데이터를 Beautiful Soup, NLTK, NumPy, Pandas를 사용해 분석하고 그래프를 만들어 보면서 실제로 데이터를 어떻게 다루고 활용할 수 있는지 이해할 수 있다. 데이터 과학이 처음이라면 고민하지 말고 시작해 보자!

[목차]

1장 데이터 과학이란?
UNIT 01 데이터 분석 과정
UNIT 02 데이터 수집 파이프라인
UNIT 03 보고서 구조
해보자

2장 데이터 과학에서 파이썬의 핵심 알기
UNIT 04 기본 문자열 함수 이해하기
UNIT 05 올바른 자료구조 선택하기
UNIT 06 리스트 내포로 리스트 이해하기
UNIT 07 카운터로 세기
UNIT 08 파일 다루기
UNIT 09 웹에 접근하기
UNIT 10 정규 표현식으로 패턴 매칭하기
UNIT 11 파일과 기타 스트링 다루기
UNIT 12 pickle로 데이터 압축하기
해보자

3장 텍스트 데이터 다루기
UNIT 13 HTML 파일 처리하기
UNIT 14 CSV 파일 다루기
UNIT 15 JSON 파일 읽기
UNIT 16 자연어 처리하기
해보자

4장 데이터베이스 다루기
UNIT 17 MySQL 데이터베이스 설정하기
UNIT 18 MySQL 사용하기 : 명령줄
UNIT 19 MySQL 사용하기 : pymysql
UNIT 20 문서 다루기 : MongoDB
해보자

5장 테이블형 수치 데이터 다루기
UNIT 21 배열 만들기
UNIT 22 행열 전환과 형태 변형하기
UNIT 23 인덱싱과 자르기
UNIT 24 브로드캐스팅
UNIT 25 유니버셜 함수 파헤치기
UNIT 26 조건부 함수 이해하기
UNIT 27 배열 집계와 정렬하기
UNIT 28 배열을 셋처럼 다루기
UNIT 29 배열 저장하고 읽기
UNIT 30 합성 사인파 만들기
해보자

6장 데이터 시리즈와 프레임 다루기
UNIT 31 Pandas 데이터 구조에 익숙해지기
UNIT 32 데이터 모양 바꾸기
UNIT 33 데이터 누락 다루기
UNIT 34 데이터 합치기
UNIT 35 데이터 정렬하기
UNIT 36 데이터 변환하기
UNIT 37 Pandas 파일 입출력 다루기
해보자

7장 네트워크 데이터 다루기
UNIT 38 그래프 분해하기
UNIT 39 네트워크 분석 순서
UNIT 40 NetworkX 사용하기
해보자

8장 플로팅하기
UNIT 41 pyplot으로 기본 플롯 그리기
UNIT 42 다른 플롯 타입 알아보기
UNIT 43 플롯 꾸미기
UNIT 44 Pandas로 플롯 그리기
해보자

9장 확률과 통계
UNIT 45 확률 분포 다시 보기
UNIT 46 통계 방법론 다시 보기
UNIT 47 파이썬으로 통계 분석하기
해보자

10장 머신 러닝
UNIT 48 예측 실험 디자인하기
UNIT 49 회귀 직선 적합하기
UNIT 50 K-평균 클러스터링으로 데이터 묶기
UNIT 51 랜덤 포레스트에서 살아남기
해보자

부록 A 더 읽어 보기
부록 B 별 1개짜리 연습문제 해답 보기
부록 C 실습 환경 설정하기
참고문헌