본문으둜 κ±΄λ„ˆλ›°κΈ°

πŸ“– 파이썬 λ¨Έμ‹ λŸ¬λ‹ νŒλ‹€μŠ€ 데이터 뢄석

Chanho Lee

Book Info​

팁

μ±… 이미지λ₯Ό ν΄λ¦­ν•˜λ©΄ ꡐ보문고 μ‚¬μ΄νŠΈλ‘œ μ΄λ™ν•©λ‹ˆλ‹€!

μ±…

  • 제λͺ©: 파이썬 λ¨Έμ‹ λŸ¬λ‹ νŒλ‹€μŠ€ 데이터 뢄석
  • μ €μž: μ˜€μŠΉν™˜
  • μΆœνŒμ‚¬: 정보문화사
  • μΆœκ°„: 2019-06-15

μ±… 리뷰​

μ™œ νŒλ§€λŸ‰μ΄ λ§Žμ€κ°€?​

μ „ 주둜 μ–΄λ–€ 책을 μ½κ±°λ‚˜ μ‚΄ λ•Œ κ·Έ μ±…μ˜ νŒλ§€λŸ‰μ„ μ°Έκ³ ν•©λ‹ˆλ‹€. κ΅λ³΄λ¬Έκ³ μ—μ„œμ˜ νŒλ§€λŸ‰μ€ λ‹€λ₯Έ 책이 더 λ§Žμ€ 거둜 μ •λ ¬λμ§€λ§Œ, yes24μ—μ„œλŠ” νŒλ§€μ§€μˆ˜κ°€ 10,524둜 νŒλ‹€μŠ€λΌκ³  κ²€μƒ‰ν–ˆμ„ λ•Œ κ°€μž₯ λ†’μ•˜μŠ΅λ‹ˆλ‹€. μ •λ³΄λ¬Έν™”μ‚¬λΌλŠ” μΆœνŒμ‚¬λŠ” μ œκ°€ 이 책을 ν¬ν•¨ν•˜μ—¬ 두 번째둜 μ½μ–΄λ΄…λ‹ˆλ‹€. 자주 보지 λͺ»ν•œ μΆœνŒμ‚¬μ§€λ§Œ νŒλ§€λŸ‰μ΄ λ§Žλ‹€λŠ” μ μ—μ„œ 이 책이 λ„ˆλ¬΄ κΆκΈˆν–ˆμŠ΅λ‹ˆλ‹€.

μ „ pandasλ₯Ό ν•„μš”ν•  λ•Œλ§ˆλ‹€ κ³΅μ‹λ¬Έμ„œλ₯Ό λ³΄κ±°λ‚˜ μœ νŠœλΈŒμ—μ„œ κ°•μ˜λ₯Ό μ°Ύμ•„λ³΄λ©΄μ„œ κ³΅λΆ€ν•œ μΌ€μ΄μŠ€μž…λ‹ˆλ‹€. 막 띄엄띄엄 κ³΅λΆ€ν•˜λ‹€ λ³΄λ‹ˆκΉŒ pandasλ₯Ό μ±…μœΌλ‘œ ν•œ 번 μ œλŒ€λ‘œ 곡뢀해보고 μ‹Άμ—ˆμŠ΅λ‹ˆλ‹€. 마침 이 책이 pandas, matplotlib, seaborn λ“± λ‹€μ–‘ν•œ 라이브러리λ₯Ό μ•Œλ €μ£ΌλŠ” 것 κ°™μ•„μ„œ μ„ νƒν–ˆμŠ΅λ‹ˆλ‹€. 이 μ±… 말고도 데이터 μ‚¬μ΄μ–ΈμŠ€ 슀쿨, 파이썬 라이브러리λ₯Ό ν™œμš©ν•œ 데이터 뢄석 λ“±μ˜ 쒋은 책듀도 μžˆμŠ΅λ‹ˆλ‹€. λ‹€λ₯Έ 책듀도 λ‚˜μ€‘μ— 읽어볼 μ˜ˆμ •μž…λ‹ˆλ‹€.

μ˜ˆμ œκ°€ λ§Žμ€ 책​

μ˜ˆμ œκ°€ κ½€ λ§Žλ‹€κ³  느꼈으며 그렇기에 μ΄ˆλ³΄μžλ“€μ΄ κ³΅λΆ€ν•˜λŠ”λ° 크게 어렀움이 없을 것이라고 μƒκ°ν•©λ‹ˆλ‹€. μ˜ˆμ œμ—μ„œ μ’€ μ•„μ‰¬μ› λ˜ 점은 Jupyter Notebook으둜 μ‹€μŠ΅ν•˜λŠ” ν™˜κ²½μœΌλ‘œ μž‘μ„±λœ 것이 μ•„λ‹ˆκ³  일반적인 Python νŒŒμΌμ΄μ—ˆλ‹€λŠ” μ μž…λ‹ˆλ‹€. λ¬Όλ‘  PythonμœΌλ‘œλ„ λŒμ•„κ°€κ² μ§€λ§Œ 'Jupyter Notebook ν˜•μ‹μœΌλ‘œ ν•˜λ‚˜ν•˜λ‚˜ 보여쀬닀면 μ–΄λ• μ„κΉŒ'λΌλŠ” 아쉬움이 λ‚¨μŠ΅λ‹ˆλ‹€.

μ‹œκ°ν™” λΌμ΄λΈŒλŸ¬λ¦¬β€‹

matplotlib, seaborn을 μ˜€λžœλ§Œμ— λ‹€μ‹œ λ³΅μŠ΅ν•  수 μžˆλ‹€λŠ” 점이 μ’‹μ•˜μŠ΅λ‹ˆλ‹€. λ˜ν•œ, Folium 라이브러리λ₯Ό μ‚¬μš©ν•˜μ—¬ 지도λ₯Ό μ‹œκ°ν™”ν•œλ‹€λŠ” 것도 μž¬λ°Œμ—ˆμŠ΅λ‹ˆλ‹€. 데이터λ₯Ό λΆ„μ„ν•˜λŠ” κ³Όμ •μ΄λ‚˜ λ¨Έμ‹ λŸ¬λ‹ λͺ¨λΈμ„ λ§Œλ“€ λ•Œ μ–΄λ–»κ²Œ ν™œμš©ν• μ§€ μ•Œλ €μ€λ‹ˆλ‹€.

λ¨Έμ‹ λŸ¬λ‹ 맛보기​

λ¨Έμ‹ λŸ¬λ‹ λͺ¨λΈμ„ λ§Œλ“€μ–΄λ³΄λŠ” 과정을 λ³΄μ—¬μ€λ‹ˆλ‹€. λͺ¨λΈμ„ 직접 λ§Œλ“œλŠ” κ³Όμ •μ—μ„œ pandasκ°€ μ–΄λ–»κ²Œ 쓰이고 λ‹€λ₯Έ μ‹œκ°ν™” λΌμ΄λΈŒλŸ¬λ¦¬λ“€μ΄ μ–΄λ–»κ²Œ μ“°μ΄λŠ” 지 λ³΄μ—¬μ£ΌλŠ” 것은 맀우 μ’‹μ•˜μœΌλ‚˜, μ•„μ‰¬μ› λ˜ 점은 λ¨Έμ‹ λŸ¬λ‹ λΆ€λΆ„μœΌλ‘œ λ“€μ–΄κ°€κ³  심화적인 λΆ€λΆ„μœΌλ‘œ λ“€μ–΄κ°€μ„œ κ·ΈλŸ°μ§€ 세뢀적인 μ„€λͺ…은 μƒλž΅λ˜μ–΄ μžˆμŠ΅λ‹ˆλ‹€. 차라리 KNN, SVM 같은 μ–΄λ €μš΄ μ•Œκ³ λ¦¬μ¦˜μ€ μ œμ™Έν•˜κ³  μ‰¬μš΄ μ•Œκ³ λ¦¬μ¦˜μœΌλ‘œ λ§Œλ“€μ–΄μ§„ ML λͺ¨λΈμ„ λ§Œλ“€μ–΄λ³΄λŠ” 과정을 μ†Œκ°œν–ˆλ‹€λ©΄ 처음 κ³΅λΆ€ν•˜μ‹œλŠ” λΆ„λ“€μ—κ²Œ μ½λŠ”λ° 더 νŽΈν–ˆμ„ 것이라 μƒκ°ν•©λ‹ˆλ‹€.

λŒ€μƒλ…μžβ€‹

νŒŒμ΄μ¬μ„ κ³΅λΆ€ν•œ ν›„ 데이터 뢄석을 해보고 싢은데 뭘 곡뢀해야 ν•  지 감이 μ•ˆ μž‘νžˆλŠ” μ‚¬λžŒμ—κ²Œ μΆ”μ²œλ“œλ¦½λ‹ˆλ‹€. 이 책은 392 νŽ˜μ΄μ§€λ‘œ λ‹€λ₯Έ 데이터 뢄석 μ±…λ“€κ³Ό λΉ„κ΅ν•˜λ©΄ 뢀담이 덜 ν•œ μ±…μž…λ‹ˆλ‹€. pandas만 κ³΅λΆ€ν•˜λŠ” 책은 μ•„λ‹ˆλ―€λ‘œ μ „λ°˜μ μΈ 데이터 뢄석을 해보고 싢은 λΆ„λ“€κ»˜ μΆ”μ²œλ“œλ¦½λ‹ˆλ‹€. pandas만 κ³΅λΆ€ν•˜μ‹œκ³  μ‹ΆμœΌμ‹œλ‹€λ©΄ pandas 10λΆ„ μ™„μ„± λ¬Έμ„œλ₯Ό μ½μœΌμ‹œλŠ” κ±Έ μΆ”μ²œλ“œλ¦½λ‹ˆλ‹€.