1.2.1 Python 기반의 머신러닝을 익히기 위해 필요한 일반적인 패키지
1. 머신러닝 패키지
1) 사이킷런 (Scikit-Learn)
: 가장 대표적인 머신러닝 패키지로, 데이터 마이닝 기반 머신러닝에서 독보적인 위치
: API 구성이 직관적이고 간결하여 이를 이용한 개발이 쉬움
2) 텐서플로 / 케라스
: 영상, 음성 등의 비정형 데이터 분야에서 사용
2. 행렬 / 선형대수 / 통계 패키지
1) 넘파이 (NumPy)
: 대표적인 행렬과 선형대수를 다루는 패키지로, 사이킷런 역시 넘파이 기반으로 만들어져 있음
2) 사이파이 (SciPy)
: 자연과학과 통계를 다루는 패키지로, 사이킷런 역시 사이파이의 도움을 받아 구축되어 있음
3. 데이터 핸들링
1) 판다스
: 대표적인 2차원 데이터 처리 패키지로, 넘파이보다 편리하게 데이터 처리할 수 있는 기능 구현
4. 시각화
1) 맷플롯립 (Matplotlib)
: 대표적인 시각화 패키지이지만, API가 세분화되어 있고 시각적인 부분에서 불편한 부분이 많음
2) 시본 (Seaborn)
: 맷플롯립의 효율성과 불편함을 개선하기 위한 시각화 패키지
: 판다스와 더 쉬운 연동, 함축적인 API 를 제공
: 세밀한 제어는 맷플롯립을 사용하여야 하므로, 맷플롯립에 대한 어느정도의 이해 필요
5. 대화형 파이썬 툴
1) 주피터 노트북 (Jupyter Notebook)
: 대화형 파이썬 툴인 아이파이썬 (IPython)의 지원 툴
: 중요 코드 단위로 설명을 적고 수행할 수 있도록 하여 역할을 직관적으로 이해 가능
앞선 여러 머신러닝 패키지들 중,
넘파이와 판다스는 사이킷런의 맥락 이해와 구현을 위해 매우 중요하다.
따라서 넘파이와 판다스 기본 프레임워크와 주요 API 에 대해 학습 한 후,
본격적인 머신러닝 코드 작성이 이루어질 예정이다.
1.2.2 파이썬 머신러닝을 위한 SW 설치
파이썬 기반의 머신러닝을 위해 앞서 소개한 패키지들을 설치해야 한다.
Window 11 / Python 3.8.7 을 기준으로 설치를 진행하였다.
1. Anaconda 설치
- 파이썬 머신러닝을 위한 패키지를 설치하는 가장 쉬운 방법
- pip 명령어의 경우 개별 패키지를 별도로 설치해야 하므로, Anaconda를 통해 일괄 설치
- Anaconda 설치 시 넘파이, 판다스, 맷플롯립, 시본, 주피터 노트북이 함께 설치됨
유료 상업용 버전과, 무료 Individual 버전으로 나누어 지는데,
무료 버전을 사용하여도 큰 부족함은 없다.
먼저, 아래의 페이지에 접속한 후 Download 버튼을 클릭하여 설치 파일을 내려받는다.
https://www.anaconda.com/download
다운로드 후, 실행 파일을 클릭하면 자동으로 설치가 진행된다.
이때 설치 경로에는 한글이 포함되면 안되고, 설치 화면마다 나타나는 설정은 기본 값으로 두면 된다.
설치를 완료하면 아래와 같이 'Anaconda Prompt' 와 'Jupyter Notebook' 아이콘을 찾을 수 있다.
Anaconda Prompt와 Jupyter Notebook 을 하나씩 실행해보자.
1) Anaconda Prompt
- Anaconda를 이용하여 패키지를 설치할 때 사용
- 관리자 권한으로 실행해야 패키지가 설치됨
Anaconda Prompt를 관리자 권한으로 실행한 후
아래와 같이 ' python -V ' 명령어를 입력하면, 파이썬 버전을 확인할 수 있다.
2) Jupyter Notebook
Jupyter Notebook 아이콘을 클릭하면,
주피터 노트북 구동을 위한 콘솔 화면이 나타난다.
콘솔 화면에 나타나는 메시지 중
'To access the notebook, open this file in a browser: " 부분에 해당하는 주소를 실행하면
아래와 같이 주피터 노트북을 사용할 수 있는 웹 브라우저를 확인할 수 있다.
해당 페이지 상단의 'New' 버튼을 클릭한 후 'Python 3' 버튼을 선택하면
주피터 노트북을 생성할 수 있다.
이때 기존에 실행시켰던 Jupyter Notebook 콘솔 화면을 끄면,
아래와 같이 'Creating Notebook Failed' 문구가 뜨게 된다.
콘솔 서버 프로그램을 끄지 않도록 유의하자!
새로운 Jupyter Notebook File이 생성되었다면, 아래와 같은 화면을 확인할 수 있다.
생성된 노트북은 'c:\Users\사용자명' 폴더에 저장된다.
새로운 노트북을 생성한 후,
아래와 같이 넘파이, 판다스, 맷플롯립, 시본, 사이킷런 모듈을 import 하여 정상적으로 설치가 되었는지 확인한다.
오류가 발생하지 않는다면, 정상적으로 설치가 완료된 것이다.
import numpy
import pandas
import matplotlib.pyplot
import seaborn
from sklearn.model_selection import train_test_split
2. Microsoft Visual Studio Build Tools 설치
- 서드 파티 패키지를 설치할 때 해당 Build Tool이 필요한 경우가 있으므로, 2015 이상 버전을 다운받는다.
(분류 LightGBM, 추천시스템 Surprise 패키지 설치 필요)
먼저 아래의 페이지에 접속하면, 아래와 같은 화면을 확인할 수 있다.
https://visualstudio.microsoft.com/ko/downloads/
화면을 아래로 스크롤 하여 하단으로 내려간 후,
'모든 다운로드' 메뉴의 'Visual Studio 도구' 를 선택하고,
'Visual Studio 2022용 별도 도구' 의 다운로드 버튼을 클릭한다.
다운로드 받은 파일을 실행 한 후
구성요소를 선택하는 화면에서 'C++ 를 사용한 데스크톱 개발' 메뉴를 선택한 후 설치를 진행한다.
앞선 Anaconda 와 Visual Studio Code 설치가 모두 완료되었다면,
파이썬 머신러닝을 위한 환경 구성이 완료된다.
권철민 '파이썬 머신러닝 완벽 가이드 (개정2판)' 책을 기반으로 작성하였습니다.
'[Capstone Study] 머신러닝 완벽 가이드' 카테고리의 다른 글
[머신러닝] 섹션 1.4 데이터 핸들링 - 판다스 (1) (0) | 2023.11.06 |
---|---|
[머신러닝] 섹션 1.3 넘파이 (2) (0) | 2023.11.06 |
[머신러닝] 섹션 1.3 넘파이 (1) (0) | 2023.09.21 |
[머신러닝] 섹션 1.1 머신러닝의 개념 (0) | 2023.09.21 |
[머신러닝] 섹션 0. 머신러닝을 공부하게 된 이유 / 스터디 계획 소개 (1) | 2023.09.21 |