이번 시간은 konlpy를 설치해보겠습니다.
konlpy는 한국어 정보처리를 위한 파이썬에서 제공되는 패키지입니다.
다양한 형태소 분석과 태깅 라이브러리를 파이썬에서 쉽게 사용할 수 있습니다.
1. 구글에 'jdk'를 검색합니다.
https://www.oracle.com/java/technologies/downloads/#jdk20-windows
Download the Latest Java LTS Free
Subscribe to Java SE and get the most comprehensive Java support available, with 24/7 global access to the experts.
www.oracle.com
- 별모양 링크를 다운받습니다.
2. 설정에서 '시스템 환경 변수 편집'을 검색합니다.
- 경로 세팅이라고 생각하시면 됩니다.
- 시스템 속성 → 고급 → 환경 변수 → 시스템 변수 → 새로 만들기
변수 이름에 'JAVA_HOME' 이라고 쓰고, 변수 값을 jdk를 설치한 경로에 bin 폴더로 설정한다.
3. anaconda 세팅을 해야한다. (conda 설치)
- 여러 라이브러리를 설치하면서 konlpy에서 사용하는 라이브러리랑 상호호환이 안맞을 수 있습니다.
- conda는 패키지들을 따로 관리할 수 있다.
- 예를 들어서 python 3.x와 python 2.x의 차이..?
4. Anaconda Powershell Prompt를 관리자 권한으로 실행
- 설치할 때 권한 때문에 에러나는 경우가 없음
- WINDOWS\system32에서 하면 안되고, cd..를 2번 입력 한 후, 디렉토리를 위로 이동한다.
5. conda create -n test python=3.7 anaconda를 입력
conda create -n test python=3.7 anaconda
- test는 원하는 이름을 적으면 되고, python을 3.6버전으로 한 이유는 최신버전으로 할 경우, 잘 작동되지 않는 경우가 많다고 합니다.
6. conda activate test를 입력
conda activate test
- 실험실(가상환경)에 입장 했다고 생각하자
7. konlpy 설치
pip install konlpy
8. Mecab 설치
(참고 : cleancode님)
- 우선 C드라이브에 mecab폴더 생성
- https://github.com/Pusnow/mecab-ko-msvc/releases/tag/release-0.9.2-msvc-3 링크에 들어가서 mecab-ko-msvc-x64.zip를 다운
- 다운받은 파일을 mecab폴더에서 압축 풀기
- https://github.com/Pusnow/mecab-ko-dic-msvc/releases/tag/mecab-ko-dic-2.1.1-20180720-msvc 링크에 들어가서 mecab-ko-dic-msvc.zip 를 다운
- 다운받은 파일을 mecab폴더에서 압축 풀기
- python에서 mecab을 사용할 수 있는 python wheel 설치하기
- https://github.com/Pusnow/mecab-python-msvc/releases/tag/mecab_python-0.996_ko_0.9.2_msvc-2 링크에 들어가서
자신의 환경에 맞는 파일 다운(python 3.7) mecab_python-0.996_ko_0.9.2_msvc-cp37-cp37m-win_amd64.whl 를 다운
- 다운로드 받은 파일을 site-packages에 옮기기 (anaconda3 - envs - test - lib - site-packages)
- 파이썬 이용자는 cmd창에서 site-packages 폴더로 이동
- cd를 이용하여 site-packages 폴더까지 이동 (cd Users, cd 사용자, ..)
- pip install .\mecab_python-0.996_ko_0.9.2_msvc-cp37-cp37m-win_amd64.whl 을 입력하여 설치
9. Mecab 확인하기
python
import MeCab
m = MeCab.Tagger()
out = m.parse("확인")
print(out)
- Mecab이 잘 설치된것을 확인할 수 있다.
'PROJECT > 텍스트 마이닝을 활용하여 문자 대화내용 분석' 카테고리의 다른 글
형태소 추출기 만들기 (2) | 2023.03.28 |
---|---|
konlpy 형태소 분석기 성능비교 (0) | 2023.03.27 |
네이버 기사 크롤러 만들기 (0) | 2023.03.22 |
네이버 오픈 API 등록 (0) | 2023.03.20 |
텍스트 마이닝 - 워드 임베딩 (0) | 2023.03.20 |