PROJECT/텍스트 마이닝을 활용하여 문자 대화내용 분석

기사 텍스트 정제 - konlpy 설치 (WINDOWS)

HeyTeddy 2023. 3. 24. 00:09
반응형

이번 시간은 konlpy를 설치해보겠습니다.

konlpy는 한국어 정보처리를 위한 파이썬에서 제공되는 패키지입니다.

다양한 형태소 분석과 태깅 라이브러리를 파이썬에서 쉽게 사용할 수 있습니다.

 

1. 구글에 'jdk'를 검색합니다.

https://www.oracle.com/java/technologies/downloads/#jdk20-windows

 

Download the Latest Java LTS Free

Subscribe to Java SE and get the most comprehensive Java support available, with 24/7 global access to the experts.

www.oracle.com

- 별모양 링크를 다운받습니다.

 

2. 설정에서 '시스템 환경 변수 편집'을 검색합니다.

- 경로 세팅이라고 생각하시면 됩니다.

- 시스템 속성 → 고급 → 환경 변수 → 시스템 변수 → 새로 만들기

변수 이름에 'JAVA_HOME' 이라고 쓰고, 변수 값을 jdk를 설치한 경로에 bin 폴더로 설정한다.

 

3. anaconda 세팅을 해야한다. (conda 설치)

- 여러 라이브러리를 설치하면서 konlpy에서 사용하는 라이브러리랑 상호호환이 안맞을 수 있습니다.

- conda는 패키지들을 따로 관리할 수 있다.

- 예를 들어서 python 3.x와 python 2.x의 차이..?

 

4. Anaconda Powershell Prompt를 관리자 권한으로 실행

- 설치할 때 권한 때문에 에러나는 경우가 없음

- WINDOWS\system32에서 하면 안되고, cd..를 2번 입력 한 후, 디렉토리를 위로 이동한다.

 

5. conda create -n test python=3.7 anaconda를 입력

conda create -n test python=3.7 anaconda

- test는 원하는 이름을 적으면 되고, python을 3.6버전으로 한 이유는 최신버전으로 할 경우, 잘 작동되지 않는 경우가 많다고 합니다.

 

6. conda activate test를 입력

conda activate test

- 실험실(가상환경)에 입장 했다고 생각하자

 

7. konlpy 설치

pip install konlpy

 

8. Mecab 설치

(참고 : cleancode님)

- 우선 C드라이브에 mecab폴더 생성

- https://github.com/Pusnow/mecab-ko-msvc/releases/tag/release-0.9.2-msvc-3 링크에 들어가서 mecab-ko-msvc-x64.zip를 다운

- 다운받은 파일을 mecab폴더에서 압축 풀기

- https://github.com/Pusnow/mecab-ko-dic-msvc/releases/tag/mecab-ko-dic-2.1.1-20180720-msvc 링크에 들어가서 mecab-ko-dic-msvc.zip 를 다운

- 다운받은 파일을 mecab폴더에서 압축 풀기

 

- python에서 mecab을 사용할 수 있는 python wheel 설치하기

- https://github.com/Pusnow/mecab-python-msvc/releases/tag/mecab_python-0.996_ko_0.9.2_msvc-2 링크에 들어가서

자신의 환경에 맞는 파일 다운(python 3.7) mecab_python-0.996_ko_0.9.2_msvc-cp37-cp37m-win_amd64.whl 를 다운

 

- 다운로드 받은 파일을 site-packages에 옮기기 (anaconda3 - envs - test - lib - site-packages)

 

- 파이썬 이용자는 cmd창에서 site-packages 폴더로 이동

- cd를 이용하여 site-packages 폴더까지 이동 (cd Users, cd 사용자, ..)

- pip install .\mecab_python-0.996_ko_0.9.2_msvc-cp37-cp37m-win_amd64.whl 을 입력하여 설치

 

9. Mecab 확인하기

python 
import MeCab
m = MeCab.Tagger()
out = m.parse("확인")
print(out)

- Mecab이 잘 설치된것을 확인할 수 있다.

반응형