NSMC 2

NSMC 감정분석하기

감정분석의 정의는 무엇일까? 데이터 만드는 자, 데이터 제공자, 데이터 분석가의 주관에 따라 감정이 다르다. 부정/중립/긍정 일반적으로 텍스트 안에 있는 의미를 뽑아낸다. 감정 분석은 디지털 텍스트를 분석하여 메시지의 감정적 어조가 긍정적인지, 부정적인지 또는 중립적인지를 확인하는 프로세스 오늘날 회사는 이메일, 고객 지원 채팅 트랜스크립트, 소셜 미디어 댓글 및 리뷰와 같은 대량의 텍스트 데이터를 보유하고 있습니다. 감정 분석 도구는 이 텍스트를 스캔하여 주제에 대한 글쓴이의 태도를 자동으로 확인할 수 있습니다. 기업은 감정 분석의 인사이트를 활용하여 고객 서비스를 개선하고 브랜드 평판을 높입니다. 크게 감정분석은 Knowledge-based approach, Machine Learning-based ..

Naver sentiment movie corpus(NSMC)를 활용 감정분석

한국어 데이터 중 가장 유명한 감정분석 데이터는 naver sentiment movie corpus이다. google에 nsmc검색하여 github을 들어간다. https://github.com/e9t/nsmc GitHub - e9t/nsmc: Naver sentiment movie corpus Naver sentiment movie corpus. Contribute to e9t/nsmc development by creating an account on GitHub. github.com 간단하게 영화가 긍정/부정을 알려준다. 긍정은 9~10점, 부정은 0~4점으로 나누었다. 총 20만개 리뷰 데이터가 있다. (수집된 64만개 데이터 중 샘플링) 훈련 데이터는 15만, 테스트 데이터는 5만개가 존재한다...