'nltk' 태그의 글 목록

[Python] Text Data Analysis(1)

* 영어권 텍스트 처리 패키지: NLTK * Stemming(어간 추출) * Lemmatizing(원형 복원) * Pos Tag(품사 부착) 1. NLTK import nltk nltk.__version__ # '3.5' 2. English Text Data Download(Example) & Check # github에서 corpus(말뭉치) 다운로드 nltk.download() # nltk에 들어있는 book 데이터 확인 from nltk.book import * * gutenberg의 파일 리더기 nltk.corpus.gutenberg.fileids() * fileids를 사용해 gutenberg안에 있는 text 데이터 추출 emma = nltk.corpus.gutenberg.raw('austen..

프로그래밍 2021.06.06

« 2024/12 »

일

월

화

수

목

금

토

일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

일상 정리하기

nltk 1

티스토리툴바