토크나이저 구현
개요
수행 과정 명세
문자열 전처리
emoji_pattern = re.compile("["
u"\U0001F600-\U0001F64F" # emoticons
u"\U0001F300-\U0001F5FF" # symbols & pictographs
u"\U0001F680-\U0001F6FF" # transport & map symbols
u"\U0001F1E0-\U0001F1FF" # flags (iOS)
"]+", flags=re.UNICODE)re.sub('\s'," ", doc) doc.lower()형태소 분석
유효성 검증
코드 실행 예제

소스 코드 배포
실행 요구사항
Last updated
Was this helpful?