-
Notifications
You must be signed in to change notification settings - Fork 0
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Fix: 형태소 분석할 때 형태소까지 같이 저장 #38
Comments
edcrfv458
added a commit
that referenced
this issue
May 12, 2024
edcrfv458
added a commit
that referenced
this issue
May 12, 2024
#38 문장의 길이의 최대는 200을 넘어가고 평균은 20이라서 문장의 길이가 50이 넘어가는 문장들은 버리는 작업을 수행
edcrfv458
added a commit
that referenced
this issue
May 12, 2024
#38 50 이상의 문장을 걸러낸 후 모든 문장을 50으로 패딩 진행
edcrfv458
added a commit
that referenced
this issue
May 13, 2024
#38 토큰들 간의 유사도를 알아내기 위해 Word2Vec 과정 추가
edcrfv458
added a commit
that referenced
this issue
May 13, 2024
#38 토큰의 수가 50이 넘는 문장 제거하고 word2vec 재수행
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
기존 방식으로는 형태소 분석만 하고 형태소를 사용하지 않았는데 형태소를 사용하는 것이 정확도가 더 잘 나올 것이라고 생각해서 다시 형태소 분석 진행 필요
The text was updated successfully, but these errors were encountered: