50+ days of Machine Learning

Posts

Showing posts from January 24, 2024

[Day 23] Natural Language Processing 모델 만들어 봤다

1/24/2024 09:55:00 pm

안녕하세요! 오늘은 Day 23입니다! DeepLearning.AI의 NLP course 에서 배운 것을 새로운 데이터에 적용해 봤다 재무표의 감정 분석 모델 축구 텍스트 생성 모델 첫 번째, 텍스트 감정 분석 하려고 Kaggle에서 재무표 텍스트와 감정 (positive, negative)으로 나눴던 데이터를 찾게 되었다 stopwords 없앴다 데이터셋을 나누고 토큰화 패딩도 했다 모델 구조는 다음과 같다 여러가지 모델 구조로 훈련했는데 대부분에 과대적합을 볼 수 있었다. 위에 모델의 성능은 과대적합이 텍스트 감정 분석 할 때 흔히 볼 수 있다고 했는데 극복하기 위해 더 노력해야 한다! 자... 두 번째, 텍스트 생성 모델을 만들어 봤다 이번엔 제가 만든 데이터 로 모델을 만들어 봤다 1. 텍스트를 토큰화했다 그 다음에 각 문장을 기반으로 subphrase를 생성했다 예를 들어자면 I like dogs 문장은 > I - 1, like - 2, dogs - 3 > [ [0,0,1], [0,1,2], [1,2,3] ]으로 변경했다 여기도 다양한 모델 계층 구조 해 봤는데 결국엔 아래와 같은 모델 구조로 했다 정확도 손실 그리고 마지막으로 ~ 텍스트 생성해 봤다 ['Chelsea', 'Manchester United', 'Arsenal', 'Manchester City', 'Tottenham', 'Best team was', 'Against the wall', 'The FA cup was hard but', 'The season was filled with hardships and', 'In the end, the best team was', 'Some teams performed bad, so they were'] 이 프롬프트로 모델이 그 다음 단어 20가지 생성하라고 ...