Day8 학습정리 - GPT 언어 모델 소개

부스트캠프 AI Tech 1기 [T1209 최보미]/P stage-2 (KLUE)

Day8 학습정리 - GPT 언어 모델 소개

B1001101 2021. 4. 21. 23:55

프로젝트 회고

데이터셋 문장을 변형해서 ...[E1]엔티티1[/E1]...[E2]엔티티2[/E2]...와 같이 엔티티를 강조하는 식으로 special token을 적용해봤는데 정확도가 2%정도 떨어졌다. tokenizer에 entity를 따로 넣어주지 않고 변형한 문장만 넣어줘서 그럴 것이라고 추측한다.
+ entity도 같이 넣어줬더니 지금까지중 최고의 정확도가 나왔다.

max-length를 200으로 늘려봤는데 오히려 정확도가 1%정도 떨어졌다. 무조건 max-length를 늘린다고 성능이 좋아지는 것은 아닌 것 같다.

'부스트캠프 AI Tech 1기 [T1209 최보미] > P stage-2 (KLUE)' 카테고리의 다른 글

Day 10 학습정리 - Stage2 마무리 (0)	2021.04.23
Day9 학습정리 - 최신 자연어 처리 연구 (0)	2021.04.22
Day7 학습정리 - BERT 기반 문장 토큰 분류 모델 학습 (0)	2021.04.20
Day6 학습정리 - BERT 기반 두 문장 관계 분류 모델 학습 (0)	2021.04.19
Day5 학습정리 - BERT 기반 단일 문장 분류 모델 학습 (0)	2021.04.16

현재글Day8 학습정리 - GPT 언어 모델 소개

Today :
Yesterday :

cnn, 네이버 부스트캠프, Docker, 소셜로그인, DRF, Data Engineering, Data Studio, Google Cloud Functions, python, pandas, Google Cloud Platform, Google Cloud Pub/Sub, Boostcamp AI Tech, flask, Google Kubernetes Engine, T아카데미, 인코스런, RNN, Image Classification, Django,

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

보미의 Tech Blog

Day8 학습정리 - GPT 언어 모델 소개

프로젝트 회고

'부스트캠프 AI Tech 1기 [T1209 최보미] > P stage-2 (KLUE)' 카테고리의 다른 글

'부스트캠프 AI Tech 1기 [T1209 최보미]/P stage-2 (KLUE)'의 다른글

티스토리툴바

Day8 학습정리 - GPT 언어 모델 소개

프로젝트 회고

'부스트캠프 AI Tech 1기 [T1209 최보미] > P stage-2 (KLUE)' 카테고리의 다른 글

'부스트캠프 AI Tech 1기 [T1209 최보미]/P stage-2 (KLUE)'의 다른글

관련글

티스토리툴바