프로젝트 회고
지금까지 한 실험을 종합해본 결과 AUROC가 가장 높았던 건 category+number+average_user_correct였다. 단일 feature 중 가장 성능이 좋았던 건 average_tag_correct였고 가장 안 좋은 건 hour였다.
여러가지 실험을 해 봤는데 거의 다 점수가 떨어져서 내가 제대로 하고 있는게 맞는지 의문이 든다.
멘토링
오늘 멘토링 시간에는 대회 관련 유용한 정보들을 많이 얻었다. 여러 가지 cross validation 전략 중에서 시계열 데이터에 적합한 Nested cv를 소개해주셨다. 그리고 feature engineering 할 때 팁이 있는지 질문했는데 무작정 실험하지 말고 vif와 같은 방법을 사용해서 feature selection을 하라고 하셨다.
'부스트캠프 AI Tech 1기 [T1209 최보미] > P stage-4 (DKT)' 카테고리의 다른 글
Day11 학습정리 (0) | 2021.06.07 |
---|---|
Day10 학습정리 (0) | 2021.06.04 |
Day8 학습정리 (0) | 2021.06.02 |
Day7 학습정리 (0) | 2021.06.01 |
Day6 학습정리 (0) | 2021.05.31 |