느낀점
캐글로 알게 된 10가지
스터디로 알게 된 것 Hugging face Datasets 라이브러리 dictionary 형식으로 dataset을 만드는 구조로 tensorflow와 pytorch형 dataset으로 자유롭게 형식을 변경할 수 있으며 필요시 Dataset 또한 편리하게 받을 수 있다. trainer와도 훈련이 가능하다 모델이 편향적이지 않게 기본적으로 K-fold를 사용한다 대부분 대회에서 seed를 고정하여 5fold를 적용하며 각각의 모델을 저장한다 Tensorflow로 Huggingface의 pretrained 모델을 불러와서 훈련을 시킬 때 gradient가 존재하지 않는다는 Warning이 뜨는데 실제 훈련 및 추론에선 정상 작동한다! 데이터 증강은 시도해볼만하지만 성능의 향상을 보장하진 않는다. backtr..