[논문구현] Transformer (트랜스포머) 스크래치 구현부터 한영 번역 학습까지(Attention is All You Need)

Transformer 논문 'Attention is All You Need'를 스크래치로 구현하고 한영 번역 모델을 학습시키는 과정을 다룹니다.

Posted Oct 21, 2024

1 min read

Transformer from Scratch in Pytorch

Large Language Model (LLM)이 최근 유행하고 있는데, 그 기반이 되는 Transformer 관련 내용을 정리하고자 본 포스트를 작성하게 되었습니다.

모델 구현, 학습 데이터 선정 및 구성, 토크나이저 학습, 모델 학습까지 차근차근 다뤄볼 생각입니다.

데이터 셋 구성 및 학습과 관련된 코드는 아래 깃허브 레포를 참고해주세요.

작성중…

This post is licensed under CC BY 4.0 by the author.