Archives 2025 20 Feb LLM 강화학습 알고리즘(RLHF, DPO) 간단 정리2024 19 Dec Byte Latent Transformer (BLT)를 쉽게 이해해 보자 29 Nov DeepSpeed ZeRO를 사용해 거대 모델을 학습해보자 21 Oct [논문구현] Transformer (트랜스포머) 스크래치 구현부터 한영 번역 학습까지(Attention is All You Need)