LLM開発!!!たのしいね!!!!!
本書は30人でHPCを利用して253Bという大型のLLMのファインチューニングコンペを行った様子を適宜技術的な補足を入れつつ時系列でまとめたものになります.
• LLM 開発に興味がある人
• 30 人規模の開発プロジェクトがどのように動いているのか気になる人
• LLM で Humanity’s Last Exam(後述)や Do Not Answer(これも後述)の精
度向上を考えている人
• High Performance Computing に興味がある人
• LLM が好きな人
• 機械学習コンペが好きな人
電子: 500
紙/電子: 1,000
4月3日に国立情報学研究所から国産のフルスクラッチモデルである llm-jp-4が発表されました!!
我々のチームは5ヶ月前にクローズドで頂いていたのでそれに対して900万件のデータ生成を行い, 学会コンペに出したところ2位(オープン部門)をいただくことができました
そこで,本書ではその際に得た「権利的にクリーンなデータを900万件用意する方法」「学習手法」「推論システムの構築」「評価手法」などの知見をギュッと一冊に詰め込んだものになります.
この本でわかること:
国立情報学研究所主催の「第2回 FT-LLM 2026」数学タスクで、複数大学混成の8人チーム「ビクトリー」がオープン部門2位・総合部門3位を獲得するまでの、試行錯誤の全工程を包括的に解説します。
こんな人に読んでほしい: