Zennta
ログイン
会員登録
検索
後で読む
お気に入り
お気に入りグループ
検索
Qiita一覧
Zenn一覧
お問い合わせフォーム
利用規約
プライバシーポリシー
記事がありません
1
QAタスクで Instruction Tuning & DPOのFine Tuningを試してみる
FineTuning
DPO
LLM
InstructionTuning
QLORA
【備忘】LLMのチューニングに関する研究まとめ
LLM
【LLMの研究者向け】400本を超えるLLMに関する論文のリストを公開・更新しています
Gemini
ChatGPT
LLM
LlamaIndex
Claude
ローカルLLMでAlpacaデータのようなインストラクションデータを自動生成してみた
Python
自然言語処理
AI
LLM
InstructionTuning
huggingface/TRLのSFTTrainerクラスを使えばLLMのInstruction Tuningのコードがスッキリ書けてとても便利です
自然言語処理
huggingface
LLM
InstructionTuning
SFTTrainer
1