Zennta

  • ログイン会員登録
  • 検索後で読むお気に入りお気に入りグループ

履歴

履歴がありません

Qiita一覧

Zenn一覧

  • お問い合わせフォーム利用規約プライバシーポリシー
    記事がありません
    • 1
    Tanuki で MoE の挙動を調査
    Tanuki8Bに対するMT-Benchを用いた評価を体験してみる
    LLMのInstruction Tuning用教師データをTanuki-8x8Bで合成
    量子化済みのTanuki-8bにfine-tuning
    Tanuki-8B, 8x8B - Direct Preference Optimization (DPO)実行(11/24日勉強会公開用)
    Tanuki-8B, 8x8B - Supervised Fine-Tuning (SFT) 実行(11/24日勉強会公開用)
    Tanuki-8x8B-vision-exp学習作業記録・tips【前編】
    Tanuki-8BにMagpieを適用して日本語の合成対話データセットを作成する
    大規模言語モデルの性能の自動評価に関する問題点のメモ書き:Tanuki-8x8Bの事例から
    Tanuki-8B の GGUF 版トークナイザ―の調査
    Tanukiモデルが全角数字・記号を認識出来ない問題とその解決(LLM学習コーパスの正規化の落とし穴)
    Tanuki-8B, 8x8B - 事後学習の軌跡
    Tanuki-8x8BにおけるMoE upcycling検討及び事前学習について
    TanukiモデルのAWQ、GPTQ、GGUF量子化について
    Tanuki-8BとOllamaとDifyを使って日本語ローカルRAG構築
    Team Tanuki Phase2 - Tanuki-8B, 8x8B 開発の経緯
    Tanuki-8x8Bをダウンロードした後に推論させる方法について
    ChatbotArena的なシステムでTanuki-8x8Bを始めとする大規模言語モデルの日本語性能を評価する(2024年8月)
    Tanuki-8B,8x8Bの開発完了までに考えていたことと、「科学の基盤モデル」の構築に向けた考え
    フルスクラッチで開発した大規模言語モデルTanuki-8B, 8x8Bの性能についての技術的な詳細
    大規模言語モデルTanuki-8B, 8x8Bの位置づけや開発指針など
    • 1