Zennta

  • ログイン会員登録
  • 検索後で読むお気に入りお気に入りグループ

履歴

履歴がありません

Qiita一覧

Zenn一覧

  • お問い合わせフォーム利用規約プライバシーポリシー
    記事がありません
    • 1
    AIモデルの量子化
    うさぎでもわかるLLM量子化手法完全ガイド: q4_K_Mの謎を解く
    sarashina2.2-1b-instruct-v0.1をAWQで量子化する
    GANSUで始める量子化学計算: 量子化学計算の基本的な流れ
    GANSUで始める量子化学計算: 計算結果を見てみよう
    GANSUで始める量子化学計算: 水素分子の結合距離を求めてみる
    CogView4-6B の量子化を試してみる
    GANSUで始める量子化学計算:とりあえず動かしてみよう!
    【論文解説】HQ-VAE: 階層的な離散表現学習における確率的量子化(SQ)の導入
    QLoRAを知らずして量子化ファインチューニングを語るなかれ
    LLMの重みの量子化でパフォーマンスが改善する仕組みについて
    GGUFファイルの量子化タイプについて
    Node.jsでバイナリ量子化してMongoDB Atlas Vector Searchのメモリ消費を24倍削減する
    最高スペックのiPad Pro(M4 メモリ16GB)ならPhi-4の量子化モデルもワンチャン動く説を検証
    Not蒸留物、本物のDeepSeek-R1(671B)を1.58bit量子化したモデルを動かす(1500円/時)
    bitsandbytes で NF4 量子化の保存・読み込みを実装する
    OllamaのK/V Context量子化の実践的検証と実装
    量子化済みのTanuki-8bにfine-tuning
    WebMOで使える量子化学計算プログラム
    TanukiモデルのAWQ、GPTQ、GGUF量子化について
    DeepFillV2 (Inpaint) をONNX化して、量子化する
    pgvector 0.7.0 でバイナリインデックス&量子化を試してみた
    Sentence Transformersでできること 拡張SBERT、埋め込み量子化、クロスエンコーダーの学習
    huggingfaceのモデルをlangchainで使う + 量子化とストップワード(停止文字列)の設定
    llama.cppを使って、EvoLLM-JP-v1-10Bを自分で量子化した手順
    Qiskit で遊んでみる (23) — 最新の Qiskit で量子化学計算
    BitNetから始める量子化入門
    llama.cpp の動かし方と量子化手法
    llama.cppでHuggingFaceにあるモデルを自分で量子化して動かす方法
    dockerでGPTQ量子化されたLLMを動かす
    NVIDIA RTX3060(12GB)でLLMを試す:AWQ量子化
    NVIDIA RTX3060(12GB)でLLMを試す:GPTQ量子化
    QLoRA で 4bit 量子化で LLM 33B 規模ファインチューン頑張りたいメモ
    LLM 4bit 量子化ライブラリ(CPU, GPU)のメモ(2023/05 時点)
    Tight-binding modelの第二量子化表示
    第二量子化表示/生成・消滅演算子の方法
    第一量子化のTight-bindingモデル(後編)
    第一量子化のTight-bindingモデル(前編)
    Pythonで量子化学計算(適宜更新)
    Tight-binding modelの第二量子化表示を初歩からちゃんと理解する
    【13日目】量子化をやってみる【2021アドベントカレンダー】
    tflite の Sparseテンソル Densify を逆量子化して Float32 のクリーンなモデルを錬成する
    Canvas から getImageData で取得した RGB値は premultiplied-alpha で量子化される件
    Pythonで量子化学計算(Psi4)
    • 1