Zennta
ログイン
会員登録
検索
後で読む
お気に入り
お気に入りグループ
検索
Qiita一覧
Zenn一覧
お問い合わせフォーム
利用規約
プライバシーポリシー
記事がありません
1
AIモデルの量子化
うさぎでもわかるLLM量子化手法完全ガイド: q4_K_Mの謎を解く
sarashina2.2-1b-instruct-v0.1をAWQで量子化する
GANSUで始める量子化学計算: 量子化学計算の基本的な流れ
GANSUで始める量子化学計算: 計算結果を見てみよう
GANSUで始める量子化学計算: 水素分子の結合距離を求めてみる
CogView4-6B の量子化を試してみる
GANSUで始める量子化学計算:とりあえず動かしてみよう!
【論文解説】HQ-VAE: 階層的な離散表現学習における確率的量子化(SQ)の導入
QLoRAを知らずして量子化ファインチューニングを語るなかれ
LLMの重みの量子化でパフォーマンスが改善する仕組みについて
GGUFファイルの量子化タイプについて
Node.jsでバイナリ量子化してMongoDB Atlas Vector Searchのメモリ消費を24倍削減する
最高スペックのiPad Pro(M4 メモリ16GB)ならPhi-4の量子化モデルもワンチャン動く説を検証
Not蒸留物、本物のDeepSeek-R1(671B)を1.58bit量子化したモデルを動かす(1500円/時)
bitsandbytes で NF4 量子化の保存・読み込みを実装する
OllamaのK/V Context量子化の実践的検証と実装
量子化済みのTanuki-8bにfine-tuning
WebMOで使える量子化学計算プログラム
TanukiモデルのAWQ、GPTQ、GGUF量子化について
DeepFillV2 (Inpaint) をONNX化して、量子化する
pgvector 0.7.0 でバイナリインデックス&量子化を試してみた
Sentence Transformersでできること 拡張SBERT、埋め込み量子化、クロスエンコーダーの学習
huggingfaceのモデルをlangchainで使う + 量子化とストップワード(停止文字列)の設定
llama.cppを使って、EvoLLM-JP-v1-10Bを自分で量子化した手順
Qiskit で遊んでみる (23) — 最新の Qiskit で量子化学計算
BitNetから始める量子化入門
llama.cpp の動かし方と量子化手法
llama.cppでHuggingFaceにあるモデルを自分で量子化して動かす方法
dockerでGPTQ量子化されたLLMを動かす
NVIDIA RTX3060(12GB)でLLMを試す:AWQ量子化
NVIDIA RTX3060(12GB)でLLMを試す:GPTQ量子化
QLoRA で 4bit 量子化で LLM 33B 規模ファインチューン頑張りたいメモ
LLM 4bit 量子化ライブラリ(CPU, GPU)のメモ(2023/05 時点)
Tight-binding modelの第二量子化表示
第二量子化表示/生成・消滅演算子の方法
第一量子化のTight-bindingモデル(後編)
第一量子化のTight-bindingモデル(前編)
Pythonで量子化学計算(適宜更新)
Tight-binding modelの第二量子化表示を初歩からちゃんと理解する
【13日目】量子化をやってみる【2021アドベントカレンダー】
tflite の Sparseテンソル Densify を逆量子化して Float32 のクリーンなモデルを錬成する
Canvas から getImageData で取得した RGB値は premultiplied-alpha で量子化される件
Pythonで量子化学計算(Psi4)
1