Zennta

ログイン会員登録

検索後で読むお気に入りお気に入りグループ

履歴

履歴がありません

Qiita一覧

Zenn一覧

お問い合わせフォーム利用規約プライバシーポリシー

記事がありません

1

AIモデルの量子化

うさぎでもわかるLLM量子化手法完全ガイド: q4_K_Mの謎を解く

sarashina2.2-1b-instruct-v0.1をAWQで量子化する

GANSUで始める量子化学計算: 量子化学計算の基本的な流れ

GANSUで始める量子化学計算: 計算結果を見てみよう

GANSUで始める量子化学計算: 水素分子の結合距離を求めてみる

CogView4-6B の量子化を試してみる

GANSUで始める量子化学計算：とりあえず動かしてみよう！

【論文解説】HQ-VAE: 階層的な離散表現学習における確率的量子化（SQ）の導入

QLoRAを知らずして量子化ファインチューニングを語るなかれ

LLMの重みの量子化でパフォーマンスが改善する仕組みについて

GGUFファイルの量子化タイプについて

Node.jsでバイナリ量子化してMongoDB Atlas Vector Searchのメモリ消費を24倍削減する

最高スペックのiPad Pro(M4 メモリ16GB)ならPhi-4の量子化モデルもワンチャン動く説を検証

Not蒸留物、本物のDeepSeek-R1(671B)を1.58bit量子化したモデルを動かす（1500円/時)

bitsandbytes で NF4 量子化の保存・読み込みを実装する

OllamaのK/V Context量子化の実践的検証と実装

量子化済みのTanuki-8bにfine-tuning

WebMOで使える量子化学計算プログラム

TanukiモデルのAWQ、GPTQ、GGUF量子化について

DeepFillV2 (Inpaint) をONNX化して、量子化する

pgvector 0.7.0 でバイナリインデックス＆量子化を試してみた

Sentence Transformersでできること　拡張SBERT、埋め込み量子化、クロスエンコーダーの学習

huggingfaceのモデルをlangchainで使う＋量子化とストップワード（停止文字列）の設定

llama.cppを使って、EvoLLM-JP-v1-10Bを自分で量子化した手順

Qiskit で遊んでみる (23) — 最新の Qiskit で量子化学計算

BitNetから始める量子化入門

llama.cpp の動かし方と量子化手法

llama.cppでHuggingFaceにあるモデルを自分で量子化して動かす方法

dockerでGPTQ量子化されたLLMを動かす

NVIDIA RTX3060(12GB)でLLMを試す：AWQ量子化

NVIDIA RTX3060(12GB)でLLMを試す：GPTQ量子化

QLoRA で 4bit 量子化で LLM 33B 規模ﾌｧｲﾝﾁｭｰﾝ頑張りたいメモ

LLM 4bit 量子化ライブラリ(CPU, GPU)のメモ(2023/05 時点)

Tight-binding modelの第二量子化表示

第二量子化表示/生成・消滅演算子の方法

第一量子化のTight-bindingモデル（後編）

第一量子化のTight-bindingモデル（前編）

Pythonで量子化学計算（適宜更新）

Tight-binding modelの第二量子化表示を初歩からちゃんと理解する

【13日目】量子化をやってみる【2021アドベントカレンダー】

tflite の Sparseテンソル Densify を逆量子化して Float32 のクリーンなモデルを錬成する

Canvas から getImageData で取得した RGB値は premultiplied-alpha で量子化される件

Pythonで量子化学計算（Psi4）

1