.gguf ファイルをここにドロップ
クリックして選択
ブラウザ内で処理 · アップロードなし
別の画像をドロップ / クリック
ファイルが大きいため、テンソル統計が一部のみの可能性があります(ヘッダを安全上限まで読みました)。
概要
- GGUF バージョン
- アーキテクチャ
- 量子化
- テンソル数
- パラメータ数
モデル情報
テンソル種別
すべてのメタデータ
ダウンロードした .gguf モデルを、ブラウザ内で開いて中身を確認するツールです。general.architecture(llama / qwen2 / flux など)、量子化タイプ(Q4_K_M・Q5_K_M・Q8_0 など file_type から判定)、総パラメータ数、テンソルの種別内訳、context length・embedding length・block count といったメタデータを一覧表示します。Hugging Face や ComfyUI-GGUF から落としたモデルが「Q4 か Q5 かどっちだったか分からない」「何 B のモデルか・どのアーキか確認したい」「llama.cpp に通す前に中身を見たい」というときに、ファイル自身に埋め込まれたヘッダ情報から答えを読み取れます。最大の特徴は、ファイルの先頭ヘッダ(マジック・メタデータ KV・テンソル情報)だけを読み、重み本体はロードしないこと。そのため数 GB の量子化モデルでも待たされず一瞬で開けます。モデルは送信する必要のないものなので、本ツールはファイルをアップロードせず、解析はすべて端末内(ブラウザ)で完結します。safetensors-info の GGUF 版です。
使い方
- .gguf ファイルをドロップ、またはクリックして選択します(重みは読まずヘッダだけを解析します)。
- アーキテクチャ・量子化タイプ・パラメータ数・テンソル種別・モデル情報が自動で表示されます。
- 「すべてコピー」でモデル情報をそのまま控えられます。全メタデータ KV も展開して確認できます。
よくある質問
ファイルはサーバーにアップロードされますか?
いいえ。解析はすべてブラウザ内で行われます。.gguf はアップロード・保存・送信されず、あなたの端末内だけで読み取られます。配布前のモデルでも安心して確認できます。
数 GB のモデルでも開けますか?
はい。重み本体はロードせず、ファイル先頭のヘッダ(メタデータ KV とテンソル情報)だけを読みます。そのため数 GB の量子化モデルでも待たされず一瞬で開けます。
量子化タイプ(Q4_K_M など)はどうやって判定していますか?
メタデータの general.file_type(llama.cpp の ftype)から代表的な量子化ラベルへ対応付けています。記録が無いファイルでは、テンソルで最も多い ggml 種別を量子化として表示します。
パラメータ数はどう計算していますか?
ヘッダのテンソル情報に記録された各テンソルの形状(次元の積)を合計しています。重みは読まず、形状の数値だけから算出するため正確かつ高速です。
safetensors との違いは何ですか?
GGUF は llama.cpp / ComfyUI-GGUF が使う量子化モデル形式で、メタデータとテンソルが1つのバイナリにまとまっています。.safetensors の中身を見たい場合は姉妹ツールの safetensors メタビューアをお使いください。
メタデータが少ししか表示されません。
そのファイルに記録されている KV が少ない場合があります。テンソル数・パラメータ数・量子化種別はテンソル情報から算出されるため、メタが薄くても確認できます。