ヘッダだけ読む · アップロードなし

.gguf ファイルをここにドロップ

クリックして選択

ブラウザ内で処理 · アップロードなし

別のファイルをドロップ / クリック

ダウンロードした .gguf モデルを、ブラウザ内で開いて中身を確認するツールです。general.architecture（llama / qwen2 / flux など）、量子化タイプ（Q4_K_M・Q5_K_M・Q8_0 など file_type から判定）、総パラメータ数、テンソルの種別内訳、context length・embedding length・block count といったメタデータを一覧表示します。Hugging Face や ComfyUI-GGUF から落としたモデルが「Q4 か Q5 かどっちだったか分からない」「何 B のモデルか・どのアーキか確認したい」「llama.cpp に通す前に中身を見たい」というときに、ファイル自身に埋め込まれたヘッダ情報から答えを読み取れます。最大の特徴は、ファイルの先頭ヘッダ（マジック・メタデータ KV・テンソル情報）だけを読み、重み本体はロードしないこと。そのため数 GB の量子化モデルでも待たされず一瞬で開けます。モデルは送信する必要のないものなので、本ツールはファイルをアップロードせず、解析はすべて端末内（ブラウザ）で完結します。safetensors-info の GGUF 版です。

使い方

.gguf ファイルをドロップ、またはクリックして選択します（重みは読まずヘッダだけを解析します）。
アーキテクチャ・量子化タイプ・パラメータ数・テンソル種別・モデル情報が自動で表示されます。
「すべてコピー」でモデル情報をそのまま控えられます。全メタデータ KV も展開して確認できます。

よくある質問

ファイルはサーバーにアップロードされますか？

いいえ。解析はすべてブラウザ内で行われます。.gguf はアップロード・保存・送信されず、あなたの端末内だけで読み取られます。配布前のモデルでも安心して確認できます。

数 GB のモデルでも開けますか？

はい。重み本体はロードせず、ファイル先頭のヘッダ（メタデータ KV とテンソル情報）だけを読みます。そのため数 GB の量子化モデルでも待たされず一瞬で開けます。

量子化タイプ（Q4_K_M など）はどうやって判定していますか？

メタデータの general.file_type（llama.cpp の ftype）から代表的な量子化ラベルへ対応付けています。記録が無いファイルでは、テンソルで最も多い ggml 種別を量子化として表示します。

パラメータ数はどう計算していますか？

ヘッダのテンソル情報に記録された各テンソルの形状（次元の積）を合計しています。重みは読まず、形状の数値だけから算出するため正確かつ高速です。

safetensors との違いは何ですか？

GGUF は llama.cpp / ComfyUI-GGUF が使う量子化モデル形式で、メタデータとテンソルが1つのバイナリにまとまっています。.safetensors の中身を見たい場合は姉妹ツールの safetensors メタビューアをお使いください。

メタデータが少ししか表示されません。

そのファイルに記録されている KV が少ない場合があります。テンソル数・パラメータ数・量子化種別はテンソル情報から算出されるため、メタが薄くても確認できます。