ヘッダだけ読む · アップロードなし

.gguf ファイルをここにドロップ

クリックして選択

ブラウザ内で処理 · アップロードなし

別の画像をドロップ / クリック

ダウンロードした .gguf モデルを、ブラウザ内で開いて中身を確認するツールです。general.architecture(llama / qwen2 / flux など)、量子化タイプ(Q4_K_M・Q5_K_M・Q8_0 など file_type から判定)、総パラメータ数、テンソルの種別内訳、context length・embedding length・block count といったメタデータを一覧表示します。Hugging Face や ComfyUI-GGUF から落としたモデルが「Q4 か Q5 かどっちだったか分からない」「何 B のモデルか・どのアーキか確認したい」「llama.cpp に通す前に中身を見たい」というときに、ファイル自身に埋め込まれたヘッダ情報から答えを読み取れます。最大の特徴は、ファイルの先頭ヘッダ(マジック・メタデータ KV・テンソル情報)だけを読み、重み本体はロードしないこと。そのため数 GB の量子化モデルでも待たされず一瞬で開けます。モデルは送信する必要のないものなので、本ツールはファイルをアップロードせず、解析はすべて端末内(ブラウザ)で完結します。safetensors-info の GGUF 版です。

使い方

  1. .gguf ファイルをドロップ、またはクリックして選択します(重みは読まずヘッダだけを解析します)。
  2. アーキテクチャ・量子化タイプ・パラメータ数・テンソル種別・モデル情報が自動で表示されます。
  3. 「すべてコピー」でモデル情報をそのまま控えられます。全メタデータ KV も展開して確認できます。

よくある質問

ファイルはサーバーにアップロードされますか?

いいえ。解析はすべてブラウザ内で行われます。.gguf はアップロード・保存・送信されず、あなたの端末内だけで読み取られます。配布前のモデルでも安心して確認できます。

数 GB のモデルでも開けますか?

はい。重み本体はロードせず、ファイル先頭のヘッダ(メタデータ KV とテンソル情報)だけを読みます。そのため数 GB の量子化モデルでも待たされず一瞬で開けます。

量子化タイプ(Q4_K_M など)はどうやって判定していますか?

メタデータの general.file_type(llama.cpp の ftype)から代表的な量子化ラベルへ対応付けています。記録が無いファイルでは、テンソルで最も多い ggml 種別を量子化として表示します。

パラメータ数はどう計算していますか?

ヘッダのテンソル情報に記録された各テンソルの形状(次元の積)を合計しています。重みは読まず、形状の数値だけから算出するため正確かつ高速です。

safetensors との違いは何ですか?

GGUF は llama.cpp / ComfyUI-GGUF が使う量子化モデル形式で、メタデータとテンソルが1つのバイナリにまとまっています。.safetensors の中身を見たい場合は姉妹ツールの safetensors メタビューアをお使いください。

メタデータが少ししか表示されません。

そのファイルに記録されている KV が少ない場合があります。テンソル数・パラメータ数・量子化種別はテンソル情報から算出されるため、メタが薄くても確認できます。