テキスト
出現頻度
上に文章を貼り付けると、各単語・語句・文字の出現回数を集計します。
文章の中で「どの語がよく使われているか」をその場で数える出現頻度カウンターです。記事・レポート・文字起こし・キーワード一覧などを貼り付けると、各語の回数と全体に占める割合を多い順に一覧表示します。集計の単位は3つから選べます。「単語」は空白や記号で区切って英単語などを数えるモード、「語句(N-gram)」は連続するN文字を1つの語句として数えるモードで、単語の区切りに空白を使わない日本語でも、形態素解析エンジンを読み込まずに頻出フレーズを把握できます(Nは1〜6で指定、既定は2=バイグラム)。「文字」は1文字ずつの出現回数を数えます。大文字小文字を区別しない、英語の冠詞や日本語の助詞などよくある語を除外する、指定回数以上だけ表示する(最小出現数)といった調整も可能です。文章の繰り返し・口ぐせ・キーワードの偏り、SEO のキーワード密度、原稿の語彙の多様さの確認などに使えます。結果は CSV としてコピー、または保存できます(全件出力)。入力した文章は一切サーバーへ送らず、集計はすべてあなたの端末内で完結します。
使い方
- 頻度を調べたい文章を入力欄に貼り付けます(記事・レポート・文字起こしなど)。
- 数える単位を選びます。英語なら「単語」、日本語の語句を見たいなら「語句(N-gram)」でN文字を指定。必要に応じて大文字小文字の無視・一般語の除外・最小出現数を調整します。
- 下に多い順の頻度表が出ます。「CSV をコピー」または「CSV を保存」で全件を書き出せます。
よくある質問
入力した文章はサーバーに送信されますか?
いいえ。集計はすべてあなたのブラウザ内で動きます。入力した文章はアップロード・保存・送信されず、端末内だけで処理されます。原稿や社外秘の文章でも安心してお使いください。
日本語の単語の頻度を数えられますか?
「語句(N-gram)」モードを使ってください。日本語は単語の区切りに空白を使わないため、連続するN文字を1つの語句として数えます。Nを2にすると2文字単位、3にすると3文字単位で頻出フレーズを把握できます。形態素解析エンジンは使わない簡易方式のため、辞書に基づく厳密な単語分割とは結果が異なります。
N-gram(エヌグラム)とは何ですか?
テキストを連続するN個の文字(または語)に区切ったものです。例えば「頻度」をN=2で数えると「頻度」という2文字のかたまりが1つの単位になります。空白で単語を区切らない日本語でも、よく出てくる文字の並び=頻出フレーズを近似的に見つけられます。
「よくある語を除外」は何を消しますか?
単語モードのときに、英語の the / a / and / of などの機能語と、日本語の「の・に・は・を・が」などの助詞・頻出語を集計から除きます。内容語に絞って頻度を見たいときに使ってください(語句・文字モードでは適用されません)。
結果を Excel で開けますか?
はい。「CSV を保存」で書き出した CSV は Excel や Google スプレッドシートでそのまま開けます。文字化けを防ぐため BOM 付き UTF-8 で保存します。表示は上位500語までですが、CSV には条件に合うすべての語が含まれます。