レイアウト

ページ

ページ区切りを入れる

PDF をここにドロップ

クリックして選択

ブラウザ内で処理 · アップロードなし

別のファイルをドロップ / クリック

PDF に書かれた文字（テキスト層）を取り出せる完全無料のツールです。PDF をドラッグ&ドロップすると、各ページの文字をその場で抽出して表示します。整え方は「改行を保つ」（元のレイアウトに近い行で取り出す）と「段落につなげる」（無駄な改行をつないで読みやすい文章にする）の2つから選べます。Word やエクセルに貼り付けたいときや、引用・検索のために本文だけ欲しいときに便利です。「ページ」欄に「1-3,5」のように書けば、必要なページだけを抽出できます。「ページ区切りを入れる」を選ぶと、ページの境目に「--- 2 ---」のような目印が入ります。取り出した文字は「コピー」でクリップボードへ、「.txt を保存」で UTF-8 のテキストファイルとして書き出せます。PDF ビューアで文字を選択・コピーできない場合でも、PDF にテキスト層があればこのツールで取り出せます（コピー禁止の設定に左右されにくい）。一方、スキャンした紙の PDF など中身が画像だけのものは、文字データを持たないため抽出できません（OCR＝画像内の文字認識には対応していません。その場合はテキスト層のある PDF をご利用ください）。読み込みと抽出はすべてあなたのブラウザ内の JavaScript（pdf.js）で実行され、PDF はサーバーへアップロード・保存・送信されません。インストールも会員登録も不要なので、社外秘の資料や申請書でも安心して使えます。なお、PDF を画像にしたいときは「PDF → 画像」、文字化けしたテキストを直したいときは「文字化け修復」、文字コードを変換したいときは「文字コード変換」をご利用ください。

使い方

PDF をドラッグ&ドロップします。クリックしてファイルを選ぶこともできます。各ページの文字がすぐに抽出されます。
整え方を「改行を保つ」か「段落につなげる」から選びます。必要なら「ページ」欄に 1-3,5 のように抽出範囲を指定します。
「ページ区切りを入れる」を選ぶと、ページの境目に目印（--- 2 ---）が入ります。
「コピー」でクリップボードへ、「.txt を保存」でテキストファイルとして書き出します。PDF はどこにも送信されません。

よくある質問

PDF ビューアで文字をコピーできないのですが、抽出できますか？

PDF にテキスト層（文字データ）があれば取り出せます。ビューア側でコピーが効かない場合でも、このツールはページの文字データを直接読むため、テキスト層があるものは抽出できることが多いです。ただし中身が画像だけのスキャン PDF は文字データを持たないため抽出できません（次の質問を参照）。

スキャンした紙の PDF（画像）からも文字を取り出せますか？

いいえ。このツールは PDF に埋め込まれたテキスト層を読み取るもので、画像内の文字を認識する OCR には対応していません。スキャンしただけの PDF は中身が画像で文字データを持たないため、抽出すると空になります。文字データを含む（パソコンで作成された）PDF をご利用ください。

改行がバラバラになります。きれいにできますか？

「段落につなげる」を選ぶと、行の途中で入っている改行をつないで読みやすい文章にできます。逆に元のレイアウトに近い形で取り出したいときは「改行を保つ」を選んでください。Word やエクセルに貼り付ける用途に合わせて切り替えられます。

特定のページだけ抽出できますか？

はい。「ページ」欄に「1-3,5」のように指定すると、その範囲だけを抽出します。空欄なら全ページが対象です。「ページ区切りを入れる」を選べば、どこからどこまでが何ページ目かが分かる目印も入れられます。

読み込んだ PDF はサーバーに送信されますか？

いいえ。読み込みとテキスト抽出はすべてあなたのブラウザ内の JavaScript（pdf.js）で行われます。PDF はサーバーへアップロード・保存・送信されません。インストールも会員登録も不要なので、社外秘の資料でも安心して使えます。