PDF をここにドロップ
クリックして選択
ブラウザ内で処理 · アップロードなし
別の画像をドロップ / クリック
PDF に書かれた文字(テキスト層)を取り出せる完全無料のツールです。PDF をドラッグ&ドロップすると、各ページの文字をその場で抽出して表示します。整え方は「改行を保つ」(元のレイアウトに近い行で取り出す)と「段落につなげる」(無駄な改行をつないで読みやすい文章にする)の2つから選べます。Word やエクセルに貼り付けたいときや、引用・検索のために本文だけ欲しいときに便利です。「ページ」欄に「1-3,5」のように書けば、必要なページだけを抽出できます。「ページ区切りを入れる」を選ぶと、ページの境目に「--- 2 ---」のような目印が入ります。取り出した文字は「コピー」でクリップボードへ、「.txt を保存」で UTF-8 のテキストファイルとして書き出せます。PDF ビューアで文字を選択・コピーできない場合でも、PDF にテキスト層があればこのツールで取り出せます(コピー禁止の設定に左右されにくい)。一方、スキャンした紙の PDF など中身が画像だけのものは、文字データを持たないため抽出できません(OCR=画像内の文字認識には対応していません。その場合はテキスト層のある PDF をご利用ください)。読み込みと抽出はすべてあなたのブラウザ内の JavaScript(pdf.js)で実行され、PDF はサーバーへアップロード・保存・送信されません。インストールも会員登録も不要なので、社外秘の資料や申請書でも安心して使えます。なお、PDF を画像にしたいときは「PDF → 画像」、文字化けしたテキストを直したいときは「文字化け修復」、文字コードを変換したいときは「文字コード変換」をご利用ください。
使い方
- PDF をドラッグ&ドロップします。クリックしてファイルを選ぶこともできます。各ページの文字がすぐに抽出されます。
- 整え方を「改行を保つ」か「段落につなげる」から選びます。必要なら「ページ」欄に 1-3,5 のように抽出範囲を指定します。
- 「ページ区切りを入れる」を選ぶと、ページの境目に目印(--- 2 ---)が入ります。
- 「コピー」でクリップボードへ、「.txt を保存」でテキストファイルとして書き出します。PDF はどこにも送信されません。
よくある質問
PDF ビューアで文字をコピーできないのですが、抽出できますか?
PDF にテキスト層(文字データ)があれば取り出せます。ビューア側でコピーが効かない場合でも、このツールはページの文字データを直接読むため、テキスト層があるものは抽出できることが多いです。ただし中身が画像だけのスキャン PDF は文字データを持たないため抽出できません(次の質問を参照)。
スキャンした紙の PDF(画像)からも文字を取り出せますか?
いいえ。このツールは PDF に埋め込まれたテキスト層を読み取るもので、画像内の文字を認識する OCR には対応していません。スキャンしただけの PDF は中身が画像で文字データを持たないため、抽出すると空になります。文字データを含む(パソコンで作成された)PDF をご利用ください。
改行がバラバラになります。きれいにできますか?
「段落につなげる」を選ぶと、行の途中で入っている改行をつないで読みやすい文章にできます。逆に元のレイアウトに近い形で取り出したいときは「改行を保つ」を選んでください。Word やエクセルに貼り付ける用途に合わせて切り替えられます。
特定のページだけ抽出できますか?
はい。「ページ」欄に「1-3,5」のように指定すると、その範囲だけを抽出します。空欄なら全ページが対象です。「ページ区切りを入れる」を選べば、どこからどこまでが何ページ目かが分かる目印も入れられます。
読み込んだ PDF はサーバーに送信されますか?
いいえ。読み込みとテキスト抽出はすべてあなたのブラウザ内の JavaScript(pdf.js)で行われます。PDF はサーバーへアップロード・保存・送信されません。インストールも会員登録も不要なので、社外秘の資料でも安心して使えます。