レイアウト
ページ

PDF をここにドロップ

クリックして選択

ブラウザ内で処理 · アップロードなし

別の画像をドロップ / クリック

PDF に書かれた文字(テキスト層)を取り出せる完全無料のツールです。PDF をドラッグ&ドロップすると、各ページの文字をその場で抽出して表示します。整え方は「改行を保つ」(元のレイアウトに近い行で取り出す)と「段落につなげる」(無駄な改行をつないで読みやすい文章にする)の2つから選べます。Word やエクセルに貼り付けたいときや、引用・検索のために本文だけ欲しいときに便利です。「ページ」欄に「1-3,5」のように書けば、必要なページだけを抽出できます。「ページ区切りを入れる」を選ぶと、ページの境目に「--- 2 ---」のような目印が入ります。取り出した文字は「コピー」でクリップボードへ、「.txt を保存」で UTF-8 のテキストファイルとして書き出せます。PDF ビューアで文字を選択・コピーできない場合でも、PDF にテキスト層があればこのツールで取り出せます(コピー禁止の設定に左右されにくい)。一方、スキャンした紙の PDF など中身が画像だけのものは、文字データを持たないため抽出できません(OCR=画像内の文字認識には対応していません。その場合はテキスト層のある PDF をご利用ください)。読み込みと抽出はすべてあなたのブラウザ内の JavaScript(pdf.js)で実行され、PDF はサーバーへアップロード・保存・送信されません。インストールも会員登録も不要なので、社外秘の資料や申請書でも安心して使えます。なお、PDF を画像にしたいときは「PDF → 画像」、文字化けしたテキストを直したいときは「文字化け修復」、文字コードを変換したいときは「文字コード変換」をご利用ください。

使い方

  1. PDF をドラッグ&ドロップします。クリックしてファイルを選ぶこともできます。各ページの文字がすぐに抽出されます。
  2. 整え方を「改行を保つ」か「段落につなげる」から選びます。必要なら「ページ」欄に 1-3,5 のように抽出範囲を指定します。
  3. 「ページ区切りを入れる」を選ぶと、ページの境目に目印(--- 2 ---)が入ります。
  4. 「コピー」でクリップボードへ、「.txt を保存」でテキストファイルとして書き出します。PDF はどこにも送信されません。

よくある質問

PDF ビューアで文字をコピーできないのですが、抽出できますか?

PDF にテキスト層(文字データ)があれば取り出せます。ビューア側でコピーが効かない場合でも、このツールはページの文字データを直接読むため、テキスト層があるものは抽出できることが多いです。ただし中身が画像だけのスキャン PDF は文字データを持たないため抽出できません(次の質問を参照)。

スキャンした紙の PDF(画像)からも文字を取り出せますか?

いいえ。このツールは PDF に埋め込まれたテキスト層を読み取るもので、画像内の文字を認識する OCR には対応していません。スキャンしただけの PDF は中身が画像で文字データを持たないため、抽出すると空になります。文字データを含む(パソコンで作成された)PDF をご利用ください。

改行がバラバラになります。きれいにできますか?

「段落につなげる」を選ぶと、行の途中で入っている改行をつないで読みやすい文章にできます。逆に元のレイアウトに近い形で取り出したいときは「改行を保つ」を選んでください。Word やエクセルに貼り付ける用途に合わせて切り替えられます。

特定のページだけ抽出できますか?

はい。「ページ」欄に「1-3,5」のように指定すると、その範囲だけを抽出します。空欄なら全ページが対象です。「ページ区切りを入れる」を選べば、どこからどこまでが何ページ目かが分かる目印も入れられます。

読み込んだ PDF はサーバーに送信されますか?

いいえ。読み込みとテキスト抽出はすべてあなたのブラウザ内の JavaScript(pdf.js)で行われます。PDF はサーバーへアップロード・保存・送信されません。インストールも会員登録も不要なので、社外秘の資料でも安心して使えます。