化けたテキスト
復元候補
化けたテキストを貼り付けると、文字コードを推定して読める形の候補を表示します(アップロードなし)。
「譁・ュ怜喧縺」「café」「ã?‚りã?Œã?¨ã?†」——メールやCSV、Web ページからコピーしたテキストがこんなふうに文字化けして読めない。そんなときに、化けた文字列を貼り付けるだけで元の読める文章に戻すツールです。文字化けの多くは「本当は UTF-8 の文字を、別の文字コード(Shift_JIS や EUC-JP、Windows-1252 など)として誤って開いてしまった」ことで起きます。このツールは、貼り付けた化け文字を「もし◯◯として開いたのなら、元のバイト列はこうだったはず」と逆算し、それを UTF-8 として読み直して復元候補を作ります。Shift_JIS で誤読したパターン、EUC-JP で誤読したパターン、西欧(Latin-1/Windows-1252)で誤読したパターンを同時に試し、読めそうな順に候補を並べます。一番上の「おすすめ」が最有力で、日本語の文字数も表示するので、見比べて正しいものを選び「コピー」するだけです。仕組みとして、文字コードの推定・逆エンコード・UTF-8 への再デコードのすべてを、あなたのブラウザの中(JavaScript)だけで実行します。逆引き表はブラウザに元から入っている変換機能から実行時に組み立てるため、追加のソフトや辞書ファイルは要りません。だから貼り付けたテキストはサーバーへ一切アップロード・保存・送信されません。社内メールの抜粋・顧客名簿・ソースコードなど、外部の変換サイトに貼りたくない業務テキストでも安心です(会社や役所の規定で外部アップロードが禁止されている環境にも向いています)。注意:いったん「?」や「□」に化けてしまった文字(元のバイト情報が失われた壊れ方)は、原理的に復元できません。その場合は候補が出ないか、一部が欠けたままになります。ファイル単位で文字コードを変換し直したいときは encoding-convert、CSV の文字化けを表で確認しながら直したいときは csv-encoding もどうぞ。
使い方
- 文字化けしたテキストをコピーし、「化けたテキスト」欄に貼り付けます(ファイルを開く必要も、ソフトのインストールも不要)。
- 貼り付けると同時に、Shift_JIS/EUC-JP/西欧の誤読を逆算した復元候補が読めそうな順に表示されます。一番上が「おすすめ」です。
- 正しく読める候補の「コピー」を押して使います。テキストはどこにもアップロードされません。
よくある質問
なぜ文字化けは起きて、このツールはどうやって直すのですか?
文字化けの多くは、本来 UTF-8 で書かれた文字を、Shift_JIS や EUC-JP、Windows-1252 といった別の文字コードとして開いてしまうことで起きます。このツールは貼り付けた化け文字を「もしその文字コードで開いたのなら、元のバイト列はこうだったはず」と逆算し、それを UTF-8 として読み直して復元します。複数の誤読パターンを同時に試し、読めそうな順に候補を並べます。
貼り付けたテキストはサーバーに送られますか?
いいえ。文字コードの推定・逆エンコード・再デコードのすべてをあなたの端末内(JavaScript)で実行します。アップロード・保存・送信は一切ありません。社内メールの抜粋・名簿・ソースコードなど、外部の変換サイトに貼りたくない業務テキストや、外部アップロードが禁止された環境でも安心して使えます。
「?」や「□」になった文字も元に戻せますか?
いいえ。いったん「?」や「□」「�」に置き換わってしまった文字は、元のバイト情報そのものが失われているため、原理的に復元できません。このツールが直せるのは、別の文字コードとして読み込んだことで化けた(バイト情報は残っている)タイプの文字化けです。
Shift_JIS や EUC-JP 以外の文字化けにも対応していますか?
「café」「été」のような西欧言語の文字化け(Latin-1/Windows-1252 として誤読されたパターン)にも対応しています。日本語と西欧の主要な誤読パターンを同時に試し、最も読めそうな候補を上位に表示します。
ファイルや CSV の文字化けを直したいときは?
ファイル単位で文字コードを変換し直したいときは encoding-convert(テキストファイルを UTF-8/Shift_JIS/EUC-JP に変換)、CSV を表で確認しながら直したいときは csv-encoding が便利です。このツールは、画面に貼り付けた化け文字列を素早く読める形に戻す用途に向いています。