そとでよ - 元ひきこもりの気ままな暮らし

元ひきこもりの気ままな生活。ひきこもりをしていましたが就職しました。

翻訳かけたい文章が画像ファイルで困った時の対策方法

海外の記事などを検索していると、画像ファイルしかなく、そのままでは自動翻訳に突っ込めないことがたまにあります。 最悪、自分で地道に打ち起こす方法もありますが、長文の場合現実的ではありません。キリル文字とか完全にお手上げです。

そんな時はOCRで機械に文字起こししてしまえばいいということで、ネット上にフリーのOCRサイトがあったので使って見ようと思います。

Free Online OCR - convert scanned PDF and images to Word, JPEG to Word

f:id:bi_mini:20170219025612p:plain
テスト用に複数のフォントで同じ文字列を打ったpngファイルを作ってみました。

f:id:bi_mini:20170219030431p:plain

  1. をクリックして文字起こししたいファイルを選びます。ファイルは5mbまで。PDFの他、JPG、BMPTIFF、GIFに対応しているようですが、PNGも行けました。
  2. で言語を選びます。大抵の言語はあります。もちろん日本語も。今回は英語なのでENGLISHを選択。
  3. 出力形式を選びます。ワード、エクセル、テキストの3種類から選べます。

f:id:bi_mini:20170219031015p:plain
画像を選ぶと青い進行バーとファイル名が表示されて文字起こしがはじまります。 1.1に表示されている文字列を 2.2のフォームに打ち込んで、 3.そのままエンターキーを押すか3のコンバートボタンを押します。

f:id:bi_mini:20170219031508p:plain

  1. をクリックするとファイルがダウンロードできます。
  2. に読み取られたテキストが表示されます。コピペもできるので普通はこれで十分でしょう。

3つ目はフォントが特徴的すぎたためか、きちんと文字に起こせていませんが、一般的なフォントであれば問題なく文字起こしができそうですね。

困った際のお役に立てば幸いです。