読者です 読者をやめる 読者になる 読者になる

そとでよ - 元ひきこもりのブログ

元ひきこもりのあれこれ。一応就職決まりました。

翻訳かけたい文章が画像ファイルで困った時の対策方法

メモ OCR ヒトラーの忘れもの

海外の記事などを検索していると、画像ファイルしかなく、そのままでは自動翻訳に突っ込めないことがたまにあります。 最悪、自分で地道に打ち起こす方法もありますが、長文の場合現実的ではありません。キリル文字とか完全にお手上げです。

そんな時はOCRで機械に文字起こししてしまえばいいということで、ネット上にフリーのOCRサイトがあったので使って見ようと思います。

Free Online OCR - convert scanned PDF and images to Word, JPEG to Word

f:id:bi_mini:20170219025612p:plain
テスト用に複数のフォントで同じ文字列を打ったpngファイルを作ってみました。

f:id:bi_mini:20170219030431p:plain

  1. をクリックして文字起こししたいファイルを選びます。ファイルは5mbまで。PDFの他、JPG、BMPTIFF、GIFに対応しているようですが、PNGも行けました。
  2. で言語を選びます。大抵の言語はあります。もちろん日本語も。今回は英語なのでENGLISHを選択。
  3. 出力形式を選びます。ワード、エクセル、テキストの3種類から選べます。

f:id:bi_mini:20170219031015p:plain
画像を選ぶと青い進行バーとファイル名が表示されて文字起こしがはじまります。 1.1に表示されている文字列を 2.2のフォームに打ち込んで、 3.そのままエンターキーを押すか3のコンバートボタンを押します。

f:id:bi_mini:20170219031508p:plain

  1. をクリックするとファイルがダウンロードできます。
  2. に読み取られたテキストが表示されます。コピペもできるので普通はこれで十分でしょう。

3つ目はフォントが特徴的すぎたためか、きちんと文字に起こせていませんが、一般的なフォントであれば問題なく文字起こしができそうですね。

困った際のお役に立てば幸いです。

余談:相変わらず「ヒトラーの忘れもの」関連記事をワールドワイドにググってます。 デンマーク語とドイツ語が分からないので、検索するのも一苦労ですが、面白い記事を見つけた時はグッときますね。

https://style-magazin.ch/fashion/mein-stil/bad-boy

ヘルムート役のジョエル・バスマンは今作を見てもわかる通り、非常に軍装が似合うせいか、これまでも度々軍人役を演じており(IMDBで今後の出演作を見ても軍もの多し。「ヒトラーの忘れもの」効果かなと思いますが)、「ミケランジェロ・プロジェクト」でも名もないドイツ軍人役を演じたそうです(未見なのでそのうち見ます)が、彼自身は父がユダヤ人で、自身の外見がユダヤ人というよりはむしろナチス的なのは逆説的だと思っているようです。演じる上では特に葛藤とかはないそうです。

両親が仕立て屋をしている影響で、彼本人も俳優活動の傍ら、ファッションデザイナーとしても活動しています。

Joel Basman: Mein Traumziel: Bond-Bösewicht! - Blick

役者としての夢はボンド映画の悪役を演じること。ヴィラン志望なんですね。冷笑的な役がとても似合いそうなのでいいと思います。いつか見れるといいなぁ。