Windows8.1で動作する中国語OCRフリーソフト

無料中国語OCRソフトを使用して、Windows XP~Windows7で動作するものについて、このページに書いたが、果たしてWindows8.1ではどうなのか検証してみた。

(1)Microsoft AppLocale Utilityと中国語コードのFeng-OCR
ダウンロードしてきたapploc.msiは他のOSなら、インストールにちょっと手間がかかったが、Windows8.1ではダウンロードフォルダを選択して、「ファイル/コマンドプロンプトを管理者として開く」でapploc.msiを指定してやると簡単にできた。

ここを出発点にしてインストールを進めて行くと、スタートメニューに登録され起動もできた。
次にFeng-OCR(中国語)試用版を自動解凍して、インストールしようとすると、「このアプリはお使いのPCでは実行できません」が出てインストールを断念。32ビットのパソコンならいいのかも知れないが、インストールしていないので確認できない。

(2)COCR2
この中国語OCRはこのページで紹介したが、ここでの確認はWindows Vista。このアプリはレジストリを使用しないタイプなので、Windows8.1でも動作するのではないかと思ったが、当たった。一文字、一文字認識していくタイプなので、時間がかかる。日本語と同じ文字は日本語IMEで入力し、中国語の部分だけを認識させると少し早い。


(3)Ground True Text
このOCRソフトは知らなかった。Windows8対応と言うことで探したら、ヒットした。ダウンロードは次のサイトからhttp://ground-truth-text.softonic.jp/
できる。
このアプリは初めてなので、ポイントとなる点を書いておこう。インストールが終わり、このアプリを起動したら、先ず最初にやることは各言語のコンポーネントを「File/Preferences.../Add languages」で、インストールしておくこと。そして、「Text Recognition Language」で、該当する言語を選択するとその言語で使えるようになる。ここで、テストのため、COCR2で使用したのと同じ画像でやってみた。
画像を範囲選択すると、認識が始まった。結果はこの通りだが、だいぶ違う。再実行やっても同じ。ここで「続行」をやると、結果がクリップボードにコピーされる。もし、もっと字体の綺麗な印刷物からだと、もっと認識率が上がるのかも知れない。

 

(4)Googleドライブ
ここまで書いてきて、Google DocumentsにもOCR機能があったことを思い出した。早速、ログインしてやろうとしたが見当たらない。ネットで調べると、今はGoogle ドライブにあるという。でも、ドライブ内のどこにもOCRという文字はない。更に調べるとログインしたGoogleドライブ上でOCRの機能をONにして、画像ファイルをアップロードするとき、文字に変換される事がわかった。
方法は画面左上の星印をクリックし、「設定/アップロード設定」で次のようにすると良い。
※新しいドライブ レイアウトでは設定が違うので要注意。2014/12/23現在

そして、「ドライブ/アップロードアイコン/ファイル」で、OCRしたいローカルドライブの画像ファイルを選択。

「アップロード設定」の画面が出たら、
□PDFや画像ファイルからテキストをGoogleドキュメントのドキュメントに変換する にチェックを入れ、ドキュメントの言語をプルダウンメニューから選択。
□アップロード前に、毎回設定を確認する にもチェックを入れたほうが使いやすい。

上と同じ画像でやると、これだが、なぜか一部しか文字化されていない。だが、文字の認識度は高いと言える。
假冒品,各种假冒的 各种假冒的名牌商品 搞得头疼,他们想了: 口处加贴了带有特殊 的手电式射灯观察,

それでは、繁体字の小樽市指定的歴史建造物の案内板でやって見ると、

これも一部、欠落している。未だ発展途上か。でも、字画の多い文字でも良く認識している。
Windows8.1で中国語OCRを無料でやる方法は今の所、上記三つだがGoogleドライブのOCR機能が今度も進化を遂げて行きそうだ。

★関係ページ:小樽市指定歴史的建造物