Panasonicの読取革命Version14体験版をインストールして試してみました。
ざっと使ってみた感想はScanSnapについているOCRは完全に自動的に取り込みできる(画面上で操作する項目がない)、速度も速いような気がしました。読取革命では、画面上でスキャナから読み取ったイメージを画面に表示し、テキストに変換する境界領域の指定、修正ができるものの、ファイルによっては高圧縮PDFで保存したテキストデータの位置が正確に埋め込まれないためにPDF閲覧ソフトで開いて、マウスでテキストを選択するときに正確にコピーができない状態になってしまいます。高圧縮のPDFファイルの場合画像がページとして表示され位置的な座標にテキストが埋め込まれている形式なので、高圧縮フォーマットじゃなければこの現象は起きません。
まず、簡単モードと標準モードがあり、簡単モードではPDFファイルを指定して開き、取り込んだ画像が画面に一頁ずつ表示され、テキストの区域が選択されます。その後選択領域の修正モードになり、その後納得の行く区域を選択した後、一括認識、ファイルに保存というステップで変換します。
一括認識中は画面上に一頁ごとに認識中のテキスト選択が表示され今どの区域が変換されているか目で確認することができます。その後、取り込んだ画像とテキスト領域が同時に表示されOCRが変換したテキストを確認して修正するモードになります。選択区域、縦横の選択精度はかなり正確に選択されているように思われます。(保存後のPDFファイルのテキスト埋め込み位置は英語OSのせいかも知れませんので後日確認することがあったら修正します)詳細モードはこのステップを手で実行できる用になっています。保存形式もPDFにはPDF,PDF(透明テキスト)、PDF(高圧縮)、XPS、Text、HTMLと選択できます。
認識後保存ボタンで再度、認識した領域が表示されていき、その後ファイルの保存が終了します。(一瞬でファイル保存できないの?)
変換区域の修正、テキスト変換の修正を人間が目で確認しないといけないところは現代のコンピュータの悲しいところですね。ユーザ辞書登録みたいな機能はあるものの、そういうのはユーザに委ねるのではなく、一歩進んで内部辞書から、ありえない単語の自動補正とかもどうにかできないものかと思いました。(SpeechAppには漢字読みテーブルと語句補正も入れようと思います)
パナソニック 読み取り革命 ver.14
その他の機能としては、フォルダーウォッチャー。これは常に指定されたフォルダを監視しOCR対象のファイルがコピーされたら、そのファイルを変換して指定したフォルダに指定したフォーマットで保存できます。TXT、RTF、Excel、Wordと便利な形式で保存することができる点は〇です。
現時点では自宅でマイクロソフトオフィスを使う必要がないので、PDF、TXT、RTFで出力してみましたが、なぜかPDFファイルだけはフォルダーウォッチャーからOCRの処理をかけるとエラーが出て変換はできませんでした。これをScanSnapに付属のOCRと入れ替えて使うこともできそうです。(読み取り革命のインストール時にScanSnapの自動起動アプリに登録される)
最後に、デジタルカメラ監視機能。これは挿入されたリムーバブルディスクがデジカメのメモリであるかの判別を行い、デジカメの画像データがあった場合、その画像からOCRする事ができる監視アプリです。これもフォルダウォッチャーと同様システムトレイ上の常駐アプリで、メモリが挿入された時点でポップアップが表示されます。
全体的な感想としては、変換区域の選択された時点でもう少しアイディアがほしかった。たとえば語句の自動補正や外部プログラムの起動やマクロ、読み上げソフトのプラグイン等。マクロが使えるとページ番号のチェックや足りないページ、ページのヘッダやフッダの自動削除ができるようになったりします。
しかし画面上で、テキストの修正ができたり、区域の選択をして100%正確なテキスト変換に人間の工数をかけるならば、このソフトでいいと思います。まぁそんな需要はどのくらいあるのか不明ですがもし、そういう仕事の用途がある方は使ってみるのも良いでしょう。