最近、よくネットで話題になっている電子書籍。日本の出版社はすこし出遅れた感があります。アップルのタブレット(iPad)の発売や、アマゾンのKindleの発売でタブレットの使い道のひとつとして理想だと考えている人が多いようですね。
本の保管場所に困らない、その上どこにでも持ち運びが可能。今ではフラッシュディスク64GB内臓タブレットも安くなっていて、いいこと尽くめに思えます。
ちなみに、今日の時点で技術的な専門書、文庫本、まんが本、音楽の譜面、音楽CDのブックレットやら、DVDのジャケットやら1000冊以上は電子化しましたが、毎回スキャンした時点でその本をどう処分するかに困ってしまいます。さすがに特に現役で使う専門書等や参考書は穴を開けてバインダーに保管したりしていますが、電子化した後は、紙も電子書籍もその本はまったく読まなくなっているような気がします。たぶん全ページをスキャンするという作業工程で、全体を眺めるようなことになるのでしばらくは見なくてもよいおなかいっぱい状態になるのだと思います。下の写真は本のなかみを捨てて表紙を保存しているファイルです。。
Fujitsu ScanSnap S300


スキャン後の表紙カバーを保管したクリアファイル
電子化した本の保存方法は今でもいい方法は見つかっていませんが、B5,A4サイズならルーズリーフサイズにしてバインダーに保管しておくのもいいかもしれませんね。穴を開けたくない場合はそのまま古本屋で使われているような透明な袋に入れて保存するのも良いでしょう。(これだとまた、保管場所が必要になり袋があるせいですぐにぱら見ができないのであまり意味はありませんけどね)究極系だと、カラーのレーザプリンタを使ってPDFを印刷しなおして全部A4サイズにまとめて統一されたバインダに入れて保存しておくとかも考えられますね。
カール ゲージパンチ・ネオ(26・30穴)
写真は、もう3年くらい愛用しているFujitsu ScanSnap S300ですが、今でも調子がよくてぜんぜん壊れるような感じはありません。毎日2,3冊カッターで本を切ってスキャンし続けています。(自炊という言葉はあまり好きではありませんね。せめてDIYとか言ってほしいです)ちなみにこの2機種は現行モデルS1300と、S1500です。スキャン速度が少し速くなってソフトウェアが新しくなっているようですが、今のところS300で十分です。
Fujitsu ScanSnap S1300
Fujitsu ScanSnap S1500
本をPDF化する目的はタブレットで読むことが前提ですが、OCRでテキスト化したテキストデータをパソコンに読み上げてもらうということにも使っています。先日公開したSPEECHAPPテスト版を立ち上げ、Ctl+Cでクリップボードにコピーし、(テキストがそのままSppechAppに入力される)Readボタンをクリックして読み上げてもらいます。クリップボードにコピーされた時点で読み上げを開始してもいいのですが、それだと他のアプリの操作で読み上げられる事もあるので)あとはできれば薄型で大型のフルHDテレビを壁に貼ってリモコンや、キネクトを使ったジェスチャで読めるようになるといいですね。
そこでクリップボードコピーでAdobe Readerに問題点があります。SPEECHAPPテスト版のページにも書いていますが、Adobe ReaderからテキストをクリップボードにコピーするとAdobeがエラーを出すのです。クリップボードにコピーされたテキストが横取りされていることをモニタしているのか、セキュリティの問題かはわかりませんが(開発系のウェブではクリップボードのデータを処理するタイミング的なものと書かれていた)が、こんなエラーは他のアプリではでないのでAdobeさん、PDFの本家なんだから治して下さい。あとついでに、Flashや、Photoshopのアプリが重い件、AdobeAirとかも良くわからないけど、さくさく感を感じない件、アップデートのポップアップがやたら煩くてシステムトレイでひそかにメモリを食ってる件、直してください。最終的にはPDFで保存しなくても普通のテキストでもいいんだけどね。将来的にはSPEECHAPPをWindows7のDirectWriteを使ったスムースなフォントで表示させるようにして、PDFファイルも開けるようになるとりそうかなぁ
OCRの性能にも問題はあります。OCRはどうも横書き文書は大体性格に変換できるものの、縦書き文章や、段落やフォーマットのある文章で、ブロックの認識順序がおかしくなる事がよくあります。Ctl+Aの全選択で性格にコピーできると良いのですが、最後のブロックが先になったり段差で誤字になったり本からスキャンしたデータではこんなものなのでしょうか。ScanSnapに付属してきたOCRと、Panasonicの読み取り革命の体験版のレビューはまた後日。。。
パナソニック 読み取り革命 ver.14
あとは、DVDや音楽CDもプラケースはすべて捨てました。大量にある音楽CDとDVDメディアは無印良品のCDフォルダに保存し、ブックレットは別な箱に保存するようにしています。DVDはケースからジャケットを引き抜いて、最高画質のJPGで保存します。スクリーンセーバとか閲覧がとても便利になります。音楽CDのブックレットなどはホッチキスをはずして最高画質でPDFファイルに。ジャネットの表示と裏表紙は最高画質でJPGにし、iTunesでネットからダウンロードできなかったジャケットの画像をファイルに埋め込みます。(現在はMP3の音質があまりにもわるいので、アップル・ロスレスエンコーダでCDからエンコードしています。この件はまた今度詳しく。WASAPIとかアプリ作ったときに。。。)
こうなってくると、なんでも開けるファイル閲覧ソフトがほしくなってきます。なぜか、ファイルがPDFだからAdobeとか、エクセルだからオフィスとか・・・そういうのうざい。昔で言う、ファイラー。今で言うファイルブラウザ(?)シェル(?)ですね。Windowsはエクスプローラですがエクスプローラはそのファイルに関連付けられたソフトを起動するラウンチャに過ぎないので、すべてのデータファイルが読めて、画像、文章、音声のデータが関連付けられて、一本のソフトで表示再生がコントロールできるといい感じになるのではと思います。マルチウィンドウとか、Windows8のタイルとかメトロとか正直どーでもいーしね。
パナソニックのOCR関係の製品を見ていたら、「ファイル管理革命」なるソフトを発見しました。オフィスのドキュメントファイルの変換や閲覧ができて統合された感じがいい感じです。
あとはこのブログの最終目的である音声認識や人工知能的なもので、情報収集や蓄積できるといいかな。
ではまた。