これまで、Speech Platform 11 の動作テストの為に作成したアプリをアップします。
Speech App Version 0.1.20120723のダウンロードリンク
(このアプリを実行する前に、Speech Platform 11をこちらのページからダウンロードしてインストールしてください)
基本的な機能は以下のとおりです。
【UIの機能と内部処理】
1. テキストをキーボードから入力し、”Read”ボタンがクリックされたらテキストを読み上げる
2. Read, Clear, Pause, Resume, Stop, Exitの基本機能ボタン
3. SPEEDの設定
4. 最初の一文字目のユニコード文字から自動的に言語を検出する(今回は日本語と英語の判別のみ)
5. 外部コマンドからテキスト読み上げ中に実行された際に、キューに入れて渡されたテキストがなくなるまで読み込む
【外部コマンド処理】
1. コマンドとして実行されたときに渡されたテキストの読み上げ。LimeChatのマクロや、自動コマンド設定等で読み上げを実行できます。コマンドの例)SpeechApi.exe “読み上げテキスト”
2. “Settings”メニューから”Enable Clipboard Monitor”にチェックを入れることでCtl+C等でコピーされた、クリップボードのテキストが自動的に読み上げテキストに入力されます
【問題点】
1. “Enable Clipboard Monitor”をオンにし、Adobe ReaderでPDFファイルからCtl+cでテキストをコピーした際に、Adobe Readerでエラーが出る。(これはほかのPDFファイルリーダでは出ませんのでAdobeの問題です)AdobeではないPDFリーダーを使いましょう。(^^;)
【これから盛り込んでいくものや、改善が必要と思われる点等】
1. マイクロソフトのSpeech Platform 11にそのまま漢字を含んだテキストを渡しているが、作者に似てあまりにも漢字の読みが弱い。自分で漢字の読み変換テーブルを作る必要がありそう。変換テーブルは漢字だけじゃなく外国語の単語変換で、翻訳に拡張できそう。
2. 記号をそのまま記号名として読んでしまう。(”・・・”や、”「」”など)
3. ユニコード文字を認識して、各国語の自動認識サポート。Speech Platformは言語にあったテキストデータを渡されなかった場合、沈黙してしまう。(このくらいAPIで勝手にやってよね。ま、その辺がマイクロソフトらしいところなんだけど)
4. A.I.的な自動返答ができてもいいかも。 (Speech Platformの音声認識もそのうち使ってみよう)
5. 入力したテキストコマンドによって、ネット上のアップデートの読み上げとか。