HTSの学習用データの作成
※2012/01/03現在のものです。
※VirualBox上に構築したUbuntu 10.04を元に記述しています。
※自作ツールの関係上、WindowsとUbuntuの間でデータの受け渡しが必要になります。
※CUBE370が普段行っている手順をまとめたものです。間違ってたらゴメンナサイ
必要なもの
HTSの学習用データを作成する上で、以下のものが必要となります。
- julius-4.2.1-linuxbin
- Ubuntuへインストールします。
- ダウンロード:http://julius.sourceforge.jp/
- QUICK DOWNLOAD > Binary for Linux (tarball) から julius-4.2.1-linuxbin.tar.gz をダウンロードしてください。
- dictation-kit-v4.1
- Ubuntuへインストールします。
- ダウンロード:http://julius.sourceforge.jp/index.php?q=dictation-kit.html
- ダウンロードの項目から dictation-kit-v4.1.tar.gz をダウンロードしてください。
- segmentation-kit-v4.0
- Ubuntuへインストールします。
- ダウンロード:http://julius.sourceforge.jp/index.php?q=ouyoukit.html
- 上記のページから segmentation-kit-v4.0.tar.gz をダウンロードしてください。
- Switch Sound File Converter
- Windowsへインストールします。
- ダウンロード:http://www.nch.com.au/switch/index.html
- 上記のページから switchsetup.exe をダウンロードしてください。
- ATR503文章読み上げデータ
- Windowsのほうへ用意してください。
- ATR503文章を読み上げたwavファイルを準備してください。
- フォーマットは48kHz、16bit、モノラルにしてください。
- 素材の詳しい準備方法は以降の項目で解説しています。
インストール
- ファイルパスは適宜読み換えてください。
- 例ではホームディレクトリ(/home/cube370)にJuliusディレクトリ(/hpme/cube370/Julius)を作成しています。
- Juliusのインストール ※Ubuntuへインストールします。
- julius-4.2.1-linuxbin.tar.gz を解凍します。
- 解凍した julius-4.2.1-linuxbin ディレクトリにある全てのファイルをJuliusディレクトリ(/hpme/cube370/Julius)にコピーします。
- dictation-kitのインストール ※Ubuntuへインストールします。
- dictation-kit-v4.1.tar.gz を解凍します。
- 解凍した dictation-kit-v4.1 ディレクトリにある以下のディレクトリとファイルをJuliusディレクトリ(/hpme/cube370/Julius)にコピーします。
- model/
- HOWTO.txt
- TROUBLE.txt
- fast.jconf
- light.jconf
- segmentation-kitのインストール ※Ubuntuへインストールします。
- 解凍した segmentation-kit-v4.0 ディレクトリをJuliusディレクトリ(/hpme/cube370/Julius)にコピーします。
- Switch Sound File Converterのインストール ※Windowsへインストールします。
- ダウンロードした switchsetup.exe を実行して、指示に従ってインストールします。
サンプルの実行
メモ
初期設定だとJuliusは無音(value=0)でエラー(正確にはwarning)を出して、wavファイルを正確に読み込めない可能性がある。
上記の問題を回避するために、ラベル付け用のwavファイルにわざとノイズ(音声データに影響が出ない程度)を付加すると良い・・・かも。
- 最終更新:2012-01-05 12:58:12