HTSの学習用データの作成

※2012/01/03現在のものです。
※VirualBox上に構築したUbuntu 10.04を元に記述しています。
※自作ツールの関係上、WindowsとUbuntuの間でデータの受け渡しが必要になります。
※CUBE370が普段行っている手順をまとめたものです。間違ってたらゴメンナサイ


必要なもの

HTSの学習用データを作成する上で、以下のものが必要となります。

  • julius-4.2.1-linuxbin
    • Ubuntuへインストールします。
    • ダウンロード:http://julius.sourceforge.jp/
    • QUICK DOWNLOAD > Binary for Linux (tarball) から julius-4.2.1-linuxbin.tar.gz をダウンロードしてください。
  • dictation-kit-v4.1
  • segmentation-kit-v4.0
  • Switch Sound File Converter
  • ATR503文章読み上げデータ
    • Windowsのほうへ用意してください。
    • ATR503文章を読み上げたwavファイルを準備してください。
    • フォーマットは48kHz、16bit、モノラルにしてください。
    • 素材の詳しい準備方法は以降の項目で解説しています。

インストール

  • ファイルパスは適宜読み換えてください。
  • 例ではホームディレクトリ(/home/cube370)にJuliusディレクトリ(/hpme/cube370/Julius)を作成しています。

  • Juliusのインストール ※Ubuntuへインストールします。
  1. julius-4.2.1-linuxbin.tar.gz を解凍します。
  2. 解凍した julius-4.2.1-linuxbin ディレクトリにある全てのファイルをJuliusディレクトリ(/hpme/cube370/Julius)にコピーします。

  • dictation-kitのインストール ※Ubuntuへインストールします。
  1. dictation-kit-v4.1.tar.gz を解凍します。
  2. 解凍した dictation-kit-v4.1 ディレクトリにある以下のディレクトリとファイルをJuliusディレクトリ(/hpme/cube370/Julius)にコピーします。
    • model/
    • HOWTO.txt
    • TROUBLE.txt
    • fast.jconf
    • light.jconf

  • segmentation-kitのインストール ※Ubuntuへインストールします。
  1. 解凍した segmentation-kit-v4.0 ディレクトリをJuliusディレクトリ(/hpme/cube370/Julius)にコピーします。

  • Switch Sound File Converterのインストール ※Windowsへインストールします。
  1. ダウンロードした switchsetup.exe を実行して、指示に従ってインストールします。

サンプルの実行


メモ

初期設定だとJuliusは無音(value=0)でエラー(正確にはwarning)を出して、wavファイルを正確に読み込めない可能性がある。
上記の問題を回避するために、ラベル付け用のwavファイルにわざとノイズ(音声データに影響が出ない程度)を付加すると良い・・・かも。

  • 最終更新:2012-01-05 12:58:12

このWIKIを編集するにはパスワード入力が必要です

認証パスワード