YouTube などで動画を見ていると良く見るものの一つに、テキスト読み上げ(テキストトゥスピーチ)を音声に利用した動画がある。特にゆっくりボイスと呼ばれる softalk を利用したものは非常に人気で、一つのジャンルとして成り立っている。
テキスト読み上げというといかにも機械が喋っているということがわかるような棒読み感や不自然なアクセントがあるものだが、最近は機械学習を用いた音声合成技術が発達しており、より自然な音声を作成できるようになった。
テキスト読み上げアプリには無料有料ともにいくつかあるが、今回は無料で利用できるオープンソースソフトウェアの VOICEVOX を紹介しよう。
VOICEVOX | 無料で使える中品質なテキスト読み上げソフトウェアこのソフトでは機械学習を利用したテキストの読み上げ機能を提供している。Windows・macOS 両対応だ。GPU の利用が推奨されているようだが、CPU でも実行可能だ。
音声は10種類あり、好みに合わせて選択できる。それぞれに名前やイラストもついているのも特徴的だ。
商用利用可能ではあるがキャラクター毎に利用規約が設定してあるので、利用の際には規約を把握しておこう。といっても基本的にはクレジットを表記すれば問題ないものが殆どだろう。
テキスト読み上げ機能はとても簡単に利用できる。ソフトウェアを起動したらウインドウ真ん中にテキストを入力する画面がある。ここで再生したいテキストと、再生するキャラクターを選択する。それぞれ入力と選択を行い、ウインドウ左下にある再生ボタンを押そう。
それだけでテキストを音声に変換して再生する。
アクセント・イントネーション・音の長さはウインドウ下部から、音声の速さや高さ・抑揚はウインドウ右側から調整できる。
音声ファイルとして保存する場合はウインドウ上部にある「一つ書き出し」を押すと wav ファイルとして保存される。全て連結して保存する場合はウインドウ左上の「ファイル」から「音声を繋げて書き出し」を選択しよう。
VOICEVOX:冥鳴ひまり
実際に音声に変換したのがこれだが、このような感じで簡単にテキストを音声化することができる。
ツールバーのカスタマイズ機能やキーボードショートカット機能も用意されており、使い勝手も良い。
テキスト読み上げが必要だがお金はかけられない、というのであれば利用してみると良いかもしれない。