AI音声と格闘……はしたけど
怠け者の夏目です。
それでも年に1本のペースで新作を出したいのです。ですが。
「MET HORROR2」は6章仕立てなので1章あたり2か月で開発すべきところ、シホ編は既に8か月***もかけてます。
「AI音声」「AI作画」の基礎研究に時間をかけてるのもその一因です。いや半分以上は飲んで寝てるからなんですけども。
AI音声の件は一度「やっぱ演技はムリ」と結論づけたんですが、まだ諦めきれなくて。
それ以降も新しいツールが公開されたり、バージョンアップがなされたりする度にトライアルしてきました。
■試したのは主に以下のツール。
1)VoicePeak
https://www.ah-soft.com/voice/6nare/
2)A.I.VOICE(体験版)
https://aivoice.jp/?gclid=CjwKCAiA_vKeBhAdEiwAFb_nrSaUC6UHOJECxN7g3yixesKhcFcxynyEd8DeWwnUmW0J-l4V6dwGVBoCfvcQAvD_BwE
3)CoeiroInk
https://coeiroink.com/download
4)ITVoice(イタボイス)
https://booth.pm/ja/items/4379783
5)VOICEVOX
https://voicevox.hiroshiba.jp/
それぞれのツールの評価はご自身でご確認なさるのが一番よろしいかと思いますが、夏目が一言でまとめるなら
「商用は高音質。フリーウェアは中~低音質」。
夏目はそこそこお値段の張るVoicePeakに頼るようになってきました。
しかしAIさんは色々苦手が多くて、やはり今も行き詰ってます。
■AI音声が苦手としてること
1)長音がヘボい
「あーーー」とか「うーーー」とか伸ばす音のことです。
たいていのフリーウェアではブチブチノイズになってしまいます。各ツールではそれを回避するために「ー」ひとつに丸めちゃったり、勝手な抑揚をつけて逃げたりしてます。
商用のツールではさすがに正しく発音してくれますが、文字通りの棒読みです。
2)感情表現がショボい
「うれしい」「悲しい」「怒り」といった感情モデルが用意されていないモデル(キャラクタ)は感情的な表現ができません。
抑揚やピッチの調整では学芸会以下の悲しい演技になります。
3)アマチュア声優さんの発音はボロい
フリー音源はアマチュアさんの音声モデルですので、「ラ行の消失」「サ行の消失」「ぺちゃ(唾液音)」が頻発します。
ラ行・サ行についてはツールの性能も関連します。
■フランチェスカのサンプル
夏目のフランチェスカのボイスイメージは田村ゆかりの愛嬌あるツンです。
ボイスデータで供給ある声優さんとしてはCoeiroInkの朱夏ちゃんです↓
ただし彼女も感情モデルがないため、抑揚で演技をつけるのは至難の業です。
以下にいろんな演者?のサンプルを列挙します。
■とあるシーンのサンプル
これはシホ編でフランチェスカが墜落しながら、シホを救うために最終魔法を発動するシーンです。
自分の生命維持回路を止め、人格すらもマナに昇華しようとする言わば決死のセリフなので、そこには「祈り」「願い」「決意」「悲壮」など様々な思いが詰まってるはずです。
プロの(人間の)声優さんならそれを読み取った演技をしてくれますが、果たしてAIは……?
(各ボイスとも、各ツール内で抑揚・ピッチの調節を行って出力。リバーブなどの騙しエフェクトをかける前です)
1)A.I.VOICE
体験版のためウォーターマークが入っていてわかりづらいですが。
デフォでのテキスト読み取りや自然なイントネーション等はこのツールがダントツで優秀です。
しかし声優さん(音声モデル)の演技自体が、まあ、これです。
2)イタボイス
音声モデルが男性1つ、女性1つしかないのでモデルの選択の余地はありません。
3)VoicePeak
A.I.VOICEにほぼ同順の品質です。
基本はアナウンサーボイスのため演技は弱いです。「MET」は訥々としゃべる人ばかりなのでこれでもいいんですが。
新キャラも発売されましたが、夏目向きのキャラはいませんでした。
4)CoeiroInk
夏目イメージの朱夏ちゃんのセリフなんですが、やはり感情モデルなしでは悲壮感とか出ません。
■こんな具合です
「MET2」発売までに画期的なツールか画期的なモデルが登場することを祈るばかりです。
ちなボイチェンとかにはマシン性能が追いつきません(nvidiaのグラボじゃない)