歌声合成のコツ・話声合成のコツ - acknak/Nakloid GitHub Wiki

歌声合成も話声合成も、Nakloidから見れば同じです。うまくいかない場合、下記を見なおしてみましょう。

共通

  • Nakloidは、Nakloid上で一から何かを作るには向いていないので、歌声合成であればSMFやUSTを、話声合成であれば原稿とそれを読み上げた原稿音声を、まずは準備しましょう
  • Nakloidにおいて、音符とピッチ情報は車の両輪ですので、両方を意識して編集しましょう
  • ピッチ情報の編集作業の基本は手作業による修正ですので、気合を入れましょう
  • ピッチ情報を急激に変化させると、ケロったような独特な音声になってしまいますので、音符の境目以外は滑らかに変化させるように気をつけましょう
  • アンドゥ機能は未実装ですので、特にピッチ情報を編集する際は、バックアップをこまめに取りましょう(2016/8/6現在)
  • お休みの際は、UTAU界隈の偉大なる先人たちに頭を、Nakloidの作者に足を向けて寝ましょう

歌声合成のコツ

  • 一曲全てを一つの楽譜で合成すると時間がかかるため、適当な長さに区切りましょう
  • 音符情報よりもピッチ情報が優先さるため、音の高さがおかしいと感じたら、まずはピッチ情報が正確に表現されているかを確認しましょう
  • プレパレーション、オーバーシュート、ビブラートを意識してピッチ情報を修正しましょう

話声合成のコツ

  • 原稿音声を録音する際は、より正確な基本周波数推定のため、可能な限り高性能なマイクと録音環境を用意しましょう
  • 原稿音声の解析には、非常に高品質な基本周波数推定システムであるWorldを用いていますが、限界がありますので、必ずピッチ情報を手作業で修正しましょう
  • 連続音源の滑舌が悪いときは、通常音源も活用しましょう
  • 歌声合成以上に、ピッチ情報の急激な変化は違和感を生むので、なるべく緩やかなカーブを意識してピッチ情報を修正しましょう
  • 音量の変化は、ほとんどの場合において音符の基準音量を変更すれば事足りるはずですので、有効活用して下さい