Renorari ブログ

【HTS】窓による音声の違い

最終更新: 2024年4月24日

ogp

この記事は、KanaVoice:VoiceAを作る際に検証を行った結果をまとめたものです。
HTS Demoを動かし、hts_engineで音声を生成しました。
メモ程度の内容ですが、参考になれば幸いです。

HTS Demoで指定できる窓の種類

HTS Demoで指定できる窓の種類は3種類あり、以下の通りです。

各窓で音声を生成した結果

それぞれの窓で音声を生成し、比較しました。

学習データは、KanaVoice:VoiceAに使用した音声のうち20個を使用しました。
量が少ないため、あまり精度は出ません、ご了承ください。

Blackman

Hamming

Hanning

結果とまとめ

窓の種類によって音声の違いがあることがわかりました。
個人的には、デフォルトのHammingが音割れなく、音声が綺麗に聞こえると感じました。

以上、窓による音声の違いについてでした。
今回の検証にあたって、HTS Demoを使用しました。
HTS Demoの簡単な動かし方については、htsvoice作るメモ Part1をご覧ください。
ご一読いただき、ありがとうございました!