音声生成AI「Style-Bert-VITS2」のインストール方法・使い方！感情豊かな日本語ボイスを生成しよう

今回は音声生成AIに関する話題で、最近注目されている

Style-Bert-VITS2のインストール方法や使い方

を丁寧にご紹介するという内容になっております。

音声生成AIというと従来は日本語に対応しているものが少なく、あったとしても不自然な喋り方になってしまう場合がほとんどでした。しかしそのような中で「Bert-VITS2」というAIが自然で流暢な日本語を生成できるようになったぞ、ということで一部界隈ではかなり話題になったようです。

そしてその後、日本人向けに改良された「Style-Bert-VITS2」がリリースされ注目を集めています。ここではそのStyle-Bert-VITS2のインストール方法や基本的な使い方について詳しくご説明しますね。

Style-Bert-VITS2について
Style-Bert-VITS2のインストール方法（一番簡単なやり方）
Style-Bert-VITS2の基本的な使い方
おわりに

Style-Bert-VITS2について

公式ページ

GitHub - litagin02/Style-Bert-VITS2: Style-Bert-VITS2: Bert-VITS2 with more controllable voice styles.

Style-Bert-VITS2: Bert-VITS2 with more controllable voice styles. - litagin02/Style-Bert-VITS2

Style-Bert-VITS2とは？

Style-Bert-VITS2はlitagin氏によるBert-VITS2の日本人向けの改良版です。音声生成AIであるBert-VITS2に変更を加えて日本語に特化させたものがStyle-Bert-VITS2となります。

Style-Bert-VITS2では流暢かつ感情豊かな日本語音声を生成できるほか、新しい音声を学習させることも可能です。

音声サンプル

さて「流暢で感情豊かな日本語を生成できる」というとどの程度なのかな？まだ不自然なんじゃないの？…と皆さん思うかもしれませんが、ここで私がStyle-Bert-VITS2を使って実際に作ったサンプルをご用意しましたのでご試聴ください。

テキスト：
こんにちは！私はくろくまです。AIの使い方やゲーム開発に関するノウハウをご紹介するブログを運営しています。よろしくお願いします。

ちょっと感情表現が強すぎる気がしますが、それにしても流暢な日本語ボイスでビックリですよね。Style-Bert-VITS2を使えばこのような音声が簡単に作れるので便利です。

Style-Bert-VITS2のインストール方法（一番簡単なやり方）

ではStyle-Bert-VITS2の概要について知って頂いたところでインストール方法をご説明していこうと思います。やり方は

GitとPythonを導入してからインストールする方法
Zipファイルをダウンロードして中身のバッチファイルを実行する方法

の2通りがあります。ただ後者の方が簡単なのでここでは初心者の方向けにそちらをご紹介します。

Zipファイルのダウンロード

まず、下記の公式リリースページから一番新しいバージョンの「Style-Bert-VITS2.zip」をダウンロードします。

Releases · litagin02/Style-Bert-VITS2

Style-Bert-VITS2: Bert-VITS2 with more controllable voice styles. - litagin02/Style-Bert-VITS2

Zipファイルの展開・中身の移動

ダウンロードしたファイルの中身を見てみると次の3種類のバッチファイルが入っています。

これらのファイルを、Style-Bert-VITS2をインストールしたい任意のフォルダに移動させましょう。

注意：
インストール先のフォルダまでのパスには空白（スペース）や日本語が含まれていてはいけません。必ずスペースや日本語が含まれないようなフォルダ構成になっている場所に入れてください。

また、インストールの過程で巨大なファイルをダウンロードすることになるのでインストール先のストレージの空き容量に注意してください。

バッチファイルの実行

ここまでできたらあとはバッチファイルを実行してインストールを始めるだけです。お使いのPCにグラフィックボードが搭載されている場合は「Install-Style-Bert-VITS2.bat」を、そうでなければ「Install-Style-Bert-VITS2-CPU.bat」を実行してインストールを始めてください。

インストールでは様々なファイルをダウンロードすることになるので完了まで十数分かかります。気長に待ちましょう。

その後「Model download is complete. Start the WebUI of the voice synthesis.」というメッセージが出たらインストール完了です。自動的にブラウザが開いてStyle-Bert-VITS2の画面が表示されます。