IT

音声コンテンツ界に革命 著名人の声でテキスト読み上げ、自分の声も格安で合成

 AI(人工知能)で自分の声を合成し、文字の「フォント」のように自由に使うことのできるサービスが注目を集めている。サービス名は「声」と「フォント」を組み合わせた「CoeFont CLOUD」。15分程度の音読で収録した音声をもとに、AIが一音ずつ音声合成用のフォント(CoeFont)に変換し、使用時にはそれを文字を打ち込むように組み合わせて言語化する。作成した「CoeFont」はクラウド上で公開し、利用されるたびに作成者に収益として還元される。

 ディープラーニングで自然な音声合成

 開発を手掛けたのは、東京工業大の学生、早川尚吾さん(19)が社長を務める同大のスタートアップ企業「Yellston」(東京都港区)。今年4月、「CoeFont」を最初に発表した。デジタルキャラクターや著名人の声でテキストの読み上げができるサービスとしてリリースし、月間ユーザーは20万人に達している。

 今回リリースされた「CoeFont Cloud」は、自分の声で作成、登録できるというもの。従来は声から音声を合成するために50万円の費用と収録に10時間以上を要したが、新サービスでは利用料500円、収録時間が15分と使いやすくなったという。

 さらに、独自のAI技術で文脈に応じたアクセントを予測できるほか、ディープラーニング(深層学習)で自然な音声合成が可能に。アクセント調整やスピード調整など全ての編集作業をウェブ上で行うことができるため、どのパソコンでも利用できるとしている。不正利用を防ぐため、卑猥(ひわい)な言葉や放送禁止用語はあらかじめ合成不可となっている。

 公開範囲は自分だけに限定する「非公開」、一般ユーザーが使える「公開」のほか、公開していても利用時には「申請を要求する」といった設定もできる。利用された場合、文字数に応じて作成者に料金が支払われる仕組みだ。使用料の設定は作成者の任意だが、最低でも1000文字利用されると7円還元されるよう下限設定されている。

 Yellstonによると、「CoeFont」はすでにオーディオブックや動画のナレーション、館内放送、ラジオなどの音声コンテンツに使用されているという。

 音声作品の制作だけでなく、声帯の切除手術を予定しているガン患者が術前に自分の「CoeFont」を作成し、術後にそれを使って会話をするという例もあるなど、用途は「アイデア次第」(同社)でさらに広がりそうだ。

SankeiBiz編集部
SankeiBiz編集部 SankeiBiz編集部員
SankeiBiz編集部員が取材・執筆したコンテンツを提供。通勤途中や自宅で、少しまとまった時間に読めて、少し賢くなれる。そんなコンテンツを目指している。

Recommend

Ranking

アクセスランキング

Biz Plus