何が発表された?
Google DeepMind Blog で、Gemini 3.1 Flash TTS が発表されました。表現力 (感情・抑揚・間) を持った音声合成を狙った次世代のテキスト読み上げモデルと紹介されています。
メモ
- 単調な読み上げではなく、感情やニュアンスを含んだ自然な発話を目指したシリーズと位置付けられています。
- ナレーション / 音声アシスタント / ポッドキャスト生成といった、表現力が求められる用途への適合が期待されます。
- 対応言語、声色のバリエーション、API としての提供条件などの詳細は公式ブログと Gemini API ドキュメントの確認が必要です。
公式情報
公式タイトル: Gemini 3.1 Flash TTS: the next generation of expressive AI speech
公式ソース: Google DeepMind Blog