0002コドコド(茸) [ES]2022/07/03(日) 20:01:17.68ID:BuL8KweV0?PLT(12015) 収録した音声をそのままテキストに自動で文字起こしするSpeech to Text(STT、音声テキスト変換)モデルや、入力したテキストを自動音声で読み上げるText to Speech(TTS、テキスト音声変換)モデルをオープンソースで開発する企業が「Coqui」です。
GitHub - coqui-ai/STT - The deep learning toolkit for Speech-to-Text. Training and deploying STT models has never been so easy. https://github.com/coqui-ai/STT0004チーター(東京都) [CA]2022/07/03(日) 20:01:50.58ID:a4Yqk7u90 ジャンジャンバリバリ 0005コドコド(茸) [ES]2022/07/03(日) 20:01:57.57ID:BuL8KweV0?PLT(12015) Coqui STTは英語・ドイツ語・フランス語などの利用者が多い言語から、トトナック語・ハカチン語・フリジア語などの少数言語まで80種類以上の言語に最適化されており、以下からダウンロードが可能。なお、記事作成時点では日本語のモデルはありません。
GitHub - coqui-ai/TTS - a deep learning toolkit for Text-to-Speech, battle-tested in research and production https://github.com/coqui-ai/TTS0007コドコド(茸) [ES]2022/07/03(日) 20:02:38.42ID:BuL8KweV0?PLT(12015) なお、「Coqui」というのはプエルトリコ原産のコキーコヤスガエルで、アメリカ南部やハワイ諸島、南米各地でも観測できるとのこと。このカエルは体長3~4cmでありながら、名前の通り「コキー」と大音量で鳴くことで知られています。以下のムービーでコキーコヤスガエルの鳴き声を聞くことができます。