私はPodcastを細々とやってる。くだらない内容だけど、200回を数えるぐらいになっている。最近はタイトルなどをmacOS上で動く人工音声ソフトであるVOICEVOXを使っている。最近になって「CoeFont (コエフォント)」というサービスがあることを知った。
VOICEVOXとCoeFont
VOICEVOXはザックリ言うとOSSのエンジン部分にライセンスを持った音声データを組み合わせたものです。
一言でいうと、キャラクターが含まれているか、含まれていないかです。 キャラクターは多くの場合 OSS と相反するライセンスを持っているため、OSS にすることができません。 例えば、キャラクターのライセンスによくある「公序良俗に反する利用の禁止」や「反社会的勢力の排除」は、オープンソースの定義の1つである「利用する分野に対する差別の禁止」と衝突します。
The Open Source Definition https://opensource.org/osd
そのため VOICEVOX では、キャラクターの要素(声や見た目)を含まない OSS 版と、OSS 版をもとに構築してキャラクターの要素を含めた製品版を分けて開発・配布しています。
voicevox/全体構成.md at main · VOICEVOX/voicevox · GitHub
CoeFontの方は、商用のエンジン部分にユーザーも作成可能な音声データを組み合わせたものと判断しています。
AI音声プラットフォーム「CoeFont(コエフォント)」は、「いい声を、いつでも、手軽に、使いたい分だけ。」をコンセプトに、最新のAI技術を活用し、「声」を表現力豊かな「フォント」に変換することで、だれもが、安価で、簡単に利用できる音声サービスです。
Products – 株式会社CoeFont
CoeFontの方はすでに5,000を超える「声」を選択できます。この辺圧倒的ですね。
CoeFontを使った感想
まだ無料で使える部分しかいじっていませんが、品質はVOICEVOXと同等かそれ以上という感じです。VOICEVOXでもそうなのですが、CoeFontでもイントネーションを細かく設定できません。「上がる」「下がる」で指定できるだけです。微妙なところはまだ手が届かない感じです。
VOICEVOXを長く使ってきていますが、長いフレーズに対応していない。という弱点があります。CoeFontではワンフレーズ300文字に限定されています。VOICEVOXでは100文字程度を超えるフレーズも警告が出ますが使えます(品質は悪くなる)。300文字というのは日本語のセンテンスとしても少々不足するかな。といった感じ。ただ、音声をつなげるという機能があるため、文章を分割して後でつなげるという感じで長いセンテンスを生成できますね。
本当にザックリとしか使っていませんが、CoeFontの最大の利点は「コエフォント」という名前の通り、5,000を超える声のキャラクターを選択できる点にあります。自分の声を登録することもできます。そこにメリットを感じれば、CoeFontを選択すればいいんだろうな。と思ってます。
私はどうするかというと
端的に言えば、VOICEVOXを使い続けることにしようと思います。Liteプランで500円/月というCoeFontの価格設定と、VOICEVOXの機能を比較するとVOICEVOXに軍配を上げると言うことです。自分の声を登録してCoeFontを使うことで今行っているPodcastの手間を短くできるか? それは500円/月の価値があるか。そこでしょうね。
棒読みかもしれないけど、Podcastには肉声を載せていこうと思います。ただ、CoeFontも面白いサービスですので、フリーの登録をしておきました。このブログのPodcastには、肉声バージョンと、CoeFontバージョンの2つを用意してみようかなと思います。
面白いサービスが続々と出てきますね。楽しいです。使う使わないは別にして、いろんな技術をかじっていくことで、ちょっとでもスキルアップにつながればいいなぁ。
投稿者プロフィール

最新の投稿
Raspberry Pi2023年11月30日Raspberry Pi zero 2 WからBluetoothで音楽を流す
ラーメン2023年11月26日ラーメン山岡家 ネギ味噌ラーメン
Windows2023年11月23日Windows11マシン不調
TrueNAS2023年11月17日TrueNAS SCALEサーバーのエラー
