音声データセットMozilla Common Voiceに関する覚え書き
Mozilla Common VoiceはCC0(≒パブリックドメイン=著作権放棄)で提供されている音声データセットです。運営しているのはWebブラウザFirefox(最盛期はIEに次ぐシェアのあった……)の開発などを手がけているMozilla Foundationです。
「話者の身元を特定しないこと」という条件はありますが、利用規約上各話者はCC0で公開されることに自ら同意しており、かつこのプロジェクトに参加したりしなかったりすることで何らかの不利益が発生するわけでもない字義通りのボランティアによるものです。