Mozilla釋出最新長達7,226個小時的Common Voice語音資料集

Mozilla的開源語音辨識引擎專案同聲計畫(Common Voice)釋出最新的語音資料集,總共含有7,226個小時的語音資料,而且除了資料集的時間長度持續累積增加之外,多元性也不斷地提升,最新的版本新增了14種資源稀有的語言,現在總共有54種語言的錄音。
同聲計畫的目的是要提供Mozilla維護的語音轉文字引擎DeepSpeech,有足夠的訓練資料使用,且該語音資料集不僅包含語音片段,還包含了貢獻者自願提供的元資料,可用來訓練語音引擎,具有像是年齡、性別和口音等特徵。

臉書留言

胡 自文

(這個頁面共進入 2 次, 今天進入 1 次)