主頁(yè) > 知識(shí)庫(kù) > 語(yǔ)音人福音:你和我的區(qū)別可能只差一個(gè)1400小時(shí)開(kāi)源數(shù)據(jù)集

語(yǔ)音人福音:你和我的區(qū)別可能只差一個(gè)1400小時(shí)開(kāi)源數(shù)據(jù)集

熱門(mén)標(biāo)簽:無(wú)錫營(yíng)銷(xiāo)外呼系統(tǒng)代理商 徐州手機(jī)外呼系統(tǒng)供應(yīng)商 預(yù)覽式外呼系統(tǒng) 濟(jì)南高頻外呼系統(tǒng)哪家公司做的好 電梯外呼按鈕線路圖 信陽(yáng)點(diǎn)撥外呼系統(tǒng)好用嗎 南寧市語(yǔ)音電銷(xiāo)機(jī)器人怎么樣 重慶防封卡外呼系統(tǒng)違法嗎 地圖標(biāo)注必須多少錢(qián)
  Mozilla昨日發(fā)布了語(yǔ)音識(shí)別數(shù)據(jù)集,稱(chēng)為Common Voice。該數(shù)據(jù)集由18種不同的語(yǔ)言(包括英語(yǔ),法語(yǔ),德語(yǔ),普通話,威爾士語(yǔ),卡比爾等)組成,并增加了來(lái)自42,000多名貢獻(xiàn)者的約1,400小時(shí)錄制的語(yǔ)音片段。 
  從體量上來(lái)看它可以算的上是同類(lèi)項(xiàng)目中最大的多語(yǔ)言數(shù)據(jù)集之一,對(duì)比之前發(fā)布的Common Voice語(yǔ)料庫(kù)數(shù)據(jù)集,20,000個(gè)人的近40萬(wàn)個(gè)錄音(500小時(shí)語(yǔ)音數(shù)據(jù)),其提升效果也是十分顯著。
  當(dāng)然這也得益于Mozilla從18年6月宣布為了使Common Voice更具全球性和包容性。使用多語(yǔ)言支持,通過(guò)Common Voice網(wǎng)站和移動(dòng)應(yīng)用,短短8個(gè)月從22種語(yǔ)言開(kāi)展數(shù)據(jù)收集到目前共有70多個(gè)語(yǔ)言的數(shù)據(jù)收集工作正在進(jìn)行中。
  語(yǔ)音技術(shù)對(duì)于人工智能的重要性不言而喻,但無(wú)奈的是,目前語(yǔ)音技術(shù)資源的話語(yǔ)權(quán)卻牢牢的掌握在大型科技公司。
  首先目前行業(yè)內(nèi)普遍認(rèn)為語(yǔ)音將成為下一個(gè)重要的技術(shù)平臺(tái),近年來(lái)隨著人工智能理論與技術(shù)的迅猛發(fā)展,語(yǔ)音識(shí)別技術(shù)在不斷突破,通過(guò)語(yǔ)音助手如Alexa、GoogleAssistant、Siri和Cortana,各公司將收集到的用戶(hù)語(yǔ)音數(shù)據(jù)歸為公司自己所有。
  其次這些數(shù)據(jù)的價(jià)值或許目前很難被外界看出來(lái),但是在信息化高度發(fā)達(dá),特別是今天這樣一個(gè)大數(shù)據(jù)和人工智能時(shí)代,為開(kāi)發(fā)機(jī)器學(xué)習(xí)模型提供語(yǔ)音數(shù)據(jù)集怎么看都是一件有深遠(yuǎn)意義的事,這些語(yǔ)音數(shù)據(jù)的意義會(huì)慢慢體現(xiàn)。而最終當(dāng)它們的價(jià)值逐漸顯現(xiàn),人們會(huì)發(fā)現(xiàn)在這背后亞馬遜、谷歌、蘋(píng)果和微軟等公司已經(jīng)牢牢鎖住了語(yǔ)音技術(shù)的命門(mén),主導(dǎo)了這場(chǎng)語(yǔ)音市場(chǎng)之爭(zhēng)。
  基于此CommonVoice項(xiàng)目就是為了避免這樣的事情而誕生的,它的目的是將收集到的語(yǔ)音數(shù)據(jù)集開(kāi)源給公眾,使得任何人都可以自由使用這些數(shù)據(jù)集來(lái)將語(yǔ)音識(shí)別技術(shù)智能地構(gòu)建到各種應(yīng)用程序和服務(wù)中。
  Mozilla首席創(chuàng)新官Katharina Borchert表示:希望用戶(hù)使用自己的語(yǔ)言甚至方言的時(shí)候是可以被機(jī)器理解的,但是我們相信這些技術(shù)上的接口不應(yīng)該由少數(shù)幾家公司控制,他們不能像守門(mén)員一樣來(lái)完全把控語(yǔ)音服務(wù)。
  CommonVoice項(xiàng)目的意義與用于打擊私人平臺(tái)的開(kāi)放許可證項(xiàng)目類(lèi)似,OpenStreetMap就是一個(gè)很好的例子。OpenStreetMap為開(kāi)發(fā)者提供了開(kāi)放且可自由使用的世界地圖,使得開(kāi)發(fā)商不再需要依賴(lài)于GoogleMaps這樣的競(jìng)爭(zhēng)對(duì)手,不僅降低了成本開(kāi)銷(xiāo),技術(shù)上也不再受到限制。
  總之,雖說(shuō)目前CommonVoice相較于其他語(yǔ)音數(shù)據(jù)集還略有不足,比如在數(shù)量上,但是其綜合多樣性、豐富性和質(zhì)量方面都遙遙領(lǐng)先,但這也給了我們一個(gè)想象空間,未來(lái)隨著時(shí)間的推移,其語(yǔ)料庫(kù)的不斷增加,CommonVoice的影響力也會(huì)與日俱增,到時(shí)候?qū)?huì)被全世界更大范圍內(nèi)的開(kāi)發(fā)者們所關(guān)注并受益。
  或許正如Mozilla所設(shè)想:未來(lái)語(yǔ)音技術(shù)的民主化不僅會(huì)降低全球創(chuàng)新的障礙,也會(huì)讓人們獲取信息更加便捷。
  地址:https://blog.mozilla.org/blog/2019/02/28/sharing-our-common-voices-mozilla-releases-the-largest-to-date-public-domain-transcribed-voice-dataset/

標(biāo)簽:河南 上饒 滁州 江門(mén) 濰坊 通化 黃石 昭通

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《語(yǔ)音人福音:你和我的區(qū)別可能只差一個(gè)1400小時(shí)開(kāi)源數(shù)據(jù)集》,本文關(guān)鍵詞  語(yǔ)音,人,福音,你,和,我的,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《語(yǔ)音人福音:你和我的區(qū)別可能只差一個(gè)1400小時(shí)開(kāi)源數(shù)據(jù)集》相關(guān)的同類(lèi)信息!
  • 本頁(yè)收集關(guān)于語(yǔ)音人福音:你和我的區(qū)別可能只差一個(gè)1400小時(shí)開(kāi)源數(shù)據(jù)集的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章