Unisound News
2023年8月20號,最后一屆VoxSRC Workshop 在都柏林召開。VoxSRC 2023 國際說話人識別競賽公布比賽榜單,云知聲團隊奪得Track1(固定訓練集說話人確認)第一名、Track2(開放訓練集說話人確認)第二名的優異成績。
Track1 & Track2 名次
VoxSRC是由 University of Oxford(牛津大學)、Facebook AI Research(facebook AI研究院)、Google Research(谷歌研究院)等組織聯合發起的國際說話人識別競賽,是在說話人識別領域最具影響力和權威性的國際賽事之一。
VoxSRC 2023測試集數據來自訪談、新聞、談話、辯論等多個場景,包括專業編輯音頻和隨意的談話音頻,同時混雜著笑聲、其他說話人噪聲等復雜的背景噪音,涉及跨年齡、跨語種說話人識別,同時今年的測試數據繼續加大難度,專注于短語音說話人識別,音頻時長大部分在2-3s區間,是VoxSRC有史以來最難的一屆。
在此次競賽中,云知聲采用并進一步優化了當前最領先的算法。這些算法包括基于ResNet系列主干網絡,MQMHA pooling,以及融合了Sub-center和inter-topK的Large-margin損失函數。此外,云知聲還實施了多階段訓練調優策略等技術。
除此之外,基于對比賽任務的深刻理解,云知聲團隊首次提出了Consistency Measure Factor(CMF) 算法,即建模音頻“說話人特征的一致性”,并將其引入說話人相似度決策中,大幅提升了說話人識別的準確率。同時,依托云知聲大規模算力中心,采用大規模模型訓練框架,訓練出ResNet314、ResNet518說話人模型。憑借對“說話人算法”的創新性研發和超強力的“算力”支持,云知聲團隊在Track1(固定訓練集說話人識別)賽道以minDCF(最小檢測代價函數)0.085、EER(等錯誤率)1.588%的卓越表現,一舉奪得本次大賽冠軍。
Track 1 (Verification fullysupervised, closed)
Track 2 (Verification fullysupervised, open)
Track1 & Track2 榜單
值得注意的是,云知聲團隊將Track1(官方固定訓練數據)賽道的結果,直接提交到Track2(可用任何規模數據)賽道,卻依然取得了第二名的優異成績,這充分證明了其算法的出眾性和領先性。
云知聲:通過通用人工智能(AGI)創建互聯直覺的世界
云知聲AI技術體系及U+X戰略
作為中國AGI技術產業化的先驅之一,云知聲于2016年建立了Atlas人工智能基礎設施,并據此開發了具有通用能力的專有大模型山海(UniGPT),成為公司技術平臺云知大腦(UniBrain)的新核心,與多模態感知與生成、知識圖譜、物聯平臺等各類智能組件相結合,為云知聲智慧物聯、智慧醫療等業務提供高效的產品化支撐,推動“U(云知大腦)+X(應用場景)”戰略落實,踐行公司使命:“通過通用人工智能(AGI)創建互聯直覺的世界”。
說話人識別技術,作為云知大腦(UniBrain)的重要組件,已在智能家居、車載、客服等領域廣泛應用,包括身份識別、個性化服務、角色分離等。此次奪冠,進一步驗證了云知聲的AI技術實力,也將進一步通過云知大腦提供業界領先的說話人感知技術能力,以及更好的人機交互體驗和分析決策能力,夯實云知聲AGI技術底座,推動山海大模型在各領域的廣泛應用,為千行百業的智慧化升級注入更強大的AI動力。
未來,云知聲將繼續堅定走在技術研發的前沿,不斷推動其在AGI相關技術的研發突破,為各行各業帶來新的增長范式與無限可能。
審核編輯:湯梓紅
-
算法
+關注
關注
23文章
4600瀏覽量
92647 -
AI
+關注
關注
87文章
30172瀏覽量
268431 -
Agi
+關注
關注
0文章
77瀏覽量
10194 -
云知聲
+關注
關注
0文章
169瀏覽量
8369
原文標題:AGI技術底座再夯實,云知聲奪冠VoxSRC 2023
文章出處:【微信號:云知聲,微信公眾號:云知聲】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論