訊飛星火認知大模型3.5升級發佈 語音交互潛能進一步引爆

2024年2月6日 23点热度 0人点赞

1月30日,科大訊飛舉辦星火認知大模型V3.5升級發佈會,展示大模型底層能力到應用場景的新發展,同時也發佈了訊飛語音大模型。科大訊飛董事長劉慶峰表示,“今天的通用人工智能必將像PC和互聯網的誕生一樣,深刻改變人類的生產生活方式。”隨著星火認知大模型V3.5的發佈,訊飛輸入法借新技術持續賦能,不斷升級生成式AI輸入能力,在萬物互聯時代帶來更出眾的人機交互體驗。

2023年8月,訊飛輸入法推出“AI創作助手”,覆蓋6大表達場景,適配60多款應用。同年10月,訊飛輸入法全新發佈13.0,量身定制“高情商溝通”、“潤色達人”、“智能回復”、“幫你擴寫”等場景化功能,提供生成式AI輸入服務。2024年1月30日,訊飛星火V3.5已在語言理解、數學能力上超過了GPT-4 Turbo。與此同時,訊飛輸入法將基於星火大模型底座和用戶新生需求,提升生成式AI能力,匹配更多元的場景,擁有更深層的理解,生成更豐富的表達。

創業之初,科大訊飛的夢想和使命就是要實現人機信息溝通無障礙。當下的大模型帶來了語音技術發展的全新機會,使語音識別可以進一步突破高噪、遠場、多人說話這些傳統的“雞尾酒會語音識別”重大難題。這一次基於大語言模型框架,結合訊飛多維度語音屬性解耦表征預訓練,正式發佈星火語音大模型,首批37個主流語種效果超過OpenAI Whisper V3,全新升級助力更自由的溝通,推動萬物互聯時代下的人機交互變革。

訊飛自創業以來,在智能語音這條賽道上一路馳騁,持續走在世界前列。2006-2019年,連續十四年蟬聯國際語音合成大賽冠軍;2016-2023年,連續4屆獲得國際多通道語音分離和識別比賽CHIME冠軍;2021-2023年,連續三年獲得國際語音翻譯比賽IWSLT賽道冠軍;還參與承建首批國傢新一代人工智能開放創新平臺、語音及語言信息處理國傢工程研究中心等,在語音領域持續積累。

此次星火語音大模型將識別、翻譯和多語種分類等多種功能統一交換並進行訓練,實現了多種任務信息的共通,會對整體任務產生促進作用,使語音識別效果大幅提升。其中,多語種自動識別已覆蓋37種,端到端語音翻譯超過13個。在訓練層面,通過兩種方式,即多模態理解和多模態生成兩種任務的協同訓練,來實現多模態的協同。

作為深耕互聯網行業14年的老牌應用,訊飛輸入法AI語音輸入,支持26種方言、5種民族語言以及30種外語,令表達更方便、更透徹,同時能夠理解上下文語義關聯。在星火語音大模型賦能下,全語音自然交互的訊飛輸入法旨在實現智慧表達,智能連接。對於大眾而言,一款生成式AI輸入法,是最方便、最直接、最輕量的大模型使用端口,打字就能使用生成式AI的多模態服務。可以看到,源於真實世界剛需的產品創新,在應用場景和社會價值方面潛力巨大。