訊飛星火認知大模型3.5升級發佈語音交互潛能進一步引爆

1月30日，科大訊飛舉辦星火認知大模型V3.5升級發佈會，展示大模型底層能力到應用場景的新發展，同時也發佈了訊飛語音大模型。科大訊飛董事長劉慶峰表示，“今天的通用人工智能必將像PC和互聯網的誕生一樣，深刻改變人類的生產生活方式。”隨著星火認知大模型V3.5的發佈，訊飛輸入法借新技術持續賦能，不斷升級生成式AI輸入能力，在萬物互聯時代帶來更出眾的人機交互體驗。

2023年8月，訊飛輸入法推出“AI創作助手”，覆蓋6大表達場景，適配60多款應用。同年10月，訊飛輸入法全新發佈13.0，量身定制“高情商溝通”、“潤色達人”、“智能回復”、“幫你擴寫”等場景化功能，提供生成式AI輸入服務。2024年1月30日，訊飛星火V3.5已在語言理解、數學能力上超過了GPT-4 Turbo。與此同時，訊飛輸入法將基於星火大模型底座和用戶新生需求，提升生成式AI能力，匹配更多元的場景，擁有更深層的理解，生成更豐富的表達。

創業之初，科大訊飛的夢想和使命就是要實現人機信息溝通無障礙。當下的大模型帶來了語音技術發展的全新機會，使語音識別可以進一步突破高噪、遠場、多人說話這些傳統的“雞尾酒會語音識別”重大難題。這一次基於大語言模型框架，結合訊飛多維度語音屬性解耦表征預訓練，正式發佈星火語音大模型，首批37個主流語種效果超過OpenAI Whisper V3，全新升級助力更自由的溝通，推動萬物互聯時代下的人機交互變革。

訊飛自創業以來，在智能語音這條賽道上一路馳騁，持續走在世界前列。2006-2019年，連續十四年蟬聯國際語音合成大賽冠軍；2016-2023年，連續4屆獲得國際多通道語音分離和識別比賽CHIME冠軍；2021-2023年，連續三年獲得國際語音翻譯比賽IWSLT賽道冠軍；還參與承建首批國傢新一代人工智能開放創新平臺、語音及語言信息處理國傢工程研究中心等，在語音領域持續積累。

此次星火語音大模型將識別、翻譯和多語種分類等多種功能統一交換並進行訓練，實現了多種任務信息的共通，會對整體任務產生促進作用，使語音識別效果大幅提升。其中，多語種自動識別已覆蓋37種，端到端語音翻譯超過13個。在訓練層面，通過兩種方式，即多模態理解和多模態生成兩種任務的協同訓練，來實現多模態的協同。

作為深耕互聯網行業14年的老牌應用，訊飛輸入法AI語音輸入，支持26種方言、5種民族語言以及30種外語，令表達更方便、更透徹，同時能夠理解上下文語義關聯。在星火語音大模型賦能下，全語音自然交互的訊飛輸入法旨在實現智慧表達，智能連接。對於大眾而言，一款生成式AI輸入法，是最方便、最直接、最輕量的大模型使用端口，打字就能使用生成式AI的多模態服務。可以看到，源於真實世界剛需的產品創新，在應用場景和社會價值方面潛力巨大。

訊飛星火認知大模型3.5升級發佈 語音交互潛能進一步引爆

訊飛星火認知大模型3.5升級發佈語音交互潛能進一步引爆