全國產算力平臺“飛星一號”的首個成果 訊飛星火V3.5發佈

2024年2月6日 25点热度 0人点赞

1月30日,科大訊飛舉行星火認知大模型V3.5升級發佈會。科大訊飛董事長劉慶峰、研究院院長劉聰正式發佈基於首個全國產算力訓練的訊飛星火V3.5,七大核心能力全面提升,數學、語言理解、語音交互能力超GPT-4 Turbo,重磅升級星火智慧黑板;正式發佈星火語音大模型,首批37個主流語種效果超過OpenAI Whisper V3。

2023年10月24日,科大訊飛攜手華為,宣佈首個支撐萬億參數大模型訓練的萬卡國產算力平臺“飛星一號”正式啟用。啟用後的90多天裡,訊飛星火步履不停,基於“飛星一號”,啟動了對標GPT-4的更大參數規模的大模型訓練,帶來了這場訊飛星火V3.5升級發佈。

首個基於全國產算力訓練的全民開放大模型訊飛星火V3.5在語言理解、文本生成、知識問答、邏輯推理、數學能力、代碼能力和多模態能力七個方面進行了全面升級。其中語言理解、數學能力超過GPT-4 Turbo,代碼達到GPT-4 Turbo 96%,多模態理解達到GPT-4V 91%。

“聽說今年爾濱特別火,作為南方小土豆還挺想去玩一下的。要不你用東北話介紹下有啥好玩的唄?”

在實操演示環節,科大訊飛研究院院長劉聰和訊飛星火V3.5現場互動,訊飛星火V3.5一口地道的東北話逗樂現場觀眾。幽默之餘,訊飛星火V3.5快速為劉聰定制了旅遊攻略,還催促他趕快買票,春運機票緊俏。

它不僅能夠幫助用戶帶來解決方案,還能作為“知冷知熱”的朋友,帶入情緒互動,超高的擬人度讓大模型更具人情味。

大模型全新賦能知識學習與內容創作。訊飛星火V3.5對年終總結計劃、述職PPT、活動策劃、政策問答等任務“信手拈來”。基於此,科大訊飛推出了可以一鍵快速自動生成文檔和PPT的辦公產品——訊飛智文,這款產品主要功能有文檔一鍵生成、AI撰寫助手、多語種文檔生成、AI自動配圖、多種模板選擇、提供演講備註功能等。劉聰現場演示了使用訊飛智文制作的“合肥市2024年春節旅遊推廣策略”PPT,短時間內超20頁內容豐富的PPT一氣呵成。

大模型還能夠結合外部知識進行合理拓展,做到“旁征博引”。要素抽取、問題生成等能力的進步,能夠幫助每個人以測助學形成思考的閉環,在越來越多的服務領域及學習知識場所中產生更多好用的智能體。

“大模型帶來了語音技術發展的全新機會。”劉慶峰強調,讓機器具備學習、推理和決策的能力,就是認知大模型要幹的主要工作。“簡單來說,借助大模型,我們讓一段語音具備更加豐富的屬性,有語種、有內容、有韻律、有音色,還有情緒。”星火語音大模型效果國際領先,中文、英語、法語、俄語等首批37個主流語種的語音識別效果超過OpenAI Whisper V3,而在多語種語音合成方面,星火語音大模型的首批40個語種擬人度超83%。

今天,在訊飛開放平臺之上,大模型總開發者超35萬,其中企業開發者超22萬,開發者數增長迅猛,大模型應用加速落地,“所以我非常自豪,訊飛星火大模型的開發者數量,在中國是很高的,而且用戶口碑非常好。”劉慶峰說道。

在此基礎上,科大訊飛也在加速賦能各個行業的頭部企業客戶。現場,劉慶峰提及了訊飛與奇瑞的合作。“奇瑞是安徽的驕傲,連續十幾年都是中國汽車出口量的第一名。”劉慶峰介紹,奇瑞汽車出口的國傢覆蓋英語、俄羅斯語、西班牙語、阿拉伯語、葡萄牙語等數十個語種,汽車中應用的智能語音交互技術全都由科大訊飛提供。“我們用大模型全力支撐中國汽車的全球化出海戰略,要讓汽車變得更聰明、更智能、更面向未來。”

會上,首個基於全國產化算力平臺”飛星一號”的開源大模型——星火開源-13B正式發佈。本次開源擁有130億稠密參數(13B),包含基礎模型iFlytekSpark-13B-base、精調模型iFlytekSpark-13B-chat,開源了微調工具iFlytekSpark-13B-Lora、人設定制工具iFlytekSpark-13B-Charater。學術企業研究可以基於全棧自主可控的星火優化套件,更便利地訓練自己的專用大模型。

文/北京青年報記者 溫婧

編輯/樊宏偉