全國產算力訓練的訊飛星火V3.5發佈 進一步對標國際最先進水平

2024年2月6日 22点热度 0人点赞

1月30日,科大訊飛舉行星火認知大模型V3.5升級發佈會,正式發佈基於首個全國產算力訓練的訊飛星火V3.5。

首個基於全國產算力訓練的全民開放大模型訊飛星火V3.5在語言理解、文本生成、知識問答、邏輯推理、數學能力、代碼能力和多模態能力七個方面進行了全面升級。其中語言理解、數學能力超過GPT-4 Turbo,代碼達到GPT-4 Turbo 96%,多模態理解達到GPT-4V 91%。訊飛星火V3.5不僅在語義理解、指令跟隨和多輪對話的演示中,展現出優異的能力,更是在情緒感知和擬人合成方面表現出色。

“聽說今年爾濱特別火,作為南方小土豆還挺想去玩一下的。要不你用東北話介紹下有啥好玩的唄?”在實操演示環節,科大訊飛研究院院長劉聰和訊飛星火V3.5現場互動,訊飛星火V3.5一口地道的東北話逗樂現場觀眾。幽默之餘,訊飛星火V3.5快速為劉聰定制了旅遊攻略,還催促他趕快買票,春運機票緊俏。

它不僅能夠幫助用戶帶來解決方案,還能作為“知冷知熱”的朋友,帶入情緒互動,超高的擬人度讓大模型更具人情味。

隨著數學和推理能力的升級,多模態能力逐步進階,訊飛星火V3.5在視覺問答、聯想推理等方面實現了“高分”應對,理解更加精確。

此外,本次發佈會上科大訊飛正式發佈星火語音大模型。科大訊飛創業伊始,在語音賽道上一路馳騁,持續走在世界前列。

“大模型帶來了語音技術發展的全新機會。”科大訊飛董事長劉慶峰強調,讓機器具備學習、推理和決策的能力,就是認知大模型要幹的主要工作。“簡單來說,借助大模型,我們讓一段語音具備更加豐富的屬性,有語種、有內容、有韻律、有音色,還有情緒。”

“通過星火語音大模型的評測效果,我們非常自豪地告訴大傢,科大訊飛繼續保持了全球領先的水平。”劉慶峰介紹,星火語音大模型效果國際領先,中文、英語、法語、俄語等首批37個主流語種的語音識別效果超過OpenAI Whisper V3,而在多語種語音合成方面,星火語音大模型的首批40個語種擬人度超83%。

星火語音大模型不止助力國際溝通,還能“百搭”更多場景,賦能實際應用。劉慶峰介紹,在汽車、客服、傢庭、陪伴機器人等場景中,星火語音大模型還有更多用武之地,帶來人機交互變革。

共享源代碼、開發出更好的軟件,是廣大開發者、高校、企業自主研發熱衷於開源的關鍵原因,也是共建第一開發者生態的重要途徑。會上,首個基於全國產化算力平臺”飛星一號”的開源大模型——星火開源-13B正式發佈。

本次開源擁有130億稠密參數(13B),包含基礎模型iFlytekSpark-13B-base、精調模型iFlytekSpark-13B-chat,開源了微調工具iFlytekSpark-13B-Lora、人設定制工具iFlytekSpark-13B-Charater。學術企業研究可以基於全棧自主可控的星火優化套件,更便利地訓練自己的專用大模型。

基於“飛星一號”訓練,星火開源大模型全棧國產適配優化,簡單易用,場景應用效果領先,訓練策略針對昇騰算力極致優化,訓練效率達A100的 90%。這不僅是對昇騰AI硬件的進一步深度優化,也展示了國產算力在追趕國際先進水平方面的決心和能力。