全國產算力平臺“飛星一號”首個成果——訊飛星火V3.5發佈

2024年2月6日 19点热度 0人点赞

1月30日,科大訊飛舉行星火認知大模型V3.5升級發佈會。科大訊飛董事長劉慶峰、研究院院長劉聰正式發佈基於首個全國產算力訓練的訊飛星火V3.5,七大核心能力全面提升,數學、語言理解、語音交互能力超GPT-4 Turbo,重磅升級星火智慧黑板;正式發佈星火語音大模型,首批37個主流語種效果超過OpenAI Whisper V3,賦能訊飛翻譯機迎來全新升級助力更自由溝通,推動萬物互聯時代下客服、汽車、機器人等場景人機交互變革。

據了解,去年10月,科大訊飛攜手華為,宣佈首個支撐萬億參數大模型訓練的萬卡國產算力平臺“飛星一號”正式啟用。與此同時,訊飛星火步履不停,基於“飛星一號”,啟動了對標GPT-4的更大參數規模的大模型訓練。

首個基於全國產算力訓練的全民開放大模型訊飛星火V3.5在語言理解、文本生成、知識問答、邏輯推理、數學能力、代碼能力和多模態能力七個方面進行了全面升級。其中語言理解、數學能力超過GPT-4 Turbo,代碼達到GPT-4 Turbo 96%,多模態理解達到GPT-4V 91%。

此外,會上,首個基於全國產化算力平臺”飛星一號”的開源大模型——星火開源-13B正式發佈。本次開源擁有130億稠密參數(13B),學術企業研究可以基於全棧自主可控的星火優化套件,更便利地訓練自己的專用大模型。

劉慶峰透露,星火開源大模型在技術上形成了差異化優勢。星火開源-13B在多項知名公開評測任務中名列前茅,在文本生成、語言理解、文本改寫、行業問答、機器翻譯等企業典型場景中,通過對學習輔助、語言理解等領域的深入研究和優化,實用性大幅提升,在處理復雜的自然語言任務時更加得心應手。

基於“飛星一號”訓練,星火開源大模型全棧國產適配優化,簡單易用,場景應用效果領先,訓練策略針對昇騰算力極致優化,訓練效率達A100的 90%。這不僅是對昇騰AI硬件的進一步深度優化,也展示了國產算力在追趕國際先進水平方面的決心和能力。目前,華為昇思開源社區已正式上架星火大模型開源版-13B,面對學術、企業研究完全免費,增進學術合作的同時,增進產業探索。

(記者: 李發靜)