訊飛星火3.5正式發佈!數學、語言理解、語音交互能力超GPT4 Turbo

2024年2月6日 20点热度 0人点赞

1月30日,科大訊飛舉行星火認知大模型V3.5升級發佈會。科大訊飛董事長劉慶峰、研究院院長劉聰正式發佈基於首個全國產算力訓練的訊飛星火V3.5,七大核心能力全面提升,數學、語言理解、語音交互能力超GPT-4 Turbo,重磅升級星火智慧黑板;正式發佈星火語音大模型,首批37個主流語種效果超過OpenAI Whisper V3,賦能訊飛翻譯機迎來全新升級助力更自由溝通,推動萬物互聯時代下客服、汽車、機器人等場景人機交互變革。

大模型應用加速落地,星火開發者超35萬,生態增長迅猛,打造個人應用賦能億萬用戶。訊飛星火賦能千行百業,攜手保險、銀行、能源、汽車、通信等領域龍頭企業,打造大模型賦能的應用標桿。此外,深度適配國產算力的訊飛星火開源大模型“星火開源-13B”首次發佈,場景應用效果領先,昇思開源社區聯合首發上線。

“通過這場發佈會,我們展望一個充滿希望、孕育著生長能量的春天。相信2024年一定可以實現星火燎原,通用人工智能不僅能夠在中國各大領域深度而廣泛應用,而且我們在源頭技術創新、在大模型的底層能力上也會站上全新臺階。”劉慶峰說道。

基於全國產化算力平臺訓練

訊飛星火V3.5七大能力全面提升

2023年10月24日,科大訊飛攜手華為,宣佈首個支撐萬億參數大模型訓練的萬卡國產算力平臺“飛星一號”正式啟用。啟用後的90多天裡,訊飛星火步履不停,基於“飛星一號”,啟動了對標GPT-4的更大參數規模的大模型訓練,帶來了1月30日訊飛星火V3.5升級發佈。

首個基於全國產算力訓練的全民開放大模型訊飛星火V3.5在語言理解、文本生成、知識問答、邏輯推理、數學能力、代碼能力和多模態能力七個方面進行了全面升級。其中語言理解、數學能力超過GPT-4 Turbo,代碼達到GPT-4 Turbo 96%,多模態理解達到GPT-4V 91%。

“在更好的數據、更強的人機協同訓練中,我們不能隻看單個的‘原子’能力,而是要以技術進步來解決真實世界的剛需。”

技術進步如何為人類生活帶來真正有效的解決方案?劉慶峰從全新賦能萬物互聯時代人機交互、全新賦能知識學習與內容創作、全新提升數智化生產力三個方面,向現場觀眾展示訊飛星火V3.5的能力提升。

大模型全新賦能萬物互聯時代人機交互體驗,超擬人合成效果驚艷。這背後不僅得益於訊飛星火V3.5在語義理解、指令跟隨和多輪對話的演示中展現的優異能力,還有在情緒感知和擬人合成方面的出色表現。

“聽說今年爾濱特別火,作為南方小土豆還挺想去玩一下的。要不你用東北話介紹下有啥好玩的唄?”

在實操演示環節,劉聰和訊飛星火V3.5現場互動,訊飛星火V3.5一口地道的東北話逗樂現場觀眾。幽默之餘,訊飛星火V3.5快速為劉聰定制了旅遊攻略,還催促他趕快買票,春運機票緊俏。

它不僅能夠幫助用戶帶來解決方案,還能像和“知冷知熱”的朋友對話一般帶入情緒互動,超高的擬人度讓大模型更具人情味。“這是科大訊飛從創業起就一直希望做到的人機自然對話,相信全語音的自然交互可以賦能整個萬物互聯時代,推動整個產業出現新的繁榮。”

大模型全新賦能知識學習與內容創作,讓工作更高效。訊飛星火V3.5對年終總結計劃、述職PPT、活動策劃、政策問答等任務“信手拈來”。

基於此,科大訊飛推出了可以一鍵快速自動生成文檔和PPT的辦公產品——訊飛智文,這款產品主要功能有文檔一鍵生成、AI撰寫助手、多語種文檔生成、AI自動配圖、多種模板選擇、演講備註等。劉聰現場演示了使用訊飛智文制作的“合肥市2024年春節旅遊推廣策略”PPT,短時間內超20頁內容豐富的PPT一氣呵成,此等“打工神器”獲得臺下一陣掌聲點贊。

“要素抽取、問題生成等底層能力的進步,能夠幫助知識學習和內容創作領域,產生更豐富更有用的智能體。”大模型能夠結合外部知識進行合理拓展,做到“旁征博引”。在真實過程中讓用戶參與人機共創,既是人工智能時代技術追求的方向,也是將來的基本理念追求。

大模型還要真正提升數智化時代的生產力,才能更好助力科研、工業等民生剛需領域提質增效,這需要一系列能力的支持。“不僅包括邏輯推理能力,時空推理能力也同樣重要,數學是基礎能力,代碼能力能夠生成各種工具從而鏈接虛擬和現實世界,多模態能力也是面對陪伴機器人、工業、傢庭場景所必備的能力,訊飛星火V3.5在這些方面進展良好。”劉慶峰介紹道。

“當前,訊飛星火V3.5通過各方面能力的提升,已經達到了量質齊飛的關鍵點。”劉慶峰表示,2024年訊飛星火認知大模型的應用,一定會在越來越多的場景和領域中大放異彩。

首先賦能的場景,就是教育領域——此次,科大訊飛重磅推出星火智慧黑板,具備多模態理解與推薦、全自然交互、虛擬人輔學、智慧化錄課與分享四大功能。

發佈現場,愛因斯坦出現在星火智慧黑板上,用“吸力巨大的吸塵器”來比喻黑洞,深入淺出地為現場觀眾解釋“黑洞是什麼”。在立體幾何等知識的教學中,星火智慧黑板通過解構立方體,將枯燥的理論視覺化,教學課堂更加生動有趣。

“黑板不再是簡單的板書工具,而是躍遷成為教師的AI助手。”劉慶峰提及,在最近的實際展示與使用中,升級後的星火智慧黑板得到了師生、教育專傢和業務合作夥伴們的高度評價。

為什麼人工智能的每次進步都有對教育領域的賦能?劉慶峰解釋,通用人工智能作為能夠改變世界生產生活方式的全新技術,可以推動人類進步。“教育是人類進步的根本,關乎每一位個體,是真正的全民剛需。我們非常自豪,這些技術有可能賦能到每一個學校每一個孩子。”

正式發佈星火語音大模型

首批37個主流語種效果超過

OpenAI Whisper V3

“科大訊飛從創業之初的夢想和使命,就是要實現溝通無障礙。25年了,我們的目標和夢想一天都沒有變。”

“大模型帶來了語音技術發展的全新機會。”劉慶峰強調,讓機器具備學習、推理和決策的能力,就是認知大模型要幹的主要工作。“簡單來說,借助大模型,我們讓一段語音具備更加豐富的屬性,有語種、有內容、有韻律、有音色,還有情緒。”

他介紹,星火語音大模型效果國際領先,中文、英語、法語、俄語等首批37個主流語種的語音識別效果超過OpenAI Whisper V3,而在多語種語音合成方面,星火語音大模型的首批40個語種平均MOS分絕對提升0.25,擬人度超83%。

“通過星火語音大模型的評測效果,我們非常自豪地告訴大傢,科大訊飛繼續保持了全球領先的水平。”

在此優勢下,語音大模型的能力升級也應用於C端硬件產品。會上,劉慶峰介紹了搭載語音大模型的訊飛翻譯機,即將上線多語種自動識別和增強式翻譯兩個重要功能,分別於今年1月底和3月中旬完成升級。多語種自動識別讓國際溝通更加便捷,增強式翻譯技術讓翻譯機化身AI翻譯助手。據介紹,升級後的多語種自動識別將支持35種語言,讓國際溝通更加便捷,為跨語言溝通提質增效;增強式翻譯技術提供中英雙語服務,讓翻譯機化身AI翻譯助手,讓跨語言交流更加便捷省心。

星火語音大模型不止助力國際溝通,還能“百搭”更多場景,賦能實際應用。劉慶峰介紹,在汽車、客服、傢庭、陪伴機器人等場景中,星火語音大模型還有更多用武之地,帶來人機交互變革。如賦能汽車,智能駕艙、智能座艙、智能導航、音樂控制等交互體驗將進一步優化;通過大模型的多模態、語音能力,會讓今天已經很火爆的陪伴機器人產業前進一大步,還有智能傢居、穿戴式設備等。

訊飛星火賦能億萬用戶,加速賦能千行百業

“大模型發展,應用才是硬道理。”劉慶峰強調。訊飛星火自去年5月誕生以來,不斷迭代升級其大模型能力,深耕千行百業的應用剛需。

大模型的未來,要從教育開始做起。讓孩子站在人工智能肩膀上學習的訊飛AI學習機,能夠提高學習效率、激發學習興趣、提升綜合素養,產品用戶凈推薦值(NPS)持續保持行業第一,獲得2023年京東&天貓雙11銷售額冠軍。

大模型也在持續賦能辦公硬件,自去年5月訊飛星火正式發佈起,有超過60萬訊飛智能辦公本、智能錄音筆用戶累計調用語篇規整、會議紀要、自動寫稿等能力650萬次,讓工作更高效。市場用銷量表達好評,產品蟬聯京東&天貓雙11品類銷售額冠軍。

除了硬件產品,軟件應用也不在話下。星火賦能個人應用打造,目前基於訊飛聽見、訊飛星火APP、訊飛輸入法等應用,已累計賦能億萬用戶。在星火大模型賦能下,越來越多的用戶擁有專業AI助手。一位浙江的小學老師,使用智能問答功能高效完成教學方案設計,已累計使用APP262天、完成超2300篇產出;一位湖南的“情感咨詢師”,通過大模型咨詢人際關系等生活中的煩惱,現已累計使用161天、超9500次……這樣的例子還有很多,大模型正切實走入日常生活。

打造內容創作平臺,星火賦能百萬內容生產者。音視頻創作工具“訊飛智作”自去年8月15日發佈以來,新增了21萬會員用戶,生成了160萬音視頻內容;圖文創作工具“星火內容運營大師”自去年10月24日發佈以來,已服務了5000 企業,生成了超150萬篇文章,助力內容創作者高效生產。

今天,在訊飛開放平臺之上,大模型總開發者超35萬,其中企業開發者超22萬,開發者數增長迅猛,大模型應用加速落地,持續夯實第一開發者生態。“所以我非常自豪,訊飛星火大模型的開發者數量,在中國處於前列,而且用戶口碑非常好。”劉慶峰說道。

在此基礎上,科大訊飛也在加速賦能各個行業的頭部企業客戶。現場,劉慶峰提及了訊飛與奇瑞的合作。“奇瑞是安徽的驕傲,連續十幾年都是中國汽車出口量的第一名。”劉慶峰介紹,奇瑞汽車出口的國傢覆蓋英語、俄羅斯語、西班牙語、阿拉伯語、葡萄牙語等數十個語種,汽車中應用的智能語音交互技術全都由科大訊飛提供。“我們用大模型全力支撐中國汽車的全球化出海戰略,要讓汽車變得更聰明、更智能、更面向未來。”

此外,科大訊飛還與太平洋保險合作,通過星火太平洋計劃賦能內部知識服務、辦公、審計、展業等,打造數字勞動力在保險領域的應用標桿;聯合交通銀行,賦能客服、展業、辦公、研發等,重點打造銀行領域的代碼能力應用標桿;與國傢能源集團聯合,賦能煤炭、電力、運輸、化工等方面,打造央企集團一體化聯動的大模型應用標桿等。

科大訊飛與中國移動強強聯合,全面助力中國移動數智化轉型。在賦能“5G新通話”方面,中國移動攜手訊飛星火推出5G新通話創新應用“商務速記”,能夠實現通話語音同步紀要,關鍵事項精準提煉,且無需下載APP,所有手機都支持。

利用大模型賦能千行百業,把大模型技術的創造力轉化為促進產業高質量發展的新質生產力,正在成為行業的共同選擇。發佈會現場,還舉行了“大模型 5G新通話商務速記應用體驗”啟動儀式,科大訊飛高級副總裁江濤和中國移動市場部副總經理孫世偉共同參與,5G新通話創新應用“商務速記”向廣大移動用戶開放體驗。

劉慶峰表示,為加速企業大模型應用價值落地,訊飛星火V3.5將提供全棧自主可控的優化套件。基於全國產化算力打造的訊飛星火V3.5支持異構算力調度,可實現行業大模型訓練提效90%,支持23個企業應用場景的敏捷優化。

星火開源-13B正式發佈

深度適配國產算力

共享源代碼、開發出更好的軟件,是廣大開發者、高校、企業自主研發並熱衷於開源的關鍵原因,也是共建第一開發者生態的重要途徑。會上,首個基於全國產化算力平臺“飛星一號”的開源大模型——星火開源-13B正式發佈。

本次開源擁有130億稠密參數(13B),包含基礎模型iFlytekSpark-13B-base、精調模型iFlytekSpark-13B-chat,開源了微調工具iFlytekSpark-13B-Lora、人設定制工具iFlytekSpark-13B-Charater。學術企業研究可以基於全棧自主可控的星火優化套件,更便利地訓練自己的專用大模型。

劉慶峰透露,星火開源大模型在技術上形成了差異化優勢。星火開源-13B在多項知名公開評測任務中名列前茅,在文本生成、語言理解、文本改寫、行業問答、機器翻譯等企業典型場景中,通過對學習輔助、語言理解等領域的深入研究和優化,實用性大幅提升,在處理復雜的自然語言任務時更加得心應手。

基於“飛星一號”訓練,星火開源大模型全棧國產適配優化,簡單易用,場景應用效果領先,訓練策略針對昇騰算力極致優化,訓練效率達A100的90%。這不僅是對昇騰AI硬件的進一步深度優化,也展示了國產算力在追趕國際先進水平方面的決心和能力。

開源隻有更多的場景落地,才能更好地增進生態合作。目前,華為昇思開源社區已正式上架星火大模型開源版-13B,面對學術、企業研究完全免費,增進學術合作的同時,增進產業探索。

訊飛星火有信心在今年上半年

趕上GPT-4目前最好水平

“在今天的大模型時代,我們絕不能隻用開源模型做應用落地,在通用大模型的底座上一定要有國傢隊站出來。”劉慶峰強調。

“當前,發展通用人工智能是我們必須要做的事情,否則工業、科研、民生等各個專用領域都會極大落後於世界,而中國是世界唯一有望成為智慧湧現第二極的國傢。”

展望2024年訊飛星火大模型發展,劉慶峰指出三點:“首先,一定要在通用大模型的底層能力上持續對標國際最先進水平,從算法研究包括更小的算力上做出相對更優效果。”我們要清醒理智看到差距,當前在小樣本快速訓練、多模態深度學習訓練、超復雜深度理解等領域距離GPT-4的最好水平還有差距,訊飛星火有信心在今年上半年趕上GPT-4目前最好水平。

“今天的通用大模型並不一定代表人工智能的全部未來,還有很多創新要做,如腦科學互動、對抗網絡的深度連接等,需要整個創新的生態,但我們一定要有勇氣、有期許走在最前列。”劉慶峰指出。

第二,2024年要真正讓大模型量質齊飛,不僅是行業應用,還要在很多關鍵技術創新上聯動大模型,中國企業界、科學界有信心實現超越。”

第三,高樓大廈要建立在安全可控的平臺之上,我們要實現自主可控平臺上的生態繁榮。”劉慶峰表示自己有信心,能夠實現從算法、數據、應用場景到算力,構建一個完全自主可控的繁榮的人工智能生態。

“通用人工智能大未來剛剛開啟,它必將深刻改變世界的未來,需要頂天立地的長期主義精神。”頂天,指的是希望源頭核心技術在底層大模型能力上向國際最先進的能力看齊;立地,指的是大規模實現產業化。而這也是科大訊飛自成立起就一以貫之的信仰,需要在長期主義精神指引下推進各方面工作。

會上,新書《星火相傳》正式發佈。“這本書講述了科大訊飛創業的很多真實故事,但更是講述了科大訊飛奠基人、我的導師王仁華老師的教書育人經歷,希望能夠給訊飛人,給訊飛的合作夥伴,包括有志於做高校科技成果轉化、有志於判斷人工智能未來的朋友們以更多啟發。”劉慶峰說道。