國產大模型落地為王!訊飛星火如何快人一步?

2024年2月6日 22点热度 0人点赞

作者 | 程茜
編輯 | 漠影

大模型毋庸置疑是去年以來科技行業的“主角”,今天,大模型產業競爭的核心已然改變。

自2022年11月ChatGPT發佈掀起的科技革命,到百模大戰群雄逐鹿,如今隨著大模型與產業落地的結合日益緊密,各類應用層出不窮,大模型商業化成為所有參與者的核心目標。2024年儼然已經成為大模型商業化元年

此前大模型受研發成本高昂、落地場景不明晰、部署成本高等困擾商業化進程緩慢。就在昨天,2024年農歷春節前夕,AI國傢隊、國內大模型產業賽道的重要玩傢科大訊飛給出了自己的破局之道。

科大訊飛董事長劉慶峰、研究院院長劉聰正式發佈基於首個全國產算力訓練的訊飛星火V3.5,訊飛星火V3.5七大核心能力全面提升,數學、語言理解、語音交互能力超GPT-4 Turbo

科大訊飛發佈了星火語音大模型,語音識別方面首批37個主流語種效果超過OpenAI Whisper V3,基於此重磅升級了能自動識別語種的訊飛翻譯機,並首次發佈深度適配國產算力的訊飛星火開源大模型“星火開源-13B”,已在昇思開源社區聯合首發上線。

自去年5月以來,以訊飛星火認知大模型為核心的技術積累與應用經驗,已經成為科大訊飛在大模型商業化應用元年的重要支撐。

那麼,曾困擾大模型商業化的難題如何解?科大訊飛眼中的大模型落地場景應該是什麼樣?科大訊飛又是如何找到一步步走出屬於自己的路,成為行業引領者?我們試圖從科大訊飛星火大模型V3.5的重磅升級出發,找到這些問題的答案。

一、大模型進入商業化元年,三大難題待解

轟轟烈烈的百模大戰熱潮逐漸冷靜,但技術變革的深遠影響尚未停歇,科技發展的進階無不是真正與產業相結合,在真正的應用中發揮價值。

數據研究和分析機構Gartner預測,到2026年超過80%的企業將使用生成式AI的API(應用程序編程接口)、模型,或在生產環境中部署支持生成式AI的應用,而在2023年初這一比例不到5%。

但一直以來,大模型真正在行業應用中發揮價值,走向落地的進程都十分緩慢。這與大模型的能力、應用落地場景、算力三大挑戰有關。

首先是模型能力的挑戰。大模型的幻覺、智能化程度不夠等問題,直接會影響不同行業用戶對其的接受程度。不同於消費者,企業對於數據的安全隱私、大模型的可用性、生成內容的準確性要求極高,因此大模型除強大的生成、理解等能力,還需要真正解決行業問題,在業務中發揮價值。

其次是應用場景的挑戰。大模型需要找到有效的落地場景,其在企業內部的應用范圍十分寬泛,需要和內部大量數據進行深度融合,找到企業真正的痛點,並通過大模型的能力加以解決。這才能讓企業最迫切的需求與大模型能力相互匹配,在進一步提升大模型能力的同時,形成豐富的應用場景。

第三是算力挑戰。這既包含企業定制、微調大模型的算力成本,還包含國產大模型算力底座的自主可控。

對於下遊企業而言,其沒有足夠算力成本去定制、微調大模型。算力是大模型訓練和推理階段極為重要的物質基礎,但大模型熱潮湧起使得算力成本高漲,中小企業難以維系。然而,企業想要讓大模型與自己業務深度結合,就必須對大模型進行定制、微調,這也成為企業面前的一大攔路虎。

受波譎雲詭的國際形勢影響,國產化大模型產業的自主可控也是一大難題。隻有建立在自主可控的國產化算力平臺上,大模型產業才能實現可持續的良好發展。

隨著這些難題被逐漸突破,大模型的實用性更上一個臺階,結合其綜合能力解決真實世界的剛需被提上日程。在這一背景下,在大模型核心能力升級、商業落地應用、算力平臺部署上面有諸多經驗的訊飛,已經成為大模型商業化準備最充分的玩傢代表,並向著成為大模型落地的領跑者突圍。

二、訊飛星火V3.5升級,發語音、開源大模型,均基於全國產算力平臺“飛星一號”訓練

大模型改變世界的願景逐漸清晰,那麼站在大模型商業化元年?科大訊飛到底有哪些儲備?又該如何領跑?我們可以從這場發佈會的重點抽離出這傢如今大模型頭部玩傢的佈局邏輯,也代表了下一步大模型商業落地的競爭焦點。

訊飛星火V3.5實現了文本生成、語言理解、知識問答、邏輯推理、數學能力、代碼能力、多模態能力七大核心能力升級。其中,語言理解、數學能力超過GPT-4 Turbo,代碼能力達到GPT-4 Turbo的96%,多模態理解能力達到GPT-4V的91%

這些強大的能力已經在解決真實世界的剛需方面展現出強大潛力。

萬物互聯時代的人機交互方式正在被重塑,訊飛星火App上線了語音交互功能,該功能在與人的對話中能自動調用大模型的外部能力,實現全語音的自然交互。劉慶峰談道,從DOS界面到Windows界面成就了微軟的傳奇,從鍵盤到觸摸有了蘋果的神話,這一次全語音的自然交互會推動整個產業出現新一次的繁榮

語音技術一直以來都是科大訊飛的強項,自成立之初該公司就確定了實現人類和人機信息溝通無障礙的願景。科大訊飛在通用人工智能時代,繼續保持在語音交互方面領先優勢的同時,看到了新技術浪潮下的更多可能性。大模型可以幫助小語種語料訓練,通過更統一的多任務建模能力推動語音技術發展。

訊飛星火語音大模型基於語音屬性解耦表征預訓練,結合常規的語音大模型架構,實現了首批37個主流語種語音識別效果超過OpenAI Whisper V3,在多語種語音合成、超擬人語音合成方面MOS分有絕對優勢,MOS分指的就是生成的聲音是否自然。

此次搭載星火語音大模型的訊飛翻譯機還實現了重磅升級,可以實現多語種自主識別,無需用戶自主選擇,就可以自動識別說話人的語種並翻譯成中文。

此外,為了豐富大模型應用生態,科大訊飛發佈了130億參數規模的星火開源大模型系列,包括基礎模型、精調模型、微調工具和人設定制工具。星火開源-13B在多項知名公開評測任務中的文本生成、語言理解等典型場景中排名靠前。

最後就是大模型訓練的堅實底座——算力平臺,訊飛星火V3.5、星火語音大模型、星火開源大模型都是基於“飛星一號”訓練飛星一號就是去年10月24日訊飛宣佈正式啟用的首個支撐萬億參數大模型訓練的國產算力平臺。

訊飛星火V3.5是國內首個基於全國產算力訓練的大模型。星火開源大模型也基於飛星一號實現了全棧國產適配優化,訓練效率達A100的90%。這也意味著,科大訊飛為企業客戶提供了另外一種“大模型 算力”的選擇。

在這一特殊節點,大模型要立足於國產自主可控的算力平臺至關重要,劉慶峰稱,訊飛星火3.5正是對於國產算力平臺能否支撐起未來大模型研發的一次重要檢驗。

可以看出,科大訊飛在大模型產業的浪潮中很清楚自己要做什麼,怎麼做,並且在此前深厚的行業積累中,真正瞄準了行業痛點,知道自己要如何在這個行業中紮根生存並實現領先。

三、大模型升級與解決行業痛點並進,從通用大模型進階到解決民生剛需

縱觀整個大模型產業的發展,如今的商業化之爭既是全球科技的競爭,也成為國內生成式AI與全球同頻發展的關鍵環節,國內玩傢這一波百模大戰也進入了新的競爭關鍵。

從去年8月至今,國產大模型已經有共計4批通過大模型備案面向公眾化開放,並且如今在金融、教育、辦公賽道已經有諸多大模型應用。

作為首批通過備案的訊飛星火大模型的應用進展也毫不遜色。自去年5月至今,星火大模型在七大核心能力不斷升級的同時,硬件方面在教育領域打造了訊飛AI學習機,辦公領域有訊飛智能辦公本、訊飛錄音筆,軟件方面有訊飛聽見、訊飛星火App、訊飛輸入法等,還有內容創作的工具,如音視頻創作工具“訊飛智作”、圖文創作工具“星火內容運營大師”等已經將大模型的價值逐漸釋放給大量的用戶。

在訊飛開放平臺之上,大模型總開發者超35萬,其中企業開發者超22萬。

大量用戶的體驗與反饋,也在反哺大模型核心能力的不斷提升。

與此同時,劉慶峰談道,大模型如今已經不是用來簡單的寫詩、作畫,而是賦能科研、賦能工業、賦能民生的剛需場景,就是要讓大模型能夠提升成為數字化時代、智能化時代的全新生產力

科技創新到產業落地的距離,需要終端企業用戶與核心大模型玩傢的結合,才能逐漸縮短這之中的距離,同時也讓大模型商用落地的路徑更為清晰。

科大訊飛已經在不同賽道上有了大量的商業化積累。面向教育行業,科大訊飛推出了星火智慧黑板,具備多模態理解與推薦、全自然交互、虛擬人輔學、智慧化錄課與分享四大功能。這一功能將黑板的價值邊界進一步擴寬,成為老師的AI助手。

同時,科大訊飛與中國移動聯合推出5G新通話創新應用“商務速記”,可以實現用戶通話過程中同步紀要語音、提煉關鍵待辦事項等。

汽車行業頭部玩傢奇瑞汽車中應用的智能語音交互技術由科大訊飛提供,其出口的國傢覆蓋英語、俄羅斯語、西班牙語、阿拉伯語、葡萄牙語等數十個語種。可以看出,支撐中國汽車出海也是國產大模型商業化落地的一大潛力場景。

由此可以看出,大模型正在同步驅動B端和C端商業化落地,一方面,翻譯機、商務5G通話、AI PPT等能力正在被大模型重塑,讓前沿技術創新成為個人用戶的生產力工具;另一方面各行各業的頭部玩傢、創企正在與以科大訊飛為代表的大模型核心玩傢,進行商業化落地探索,在加速產業轉型升級的同時找到新的增長機遇。

更為重要的是,作為AI國傢隊的科大訊飛,在當下國內大模型商業化加速落地的同時,對於提供自主可控全國產算力平臺方面具有天然優勢。

如今,大模型商業化應用已經聚集了算力、大模型、終端企業等各方玩傢之力,使得大模型核心能力與應用落地進展同步推進,並且堅持安全可控。

即便此前在大模型核心能力方面,國內與國外一直存在較大差距,但進入商業化落地的新階段,依托國內豐富的應用場景與落地土壤,以科大訊飛為代表的玩傢正引領大模型新時代的變革。

結語:加碼大模型商業化落地,科大訊飛已快人一步

大模型在生成、理解等方面展現出的強大能力,使得AI正不斷拓寬其在千行百業中的應用邊界。當下,AI驅動的各類應用正在變革著人們的工作、生活、學習等。

但從大模型的商業化應用角度來看,正如前文所說,相比於C端消費者,企業業務集成大模型能力需要考慮模型能力、應用場景、算力的具體特點。這也是當下大模型產業迭代升級,向商業化進階的重中之重。

大模型玩傢的交鋒並沒有停歇,從百模大戰的拼算力、拼參數,如今的大模型已經越來越具備實用屬性。在這背後,既離不開業務端企業對前沿技術的深入了解,以及勇於探索嘗試,也離不開擁有核心技術的企業不斷突圍技術創新,堅定投入。

國內大模型核心玩傢、企業、算力商等諸多玩傢已被卷入新一波大模型浪潮中,成為大模型商業化應用生態構建的重要參與者,進一步彌補國內大模型產業與國外水平的差距。

面向未來,大模型將作為一種必需品,在企業提升全球競爭力的過程中扮演著關鍵角色,科大訊飛在AI行業深耕20餘年積累的一系列先發優勢,將成為當下其在大模型競爭關鍵環節快人一步的重要支撐。