一年內四次迭代,訊飛星火大模型銜枚疾進

2024年2月6日 19点热度 0人点赞

作者|深水財經社 何離

自2023年5月首次發佈訊飛星火認知大模型之後,科大訊飛在一年時間內開了五次發佈會,從1.0開始到3.5,訊飛星火在一年時間裡已經有四次迭代,每一次迭代都是星火大模式裡程碑式飛躍。

1月30日下午,訊飛召開了星火認知大模型V3.5升級發佈會,這次會議是通過線上召開,但是也同樣熱鬧非凡,有數萬人在直播間觀看。

據介紹,星火3.5版本七大核心能力全面提升,數學、語言理解、語音交互能力超GPT-4 Turbo,此次還首次發佈星火語音大模型,首批37個主流語種語音識別效果超過OpenAI Whisper V3,賦能訊飛翻譯機迎來全新升級助力更自由溝通,推動萬物互聯時代下客服、汽車、機器人等場景人機交互的變革。

“訊飛星火V3.5能力的提升,已經達到了量質齊飛的關鍵點。”劉慶峰表示,2024年訊飛星火認知大模型的應用,一定會在越來越多的場景和領域中大放異彩。

銜枚疾進追趕GPT-4

2022年12月15日,科大訊飛正式啟動“1 N”認知大模型專項攻關,其中“1”就是指通用認知智能大模型,“N”就是大模型在教育、辦公、汽車、人機交互等各個領域的落地。

2023年是從語音智能科技公司向人工智能科技跨越的元年,在去年5月份,他們首次發佈星火認知大模型,這也算是星火的1.0版本,但已經集成了通用人工智能領域文本生成、語言理解、知識問答、邏輯推理、數學能力、代碼能力以及多模態能力七大維度。

星火1.0一炮走紅,讓國內AI界立刻對科大訊飛刮目相看,基於對標世界AI巨頭ChatGPT,劉慶峰也是給出了明確的追趕時間表,甚至在當時外界對科大訊飛的AI大模型是不是在畫大餅存在爭議。

但是劉慶峰和他們AI團隊並沒有食言,在1.0發佈後,公司接下來如約在5月、8月和10月分別發佈了星火V1.5、V2.0和V3.0,在這一次3.5版本發佈的同時,還發佈了與華為聯合打造的大模型算力底座“飛星一號”平臺。

三個月後,也就是1月30日,基於這個全國產算力平臺“飛星一號”訓練的訊飛星火大模型V3.5版本正式對外發佈。在這一版本中,通用AI七大核心能力全面提升,數學、語言理解、語音交互能力超GPT-4 Turbo,首次上線的星火語音大模型首批37個主流語種語音識別效果超過OpenAI Whisper V3。

據了解,V3.5之所以能夠這麼快發佈,正是去年10月發佈的飛星一號的功勞。作為首個支撐萬億參數大模型訓練的國產算力平臺,飛星一號在啟用後的90多天裡,訊飛星火便發佈了對標GPT-4的更大參數規模的大模型,目前已經在語言理解、數學能力超過GPT-4 Turbo,代碼達到GPT-4 Turbo 的96%,多模態理解達到GPT-4V 的91%。

通過試用發現,訊飛星火V3.5不僅在語義理解、指令跟隨和多輪對話的演示中,展現出優異的能力,更是在情緒感知和擬人合成方面表現出色。

在實操演示環節,科大訊飛研究院院長劉聰和訊飛星火V3.5現場互動,訊飛星火V3.5一口地道的東北話逗樂現場觀眾。幽默之餘,訊飛星火V3.5快速為劉聰定制了旅遊攻略,還催促他趕快買票,春運機票緊俏。

行業應用加速落地

AI大模型並不是拿來做遊戲的,而是必須要實實在在能夠在不同行業應用,提升企業經營效率的。

技術進步如何為人類生活帶來真正有效的解決方案?劉慶峰從全新賦能萬物互聯時代人機交互、全新賦能知識學習與內容創作、全新提升數智化生產力三個方面,向現場觀眾展示訊飛星火V3.5的能力提升。

在進化至V3.5之後,科大訊飛在行業應用開拓方面已經大有突破,甚至已經走在國內同行的前列。

首先是在開發者生態建設方面,星火開發者已經超過35萬,其中企業開發者超22萬,開發者數增長迅猛,大模型應用加速落地,持續夯實第一開發者生態。

劉慶峰表示:“我非常自豪,訊飛星火大模型的開發者數量,在中國是最高的,而且用戶口碑非常好。”

1月30日,會上,首個基於全國產化算力平臺”飛星一號”的開源大模型——星火開源-13B和昇思開源社區也同時首發上線。

星火開源大模型在技術上形成了差異化優勢。據了解,星火開源-13B在多項知名公開評測任務中名列前茅,在文本生成、語言理解、文本改寫、行業問答、機器翻譯等企業典型場景中,通過對學習輔助、語言理解等領域的深入研究和優化,實用性大幅提升,在處理復雜的自然語言任務時更加得心應手。

共享源代碼、開發出更好的軟件,是廣大開發者、高校、企業自主研發熱衷於開源的關鍵原因,也是共建第一開發者生態的重要途徑。

其次是利用星火大模型為各行業企業賦能。在這次發佈會上,劉慶峰提及了訊飛與奇瑞的合作,奇瑞汽車出口的國傢覆蓋英語、俄羅斯語、西班牙語、阿拉伯語、葡萄牙語等數十個語種,汽車中應用的智能語音交互技術全都由科大訊飛提供。“我們用大模型全力支撐中國汽車的全球化出海戰略,要讓汽車變得更聰明、更智能、更面向未來。”

除了汽車行業,還與太平洋保險合作,通過星火太平洋計劃賦能內部知識服務、辦公、審計、展業等,打造數字勞動力在保險領域的應用標桿;聯合交通銀行,賦能客服、展業、辦公、研發等,重點打造銀行領域的代碼能力應用標桿;與國傢能源集團聯合,賦能煤炭、電力、運輸、化工等方面,打造央企集團一體化聯動的大模型應用標桿等。

展望2024年訊飛星火大模型發展,劉慶峰指出三點:“首先,一定要在通用大模型的底層能力上持續對標國際最先進水平,我們要清醒理智看到差距,當前在小樣本快速訓練、多模態深度學習訓練、超復雜深度理解等領域距離GPT-4的最好水平還有差距,訊飛星火有信心在今年上半年趕上GPT-4目前最好水平。”

“今天的通用大模型並不一定代表人工智能的全部未來,還有很多創新要做,如腦科學互動、對抗網絡的深度連接等需要整個創新的生態,但我們一定要有勇氣、有期許走在最前列。”劉慶峰指出。

(全球市值研究機構深水財經社獨傢發佈,轉載引用請註明出處)