訊飛星火V3.5發佈!對標GPT-4,落地更有優勢?

2024年2月6日 17点热度 0人点赞

2024年,生成式人工智能仍然是最引人註目的科技焦點。

從初期對人類指令懵懵懂懂的所謂「人工智能」,到今天聽到一個口令就能老老實實地為我們繪畫、寫稿……AI帶來的生產力顯著提升,很多人都希望用它輔助自己的工作學習,以此提高效率,甚至偷點小懶。

在AI的浪潮下,當前國內科技龍頭企業密集推出人工智能大模型,騰訊、華為、阿裡、百度等巨頭紛紛入局,投入資源、潛心研究,業界呈現出百花齊放、迅猛發展的態勢,“百模大戰”如火如荼。

不過,目前國內外各傢大模型,其實很多都處在內部測試階段,僅註冊門檻、使用門檻就已經攔截了99%的用戶。

在這之中,早早開啟全民測試的訊飛星火,是個特殊的存在。

1月30日,科大訊飛發佈了基於首個全國產算力平臺「飛行一號」訓練的全民開放大模型——訊飛星火V3.5版本。


(圖源:科大訊飛)

相較於上一個版本,訊飛星火V3.5版本在文本生成、語言理解、知識問答、邏輯推理、數學能力、代碼能力、多模態能力等七大核心能力上均實現大幅提升,進一步逼近GPT-4 Turbo的最新水平。

不僅如此,科大訊飛還在本次發佈會上帶來了全新的星火語音大模型,以及首個深度適配國產算力基建的訊飛星火開源大模型,持續建設夯實國產大模型業態,為實體經濟帶來新機遇。

還是老規矩,沒蹲發佈會的朋友們,就跟著小雷往下看吧。

核心能力全面升級,對標GPT-4

自從去年五月份發佈以來,訊飛星火大模型在短短八個月內經歷了數次迭代。

當初訊飛在現場給出星火大模型年內的三次升級裡程碑和時間點,如今已經在6月9日、8月15日、10月25日如期落地,星火認知大模型V3.0的快速落地,更是推動著訊飛大模型能力迅速迫近行業前列。


(圖源:科大訊飛)

先來看看多輪對話,訊飛研究院院長劉聰在現場和星火V3.5展開了一段稀松平常的傢常對話。


在對話過程中,星火會主動捕捉到用戶當前所處的狀態並積極發問。例如在劉聰表示年末瑣事很多很辛苦後,星火會主動詢問劉聰過年準備去哪裡旅遊放松,並針對劉聰提出的目的地給出了詳細的旅遊建議。

(圖源:科大訊飛)

不難看出,訊飛星火認知大模型V3.5已實現從多輪對話、主動對話再到啟發探究式對話的跨越,能夠實現人機完全主動交流對話。

在語義理解、指令跟隨、多輪對話、情緒感知和擬人合成等核心能力進步後,星火V3.5將有望徹底改變萬物互聯時代的人機交互模式。

(圖源:科大訊飛)

在語言語義理解方面,訊飛星火3.5表現如何?劉聰先是為星火提供了一篇安徽省的報告,並要求星火就這篇文章提出5道理解題。

(圖源:科大訊飛)

隨後,他要求星火條理清晰地回答其中的第一道題和第三道題。

星火V3.5可以按照文章內部的順序條理清晰地回答兩道問題,不僅僅概括了這段文字講述的具體事件,更能就文章內容給出自己的態度和觀點,讓人可以直觀清晰地獲取到想要了解的信息。

(圖源:科大訊飛)


文本生成方面,在導入現有資料後,訊飛智文可基於合肥2024年春節旅遊介紹這個主題,快速生成PPT提綱和不同風格的PPT,甚至可以在確定PPT內容後自動生成相關聯的AI演講備註和講述人。

(圖源:科大訊飛)

對,這下不僅PPT不用動手做,甚至可能都不需要你動嘴來講了。


最後來考考邏輯推理能力,劉聰當場提出了一些容易誤導大模型出現AI幻覺的問題。

比如“臉盆裡面漂浮著一塊冰,請問冰融化之後,臉盆裡面的水位是會上升還是下降?”“一個人出門散步,前進20米,右轉60度,前進20米,再右轉60度,如此反復下去,請問他能不能回到原點? 如果能回到原點,一共走了多遠?”等問題,結果,星火V3.5均能準確回答。

即便是基於立體圖形的幾何題,星火V3.5都給到了一個與事實相符合的答復。

(圖源:科大訊飛)


從這些問題的答案中可以清晰地看出,星火V3.5在邏輯推理能力方面已有一個比較優質的體現,能夠對用戶提出的問題提供更加準確、全面和專業的回復。

或許,這就是更適合中國寶寶體質的大模型吧。

(圖源:科大訊飛)


首次發佈語音大模型,讓對話更自然更真實


提起科大訊飛,「語音」是很多人想到的第一標簽。


即便是在被持續制裁的情況下,訊飛語音也始終走在世界前列。而語音,是AI的基礎,不論是NLP(自然語言處理)、知識圖譜、語義理解、語音識別、語音合成,均是核心的AI技術。語音AI的多年發展,是大模型的重要基礎,反過來,大模型也將進一步強化語音AI技術。

如今,在大模型推動語音技術突破後,人機交互將迎來新的發展階段。


(圖源:科大訊飛)

星火語音大模型由多語種語音合成,在首批37個主流語種上已整體超越OpenAI公司推出的Whisper-large-v3,保持科大訊飛智能語音技術的國際領先水平。

不僅如此,星火語音大模型在首批40個語種平均MOS(Mean Opinion Score,評估音頻質量的一種分數)分絕對提升0.25,MOS達到了4.5,擬人度達到了83%以上,成功保持科大訊飛在智能語音技術上的國際領先水平。


(圖源:科大訊飛)


訊飛翻譯機將成為首批搭載星火語音大模型的硬件產品。此外,訊飛語音大模型還可被廣泛應用於智能客服、智能播音、語言助手、車機互聯等領域。

(圖源:科大訊飛)


星火智慧黑板,新一代專業教育硬件

在本次發佈會上,訊飛還展示了基於星火V3.5賦能的星火智慧黑板。

這塊智能黑板,不僅能夠智能識別教師的板書,將板書數字化,還能基於板書內容提供相關課件資料供學生參考,甚至可以實現立體建模的拆解劃分,讓圖形變得更加直觀。

(圖源:科大訊飛)

至於學校很難配備的口語教師和科學教師,星火智能黑板也都有集成,讓孩子們可以練好口語和學習科學;而對老師課程記錄的匯總與亮點提取功能,則讓孩子們可以更好地對不清楚的知識點查漏補缺地復習。

OpenAI創始人奧特曼就曾表示,他本人特別看好的AI應用領域有兩個:一個是醫學顧問,另一個就是賦能教育。 至少在後一點上,依托科大訊飛在教育行業的多年積累,星火V3.5做到了。

訊飛星火“兩手抓,兩手都要硬”

不難看出,在大模型的發展上,訊飛星火做到了「兩手抓,兩手都要硬」

一方面,訊飛在持續投入迭代星火大模型,推動著自然語言交互、多場景內容生成、語音等核心能力不斷提升,並通過積極地對外開放測試,力求成為用戶生活和工作中不可或缺的小助手。

另一方面,在「平臺 賽道」的戰略指引下,科大訊飛堅持深耕人工智能生態建設,力求讓「訊飛星火」普惠更多行業,有效提升現有產品的生產力,同時曾經高不可攀的社會創新創業門檻也得以降低。

(圖源:科大訊飛)


大模型的上半場是技術較量,下半場是應用落地,必須從技術參數的軍備競賽、好玩炫酷的演示Demo,走向千行百業,實現應用落地、賦能場景、服務人類的生活、工作、學習與娛樂,才能釋放出技術該有的價值。

在下半場,中國玩傢擁有產業場景優勢,要知道我國不僅有著全球最完整的產業體系,同時在教育、醫療等領域還有著全民普惠的結構,這給大模型的落地應用提供了廣闊的創新空間。與此同時,中國科技企業更善於做“接地氣”的落地,就像科大訊飛們在做的事情一樣。

為了進一步加速大模型行業落地,科大訊飛還正式推出了首個深度適配國產算力的訊飛星火開源大模型,吸引國內底層軟硬生態夥伴、行業龍頭、萬千開發者一起共建大模型產業生態。

屬於國產大模型的時代,正在到來。