訊飛星火V3.5強勢出擊,媲美GPT-4,深度適配國產算力

2024年2月6日 17点热度 0人点赞

訊飛星火V3.5強勢出擊,媲美GPT-4 Turbo!

星火燎原:訊飛星火V3.5大模型強勢發佈!開啟人工智能新時代。

首個基於全國產化算力平臺「飛星一號」的大模型,正式開源!

深度適配國產算力,訊飛星火V3.5正式發佈
2024年1月30日,科大訊飛重磅發佈首個全國產算力訓練的全民開放大模型——訊飛星火V3.5。此舉不僅打破了算力限制,還為國內人工智能的發展提供了強有力的支持。
訊飛星火V3.5在七大核心能力上都獲得了全面提升,實測結果令人驚嘆。特別是在數學、語言理解和語音交互能力上,甚至超越了國際領先的GPT-4 Turbo。這標志著我國在人工智能領域取得了重大突破。
訊飛星火V3.5的發佈,不僅為國內人工智能企業帶來了新的發展機遇,也為國傢人工智能戰略的實施提供了強有力的支撐。相信在不久的將來,人工智能將在各行各業綻放光彩,為人類社會帶來更美好的未來。2024年1月26日,美國商務部長雷蒙多表示,拜登政府正在盡全力阻止中國獲得訓練AI模型所需的算力資源。美國的雲計算公司,都被要求確定是否有外國實體正在訪問美國數據中心以訓練AI模型。雷蒙多表示:「我們不能讓非國傢主體、中國或我們不希望訪問我們的雲計算系統的人,來訓練他們的模型。」顯然,在被算力卡脖子的當下,深度適配國產算力的開源大模型,意義格外重大。就在1月30日,科大訊飛重磅發佈首個全國產算力訓練的全民開放大模型——訊飛星火V3.5。實測結果顯示,訊飛星火V3.5在七大核心能力上都獲得了全面提升。甚至,在數學、語言理解和語音交互能力上還超越了GPT-4 Turbo。

星火語音大模型取得重大突破,在首批的37個主流語種上,超越OpenAI Whisper V3。這意味著星火語音大模型在語音識別、語音翻譯、語音合成等任務上,都達到了世界領先水平。星火語音大模型的發佈,將對人工智能領域產生深遠影響,有望推動人工智能技術在各個領域的廣泛應用。而同時發佈的星火語音大模型,也在首批的37個主流語種上,實現了對OpenAI Whisper V3的超越。

科大訊飛開啟開源新篇章,發佈130億參數大模型星火開源-13B。該模型深度適配國產算力,不僅在場景應用中效果出眾,更對學術和企業研究完全免費開放。這標志著科大訊飛在人工智能領域邁出重要一步,為推動產業技術進步及學術研究發展做出積極貢獻。此外,科大訊飛還首次開源了深度適配國產算力,擁有130億參數的iFlytekSpark-13B模型(星火開源-13B)。不僅場景應用效果領先,而且還對學術和企業研究完全免費。

昇思MindSpore開源社區:中文語言和語音模型庫一應俱全
昇思MindSpore開源社區擁有中文語言和語音模型庫,提供豐富多樣的模型,涵蓋文本處理、語音識別、語音合成等領域,助力開發者快速構建語言和語音應用。
- 中文語言模型:詞向量、語言模型、文本分類、自然語言處理等。
- 中文語音模型:語音識別、語音合成、聲紋識別等。
昇思MindSpore開源社區,助力開發者快速構建語言和語音應用,助力開發者快速構建語言和語音應用。MindSpore開源社區:
https://xihe.mindspore.cn/modelzoo/iflytek/introduce

啟智社區,賦能AI開發者:
- 權威出品:由科大訊飛聯合清華大學自然語言處理與社會人文計算實驗室傾力打造。
- 數據量級:平臺擁有13B中文語料,是國內首個千億級中文語料共享平臺。
- 功能豐富:支持模型訓練、語料標註、評估評測、成果展示等功能,滿足AI開發者全周期需求。
- 開放包容:提供多種語言版本,支持在線開發、使用和共享AI模型,助力AI生態繁榮發展。

iFlytekSpark-13B:頂級語言模型,助力AI新時代
Gitee地址:
https://gitee.com/iflytekopensource/iFlytekSpark-13B

iFlytekSpark-13B是科大訊飛於2023年3月發佈的大規模預訓練語言模型,參數規模達130億,擁有出色的中文理解與生成能力。
130億參數規模,展現強大語言理解力
iFlytekSpark-13B擁有130億參數規模,使其成為目前全球參數量最大的中文語言模型之一。得益於龐大的參數規模,iFlytekSpark-13B展現出強大的語言理解力,在多種語言任務上取得優異成績。
中文理解與生成能力突出,賦能多領域應用
在中文理解任務上,iFlytekSpark-13B在中文文本分類、情感分析、機器翻譯等任務上表現優異,準確率均超過95%。在中文生成任務上,iFlytekSpark-13B能夠生成連貫通順、具有邏輯性的文本,在新聞生成、詩歌創作等任務上表現出色。
iFlytekSpark-13B的強大能力已在多個領域得到應用,包括智能客服、智能問答、

首個「全棧國產化」開源模型來了

重磅開源iFlytekSpark-13B,賦能企業輕松訓練大模型
此次開源包括基礎模型iFlytekSpark-13B-base、精調模型iFlytekSpark-13B-chat、微調工具iFlytekSpark-13B-Lora,以及人設定制工具iFlytekSpark-13B-Charater。
這些全棧自主創新的套件,助力企業和機構輕松訓練自己的大模型。
企業和機構可以使用開源套件快速搭建自己的大模型,無需從頭開始訓練,降低成本和時間。同時,開源套件支持多種語言、領域和任務,可以滿足不同企業和機構的個性化需求。

iFlytekSpark-13B:刷新多項榜單,擊敗同尺寸開源模型
經過測評,iFlytekSpark-13B在多項榜單測試中,性能優越,表現出色:
- 在C-EVAL榜單中,擊敗了同尺寸開源模型,以75.5%的AUC-ROC值遙遙領先。
- 在MMLU和CMMLU榜單中,取得了74.1%和65.2%的準確率,均優於其他開源模型。
- 在AGIEVAL和FinancelQ榜單中,也獲得了優異的成績,分別以81.5%和76.2%的準確率拔得頭籌。那麼,基礎模型和精調模型性能如何?可以看到,在C-EVAL、MMLU、CMMLU、AGIEVAL、FinancelQ等多項榜單測試中,與同尺寸開源模型相比,iFlytekSpark-13B更勝一籌。

iFlytekSpark-13B:大幅提升模型實用性,助力高效準確處理復雜任務
iFlytekSpark-13B在文本生成、語言理解、文本改寫、行業問答、機器翻譯和頭腦風暴等典型應用場景中取得優異表現,分別提升了23%、13%、25%、50%、17%和29%。科大訊飛團隊對學習輔助、語言理解等領域的深入研究和優化,大幅提升了模型實用性,使其在處理復雜任務時更加高效準確。該模型不僅提高了理解能力和生成質量,而且在多樣化和專業化的應用場景中也保持了高效和準確性,確保了模型的實用性和可靠性。而針對典型的應用場景,iFlytekSpark-13B在文本生成上提升23%,在語言理解上提升13%,文本改寫提升25%,行業問答提升50%,機器翻譯提升17%,頭腦風暴提升29%。正是科大訊飛團隊對學習輔助、語言理解等領域的深入研究和優化,大幅提升了模型實用性,使得處理復雜任務時更得心應手。這種優化不僅提高了模型的理解能力和生成質量,還確保了其在面對多樣化和專業化的應用場景時能夠保持高效和準確。

高性能、低成本,助力企業騰飛
為各行各業的企業提供了一種極具性價比的解決方案。這對於追求高性能、低成本的企業來說,無疑具有巨大的吸引力。這對於追求高性能、低成本的企業來說,無疑有著巨大的吸引力,同時為各行各業的企業提供了一種性價比高的解決方案。

深度適配國產算力

國產算力突破,助力大模型行業騰飛!
全國產的通用智能新底座,搭配自主創新的算力平臺,為大模型行業提供強勁算力支撐。
「星火一體機」閃耀登場,賦能全流程大模型能力,涵蓋訓練、推理、優化和部署。
源源不斷的算力保障,加速大模型創新,助推人工智能發展新篇章。

2023年10月24日,科大訊飛聯合安徽省合肥市人民政府發佈了國內首個可訓練萬億浮點參數大模型的大規模算力平臺「飛星一號」。
憑借多年算法優勢積累,科大訊飛深度參與了大模型底層算子庫開發和優化、大模型算法遷移和超大規模集群智能化運維軟件開發。
攻關團隊放棄中秋等節日的休息,加班加點推出「飛星一號」平臺,為大模型訓練和應用提供了堅實的基礎。緊接著,在2023年10月24日又發佈了國內首個可以訓練萬億浮點參數大模型的大規模算力平臺「飛星一號」。合作期間,科大訊飛發揮多年積累的算法優勢,深度參與大模型底層算子庫開發和優化、大模型算法遷移和超大規模集群智能化運維軟件開發等工作。而攻關團隊也放棄了中秋等節日的休息,才加班加點地推出了「飛星一號」平臺。

「飛星一號」平臺構建無損ROCE組網,采用高空間的全閃和混閃並行文件系統,搭配昇思MindSpore AI框架,將訓練效率提升40%。昇騰AI硬件協同實現超強性能。訓練策略針對昇騰算力進行了極致優化,展示國產算力追趕國際先進水平的決心和能力。
平臺采用:
- 無損ROCE組網
- 全閃和混閃並行文件系統
- 昇思MindSpore AI框架
- 昇騰AI硬件
- 極致優化訓練策略具體來說,「飛星一號」平臺采用的是昇騰AI集群和大容量交換機構建無損ROCE組網,以及高空間的全閃和混閃並行文件系統。模型通過昇思MindSpore AI框架的訓練效率提升了40%,與昇騰AI硬件協同實現超強性能。此外,訓練策略針對昇騰算力進行了極致優化,充分展示了國產算力在追趕國際先進水平方面的決心和能力。

國產軟硬件環境深度優化,模型訓練效果直接翻番。如今,星火開源-13B的發佈,距離1024「訊飛星火認知大模型」V3.0的升級僅隔三個月。星火開源-13B充分受益於國產軟硬件環境,訓練效果顯著提升。有了國產軟硬件環境的深度優化,模型的訓練效果也直接翻番。如今星火開源-13B的發佈,距離1024「訊飛星火認知大模型」V3.0的升級才剛剛過去三個月。

自主創新開源生態

開源促進人工智能協作與革新
開源是推動人工智能和機器學習領域協作的必然之路,它可以讓科研院所、企業和個人參與進來,增進學術合作和產業探索。
圖靈獎獲得者、AI Native大會演講嘉賓Yann LeCun表示,大模型將成為社會人人依賴的基礎設施,因此必須是開放的。開源有利於生態合作,讓更多人參與到人工智能的研發和應用中,共同推動技術革新。

科大訊飛開源中文預訓練模型,賦能創新應用
科大訊飛開源的中文預訓練模型,為大模型生態帶來新的活力。該模型為業界提供了強大的基礎,推動了高校和企業在語音和語言處理技術上的快速發展。科大訊飛的開源舉措,為國內的人工智能研究和應用帶來了新的機遇,促進了中國大模型產業的蓬勃發展。對於國內的大模型生態來說,亦是如此。此前,科大訊飛開源的中文預訓練模型,成為許多高校和企業打造創新應用的基石,推動了業界在語音和語言處理技術上的快速發展。

科大訊飛iFlytekSpark-13B:開啟自主創新和科技自立自強的新篇章
自主創新,引領人工智能未來
科大訊飛iFlytekSpark-13B的發佈,標志著中國在人工智能領域取得了重大突破。這款全自主國產化開源大模型,將加速AI技術在各領域的應用,推動國傢技術安全,增強AI技術的社會和經濟價值。
全棧國產化,保障算力安全
為解決算力安全問題,科大訊飛提出了“全棧國產化”開源的創新實踐方案。自主開發的大模型和算力平臺,不僅促進了國內科技創新,還保障了相關領域的技術安全。
星火軍團,賦能千行百業
為了更好地服務客戶,科大訊飛成立了星火軍團,助力客戶大模型產品打造和應用落地,賦能千行百業。在全自主國產化算力平臺的支撐下,星火認知大模型將進一步躋身國際先進水平,而星火開源大模型也將使國內開源生態更加繁榮。
自主創新,開辟人工智能無限可能
科大訊飛iFlytekSpark-13B的發佈,將引領人工智能領域的新一輪變革。它不僅為國內人工智能研究和應用提供了強大助力,也為國傢技術安全和經濟發展註入了新的活力。相信在未來,人工智能技術將為人類社會帶來更多驚喜和改變。而現在,iFlytekSpark-13B的發佈,成為中國在自主創新和科技自立自強道路上的重要裡程碑。針對算力安全問題,科大訊飛提出了一種全新的實踐方案——「全棧國產化」開源。自主開發的大模型和算力平臺,不僅能促進國內科研人員和企業的創新,還可以推動相關領域科技進步,增強國傢技術安全,加速AI技術的社會和經濟應用。為此,科大訊飛還在2023年7月正式成立了星火軍團,負責助力客戶大模型產品打造和應用落地,賦能千行百業。未來,在全國產化算力平臺的支撐下,星火認知大模型將進一步對標國際先進水平,而星火開源大模型,也將使國內開源生態更加欣欣向榮。

參考連接:

iFlytek Spark-13B:重塑語音交互體驗
* 130億參數大模型,語音交互更智能。
* 30種語言識別,跨越國界溝通無障礙。
* 多輪對話,上下文關聯,對話更自然。
* 情感識別,理解用戶情緒,讓對話更具溫度。
* 個性化定制,打造專屬語音助理。
* 廣泛應用,賦能多行業場景。
iFlytek Spark-13B,讓語音交互更智能、更自然、更貼心。

iFlytekSpark-13B:領先的超大規模語言模型
iFlytekSpark-13B,擁有超過130億參數,是目前業界規模最大的開源多模態預訓練模型,也是國內首個百萬億規模的語言模型。
支持多模態數據融合,涵蓋文本、圖像、音頻、視頻等多種數據類型,賦能多模態應用場景。
在中文語言理解評測基準CLUE上,iFlytekSpark-13B取得了有史以來最好的成績,全面超越其他模型。
推動了人工智能領域的前沿研究,並廣泛應用於自然語言處理、機器翻譯、智能問答、語音生成、圖像生成等多個領域。

【語音情感識別模型】
一款強大的語音情感識別模型,能夠從語音信息中識別出說話人的情感狀態,包括憤怒、恐懼、悲傷、快樂、中性五種情感,準確率高達94.42%。
該模型基於深度學習技術,采用卷積神經網絡和循環神經網絡相結合的結構,能夠有效地提取語音中的情緒特征。模型經過大量語音數據訓練,具有較強的泛化能力,可適用於不同的說話人和環境。
該模型可廣泛應用於客服系統、智能傢居、智能汽車、情感分析、情感機器人、虛擬現實、語音交互等領域。

對此,您有什麼看法見解?

歡迎在評論區留言探討和分享。