百川智能發佈千億級參數的大語言模型Baichuan3

2024年2月6日 20点热度 0人点赞

觀點網訊:1月29日,百川智能發佈了超千億參數的大語言模型Baichuan3。該模型采用“動態數據選擇”、“重要度保持”及“異步CheckPoint存儲”等技術,顯著提升了性能,相較業界主流框架提升超過30%。其穩定訓練時間長達一個月以上,且故障恢復迅速,不超過10分鐘。在多項能力測評中,如CMMLU、GAOKAO、AGI-Eval以及數學和代碼專項評測MATH、HumanEval、MBPP等,Baichuan3均表現出色。

在醫療領域權威評測MCMLE、MedExam、CMExam中,它更成為中文醫療任務最佳大模型。Baichuan3通過“迭代式強化學習”技術,進一步增強了語義理解和生成能力。

本文源自觀點網