AI算力限制升級背後的“陽謀”

2024年2月6日 12点热度 0人点赞

1月29日,美國商務部在Federal Register(聯邦公報)正式公佈了《采取額外措施應對與重大惡意網絡行為相關的國傢緊急狀態》提案。

這個提案的意思並不復雜,就是要求美國IaaS(雲服務)廠商在提供雲服務時,要驗證外國用戶身份,限制外國行為者對美國IaaS產品的訪問,並要求詳細報告訓練AI大模型的外國交易,以保護美國的網絡安全和利益。

這次提案,相當於對此前中國AI封鎖命令的“升級”。在美國限制高性能計算芯片對華出口的措施後,借用國外雲廠商的服務,被認為緩解國內“缺芯”局面的“解決方案”。隨著此次提案的出臺,意味著美國實現了對中國AI產業從高端芯片到雲服務整個基礎設施的全面限制。

不過與高性能計算芯片的嚴格限制不同,此次法案更側重於對中國大模型發展情況的長期監測。但即使如此,也不能完全排除後續更多限制政策的可能性。當所有人都被註意力放在追尋大模型性能極限的時候,在一個更大的舞臺上,一場關乎人工智能的角逐也在緩緩拉開帷幕。

/ 01 / AI封鎖再升級

此次提案一共38頁,包含對AI模型、客戶識別計劃以及AI大模型訓練審核報告等內容。具體來說,該提案的內容主要有三點:

一是要求美國IaaS提供商構建自己的客戶識別程序(CIP)。而一旦該程序發現有“外國人”使用其雲服務,並且用於訓練具有“潛在用於惡意網絡活動的能力的AI大模型”, 美國IaaS提供商就必須向商務部提交涵蓋“外國人”的身份、符合第14110號人工智能行政令規定或由商務部長確定的AI模型的“訓練運行”情況等信息的報告。

二是要求美國IaaS提供商以及國外經銷商構建維護、保護和獲取在驗證客戶身份過程中訪問的相關客戶信息記錄的程序。此記錄必須包括客戶首次嘗試開設賬戶時提供的身份證據和屬性的描述,驗證客戶身份所采取的任何措施的方法和結果的描述,以及驗證識別信息時發現的任何實質性差異的解決方案的描述。也就是說,客戶識別程序過程中的所有資料需被留存。

三是美國IaaS提供商還必須向商務部提交客戶識別程序的認證表,其中包括用於驗證外國人身份的機制、服務、軟件、系統或工具的描述、用於要求客戶通知IaaS提供商其所有權變更的程序、IaaS提供商用於持續驗證客戶提供信息準確性的流程,還必須描述IaaS提供商用於檢測惡意網絡活動的機制、服務、軟件、系統或工具。

表面上看,這是為了防范潛在的AI威脅而采取的措施。但實質上,更像是美國政府於2023年10月17日出臺進一步限制高性能計算芯片對華出口的措施之後,對中國AI封鎖命令的又一次升級。

此次監管的思路借鑒於銀行業的“了解你的客戶”(Know Your Customer/KYC)思路。KYC是在金融領域應用很成熟的規則,在銀行反洗錢和反恐怖主義融資等方面獲得廣泛的應用,且得到了國際社會的普遍認可與支持。

不過與高端芯片限制出口不同,美國此次針對雲服務的出臺的政策,至少從短期來看,觀測屬性大於監管屬性。

一方面,美國把限制的主體范圍控制在“美國IaaS提供商”,也就是說排除了沒有註冊在美國的中國或第三國雲服務商和美國雲服務商的海外子公司。

另一方面,根據拜登政府第14110號人工智能行政令,設定了一個閾值作為美國雲服務商的開關,即如果有一個正在做AI大模型的美國雲服務商客戶需要非常強大的計算能力,大模型是在一群連接得很緊密、工作得很快的計算機上訓練出來的,那麼雲服務提供商就需要向美國政府報告這些客戶的情況。某種意義上講,這更像是對中國大模型發展情況的長期監測。

至於基於這些發現,美國會做何決策仍然不得而知。正如美國商務部長雷蒙多對外宣稱的那樣,“我們正在努力獲取這些信息。我們如何處理取決於我們發現了什麼”。不過可以肯定的是,此次提案是中美兩國在人工智能領域角逐的一次延續。

/ 02 / AI時代的大國博弈,從算力開始

為什麼美國要限制芯片,現在又要對雲服務出手?一個很重要的原因是,對當下AI大模型發展來說,算力實在是太重要了。

在一個大模型構建和迭代過程中,需要經過大量的訓練計算工作,算力需求可分為訓練與推理兩大階段。與訓練階段相比,推理階段的算力需求相對更低。到目前為止,算力需求主要集中在訓練階段。

通常來說,大模型訓練一次是幾乎不可能訓練成功的,存在著大量的失敗和反復,此外為保證模型迭代的更快,也需要進行大量的並行訓練。即便打造出第一版大模型,後續模型的持續迭代的成本無法避免。

不僅如此,隨著大模型參數的增加,所需要的算力也迅速增長。根據此前披露的消息,GPT-4的FLOPS約為2.15e25,並利用約25000個A100 GPU進行了90到100天的訓練,如果OpenAI的雲計算成本按每A100小時約1美元計算,那麼在這樣的條件下,訓練一次GPT-4的成本約為6300萬美元。

在算力構成裡,GPU 是訓練模型與加速推理的關鍵算力硬件,也是成本的“大頭”,能夠占到整個服務器成本的55-75%。GPU 的性能,決定了這個新興行業的步調。但是,受限於摩爾定律的限制,GPU性能提升的速度,已經落後於大模型訓練和推理需求的增長。

隨著大模型的出現,市場對算力需求的增長井噴。據OpenAI測算,自2012年以來,人工智能模型訓練算力需求每3~4個月就翻一番,每年訓練AI模型所需算力增長幅度高達10倍。

相比之下,GPU更迭效率仍然延續著摩爾定律。根據摩爾定律,芯片計算性能大約每18-24個月翻一番。從目前看,盡管H100相比A100性能有明顯提升,但並沒有像模型訓練算力需求那樣有明顯數量級的增長。

如果把大模型定義為AI 2.0時代,至少到目前為主,作為AI 2.0 時代的基礎設施,以英偉達為代表的芯片廠商或雲服務商成為了這波浪潮的最大“贏傢”,並在仍然將在相當一段時間裡影響行業格局的走向。這也是為什麼美國要堵上雲服務“漏洞”的原因。

/ 03 / 危機背後蘊藏的機會

此次提案對中國AI行業發展固然有影響,但也沒必要過分誇大。

從過去看,美國雲服務廠商在中國市場份額一直較低。IDC 最新發佈的《中國公有雲服務市場 (2022 下半年) 跟蹤》報告顯示,AWS 在中國的市場占比僅為 7.9%,微軟Azure 則被合並進入到了“其他”廠商的大類當中。

到了去年,受大模型崛起影響,AWS份額有所提升,但提升幅度仍然有限。

根據IDC中國2023年《中國公有雲服務市場跟蹤》報告的統計數據,亞馬遜AWS目前在中國的市場份額為8.6%,相較於2022年下半年提升了0.7個點,而微軟Azure在中國的市場份額依然少到幾乎可以忽略不計。

從短期看,限制使用國外雲服務,對大量沒有足夠的資金自建AI計算中心的中小型研發與模型管理維護企業可能會產生較大的影響。但長期來看,由於大模型訓練可能會涉及到一些敏感數據,使用美國雲服務也存在比較大的數據安全和國傢安全隱患。即使沒有此次法案,放在大國博弈的視角下,也始終不是長久之計。

相反通過此次契機,更有機會加速推動國產芯片以及雲服務廠商的發展。據天風證券此前測算,英偉達限令升級後2024年AI國產芯片新增市場空間700億 。

盡管與市場主流英偉達A100產品仍存在一定差距,但能夠明顯看到,國內廠商訓練芯片產品硬件性能不斷取得突破。以燧原雲邃T20產品為例,其內存寬帶不足A100的1/3,在應對機器學習和深度學習的帶寬需求上仍有差距,但其32位單精度浮點性能達到32TFLOPS,高於A100的19.5TFLOPS,且在功耗上更具優勢。

不僅如此,大模型企業也紛紛加大了國產AI芯片的采購力度。去年下半年開始,360和百度分別向華為采購了1000個左右和1600個華為昇騰910B AI 芯片,華為昇騰910B對標的是Nvidia A100 芯片。而早在8月,百度內部已經下令其AI系統“文心一言”使用的芯片,改向華為采購昇騰(Ascend)910B系列AI芯片。

不出意外,這樣的趨勢會在未來加速演繹。種種跡象顯示,從“光刻機禁令”到TikTok出海,這是一個對全球化並不友好的時代。如今,這把“火”已經燒到了人工智能,高端芯片和雲服務法案大概率隻是一個開始。