RTX 40 系列GPU算力奠基,PC迎來AI生產力進化革命

2024年4月29日 19点热度 0人点赞

2024年4月19日,NVIDIA在北京舉辦了一場關於AI生產力的RTX AI媒體品鑒會。在本次媒體品鑒會上,NVIDIA宣布了大量AI創作及應用層面的技術、產品及資訊更新:包括NVIDIA與火星時代教育聯合發布《NVIDIA TensorRT Stable Diffusion創作加速指南》和使用案例;NVIDIA與吐司/Tensor.Art聯合發布《個人用戶玩轉Stable Diffusion 的GPU配置推薦》,聚焦SD 1.5 和SDXL 1.0,全面測試RTX 40系顯卡和筆記本電腦GPU在Stable Diffusion推理和LoRA模型訓練的表現,全面評估RTX40系顯卡的Stable Diffusion性能;在智譜AI端雲一體大模型解決方案中,NVIDIA TensorRT-LLM 助力智譜AI ChatGLM 模型推理加速。此外,現場還有大量展示Demo,如NVIDIA ACE、ChatRTX、Stable Diffusion、DLSS 3.5、NVIDIA app以及來自土豆人Tudou_man、Simon阿文、海辛、言蕭等AI藝術家基於RTX 40系列AI PC創作的AIGC作品。

不夸張地說,這稱得上是一場關於AI生產力探討的超級盛宴,也是為AI PC賦能的宏大宣言。下面就跟隨《微型計算機》記者的步伐,一起來看看NVIDIA在AI PC領域內的「宏圖大志」。

RTX GPU帶來AI應用的全面進化和升級

從2007年CUDA的面世帶來了圖形渲染和通用計算的統一,到2018年RTX GPU登場提出神經網絡渲染的宏大目標,這十年時間可以看作是NVIDIA GPU和生態針對AI計算加速的萌芽發展期。

隨後在2023年,隨着各種生成式AI的應用落地,正式宣告AI PC時代已經來臨。

看得出,在很早之前NVIDIA就已經布局GPU的未來發展規劃,而這些年來我們也切實看到了NVIDIA GPU一步步正加速向 AI 計算強化的轉變。在以前,我們經常將電腦根據應用場景而區分為家用、辦公、設計創作以及游戲等各種類型,但在今後,這些被人為劃分的電腦類型很可能被一個統一的稱呼所代替,這就是AI PC。

AI PC這個概念很好理解,顧名思義,AI PC就是搭載了能夠針對AI計算進行加速的電腦。對NVIDIA來說,RTX GPU目前就是最核心的AI計算加速硬件,而其中的AI加速器就是我們非常熟悉的張量核心Tensor Core。正是由於Tensor Core的加入,使得RTX GPU擁有了顯著加速AI計算的性能,更重要的是,它為PC用戶帶來了之前只能在雲端的大型計算服務器上才能運行的諸多新特性和新功能。

衡量 AI 處理性能的一種方法是以 TeraOPS 為單位的AI算力。TeraOPS 即「萬億次運算/秒」(TOPS),TOPS 可作為單一指標讓用戶了解 PC 的 AI硬件處理能力,GeForce RTX 40系列GPU可提供的算力涵蓋從194 AI TOPS到1300 AI TOPS,包括筆記本電腦和台式電腦的多樣選擇。與之相比,目前沒有獨立 GPU 的輕量級 AI PC 的算力僅為 10 至 45 TOPS。而在 PC上本地運行AI應用也有諸多好處:在 GeForce RTX PC 系統上運行,速度很快同時用戶的數據保存在本地。用戶可以在本地 PC 上處理敏感數據,因此無需與第三方共享數據或連接互聯網。RTX AI PC目前已成為擁有超過 1 億用戶量和 超過500 款RTX AI 應用與游戲的生態。

所以,另一個概念——RTX AI也就很好理解了,它顯然就是說配置了RTX GPU的AI PC所能呈現出的AI計算加速功能與性能的應用特質。在本次媒體品鑒會上,NVIDIA也是聯合業界諸多知名創作者和公司,為與會媒體展現了RTX AI在AI PC時代的推動力。從游戲產業到設計創作領域,RTX GPU加速的AI應用可謂無所不在。

RTX AI與游戲

DLSS 3.5圖像幀率雙加速

DLSS技術伴隨RTX GPU面世,憑借獨特的Tensor Core,利用AI計算和雲端模型訓練為游戲帶來了卓越的幀率提升和圖像質量改善的雙重「Buff」。在DLSS 2.x時代的超級分辨率、DLSS 3時代的「幀生成」之後,DLSS 3.5的面世又帶來了全新的光線重建Ray Reconstruction技術,通過基於Tensor Core 加速的AI模型增強光追游戲的畫質表現,實現了畫質和性能的再次提升,為玩家帶來了最極致的光追游戲體驗。而這也是RTX AI在游戲領域內應用的一大亮點。

▲NVIDIA在現場演示基於RTX Remix重製的《傳送門》RTX版, NVIDIA RTX Remix可讓 Modder 輕松截取游戲素材,使用生成式 AI 工具自動增強材質,以及藉助全景光線追蹤和 DLSS 快速創建令人驚艷的 RTX 重製版游戲。在現場演示中可以看到,在開啟DLSS 3.5之後,游戲環境的光追效果表現更加突出,細節更清晰,游戲畫質得到了極大的提升。

▲DLSS 3.5現場演示

RTX AI與游戲

ACE帶來栩栩如生的NPC互動

在2024 CES大會上,NVIDIA正式推出了NVIDIA ACE(Avatar Cloud Engine)這一基於雲和AI的微服務。NVIDIA ACE (Avatar Cloud Engine) 是一套可幫助開發者利用生成式 AI 創建栩栩如生的虛擬數字人物的技術。在 ACE 的加持下,普通的非玩家角色 (NPC) 可以搖身一變,成為能夠發起對話或引導玩家找到新任務的動態交互式角色。

CES 2024 上,NVIDIA推出適用於 NVIDIA Audio2Face (A2F) 和 NVIDIA Riva 自動語音識別 (ASR) 的 ACE Production Microservices,並且表示正在與傑出的虛擬數字人物開發者合作,致力於將 NVIDIA ACE 技術呈現給游戲玩家。

Covert Protocol 是Inworld公司與NVIDIA合作開發的一項全新技術Demo,它突破了游戲中角色互動的界限。Inworld AI 引擎集成NVIDIA Riva 和NVIDIA Audio2Face,前者可實現精確的語音轉換文字,後者可提供逼真的面部表情。Inworld AI引擎採用多模態方法來展示非玩家角色(NPC),將認知、感知和行為系統集成在一起,在精心製作的環境中呈現令人驚嘆的 RTX 渲染角色,以實現身臨其境的敘事效果。在本次媒體品鑒會上,NVIDIA也展示了基於Inworld AI引擎製作的游戲Demo。

▲NVIDIA在現場演示基於ACE製作的游戲互動NPC。在這個演示Demo中,玩家將通過與三個關鍵NPC的對話來找到通關所需線索。游戲採用麥克風輸入語音對話,再經由Audio-to-Text轉換為文本並送到雲端的推理服務器進行計算,再將計算結果經過Text-to-Audio轉換為語音,並在本地經過Audio-to-Face計算生成NPC的實時對話口型和表情。這也是NVIDIA ACE微服務運作的基本原理,其中的核心在於RTX 4090 D GPU的Tensor Core的AI計算加速能力和與雲端大模型推理相結合的混合AI能力。

▲與會媒體在品鑒會上體驗基於ACE的智能NPC演示Demo

RTX AI與設計創作

基於TensorRT的Stable Diffusion AIGC加速

NVIDIA TensorRT軟件開發者套件可加速深度學習推理性能。TensorRT 能加速非常熱門的生成式 AI 模型,如 Stable Diffusion 1.5和 SDXL等。全新的 UL Procyon AI 圖像生成基準測試現已支持 TensorRT 加速,內部測試表明該基準測試可以比較准確地反映目前的實際性能表現。將 Tensor Core 與 TensorRT 結合後,本地RTX AI PC 可獲得卓越的生成式 AI 性能。

▲作為當前消費級市場上最快的Stable Diffusion 計算出圖方案,RTX 4090 D GPU能做到每秒8張圖的生成速度。搭配TensorRT,再配合開發者進一步的性能優化,目前RTX 4090 D GPU最高能實現超過每秒120張圖的生成速度,Stable Diffusion用戶也能像游戲玩家一樣通過高幀率享受絲滑的創作體驗。

▲在媒體品鑒會上,我們也體驗了基於開源InstantID模型和工作流的AI證件照Demo。它能夠通過普通攝像頭的自拍照生成影棚級的肖像照,為用戶帶來真正生產力級別的AI加速應用體驗。《微型計算機》記者也在現場親自體驗了一下,效果確實「槓槓的」。

同時,在本次媒體品鑒會上,也有諸多業界知名機構和從業者帶來了基於RTX 40系列GPU的AIGC成功應用分享及心得體會。

業界聲音:火星時代教育發布《NVIDIA TensorRT Stable Diffusion創作加速指南》

《NVIDIA TensorRT Stable Diffusion創作加速指南》

鏈接:https://www.hxsd.com/pdf/viewer/HXSD-NVIDIATensorRT-GuideBook/

在本次媒體品鑒會上,中國知名的數字藝術教育高端品牌火星時代教育聯合NVIDIA以白皮書的形式發布了《NVIDIA TensorRT Stable Diffusion創作加速指南》。這是火星時代教育為AI設計愛好者和創作者基於RTX 40 系GPU提升Stable Diffusion創作效率的實操性教程。指南包括:安裝與設置,加速引擎構建,加速效果對比以及NVIDIA TensorRT在實際商業創作場景的應用(海報設計、電商設計、室內效果圖設計、插畫設計),幫助使用者在創作過程中藉助詳細教程和加速工具實現商業創意落地,提升創作效率。指南由火星時代教育AI設計教研團隊主要研發,NVIDIA 技術團隊提供技術支持,未來將根據應用軟件版本優化並迭代升級。

火星時代教育創始人王琦表示:「火星時代是 NVIDIA Studio 中國區生態合作夥伴,火星時代教育創始人王琦表示:「火星時代是 NVIDIA Studio 中國區生態合作夥伴,雙方共同探索AI軟件在設計流程中的輔助作用,並在火星影視學院部分專業引入NVIDIA Studio AI應用做教學試點,在2023年共同開發AI設計方向創作加速的公開課,此次聯合發布《NVIDIA TensorRT加速Stable Diffusion創作加速指南》是火星時代和NVIDIA聚焦『科技 教育』在設計領域的積極實踐,充分激發學習者對於科技發展的關注,擁抱AI前沿技術,為個人效率加速,為商業創作賦能。」

業界聲音:吐司/Tensor.Art發布《個人用戶玩轉Stable Diffusion 的GPU配置推薦》

作為頭部AI模型平台,吐司/Tensor.Art 和NVIDIA聯合發布了此次《個人用戶玩轉Stable Diffusion 的GPU配置推薦》。在白皮書內容中使用吐司基準測試以及第三方測試軟件UL Procyon AI基準測試完整測試了NVIDIA從RTX 4060到RTX 4090D的所有顯卡和筆記本電腦GPU在SD的推理和模型訓練上的表現,對AIGC愛好者在後期模型訓練和設備選擇上都有一定的參考作用。

▲《個人用戶玩轉Stable Diffusion 的GPU配置推薦》

鏈接:https://tusi.cn/event/nvidia

吐司/Tensor.Art 創始人沈振宇表示:「目前吐司和Tensor.Art上已經有超過16w 的模型數量。此次與英偉達聯合發布《個人用戶玩轉Stable Diffusion 的GPU配置推薦》旨在讓關注AIGC領域的入門用戶以及不同垂類場景的用戶在選擇RTX AI PC設備進行模型訓練和應用時提供客觀、公正的配置參考,提升用戶使用AIGC的生產效率。」

從沈振宇在本次會上展示的白皮書部分內容來看,在UL Benchmark SD1.5 TRT vs. OpenVINO的對比測試中RTX 4090筆記本電腦GPU相對於iGPU(Arc Graphics)有超過27倍的性能提升。

業界聲音:Morph Studio 的AIGC落地生活應用

Morph Studio 產品經理海辛在會上也帶來了基於RTX 40 系 GPU加速的AI應用創作實例展示,主要包括戀與製作人真人轉繪、AI美甲和酒單設計等。

戀與製作人真人轉繪:結合本地 LoRA 訓練和 IPAdapter & ControlNet 的使用搭建 ComfyUI 工作流,將二維插畫一鍵轉真人。

酒單設計:跳出傳統平面設計流程,用純AI轉繪的方式來完成酒品的風格化。並結合 Layer Diffusion 模型直接產出符合城市特色的透明通道素材,極大縮短了設計流程。

AI美甲:收集大量的美甲圖片,將它們作為數據集來訓練一個目標AI生成模型,使其能夠創造美甲設計。AI根據客戶需求設計美甲,然後打印機立即將相應的圖案打印到可穿戴的指甲上。通過這個項目展示了生成式AI如何能夠革命化傳統的工業流程。

RTX AI與設計創作

實時3D渲染與視頻創作

在設計創作領域,得益於NVIDIA Studio生態圈的多年經營,基於RTX GPU AI加速的應用可謂是已經遍地開花,也已趨於生態的成熟。無論是基於Blender、Maya3DSMax、D5等應用的3D渲染設計,還是像剪映、Davinci Resolve、Premiere Pro等視頻創作的AI加速,RTX GPU都在其中貢獻了巨大的生產效率提升作用。尤其是在AI應用逐漸下沉到基礎設計行業之後,生成式AI視頻也得以大放異彩。當然,要進行完美、高效的生成式AI視頻應用,基於RTX GPU的AI PC仍是剛需。

業界聲音:即致AI建築設計創作,所想所見即所得

在品鑒會上,國內前沿建築設計師、艾哎集瑟科技聯合創始人言蕭分享了他利用即致AI進行建築設計創作的心得。言蕭表示:「作為一名經常使用AI工具的建築師,我對RTX平台的加速優勢深有體會。它極大提高了AI圖形生成軟件的性能,特別是如Stable Diffusion等工具,在建築設計的方案概念階段尤為重要。通過RTX平台,我們能夠快速獲得高質量的渲染圖像,有效加速設計過程,增強視覺表現力,極大促進了創意的快速迭代和方案的優化。這種技術進步不僅提升了設計效率,也為建築師提供更廣闊的創作空間」。

在建築設計領域,即致AI基於擴散模型和蒸餾技術,通過RTX GPU的加速,實現了秒級的AI實時繪畫。結合即致AI自研的全網下載量超50萬國內建築行業大模型,幫助建築設計師享受AI實時渲染劃時代的快捷、便利的同時,依然可以保證極高的出圖效果。筆者也在現場體驗了一番即致AI,在RTX 4090 D GPU的加速計算下,真正可以實現所想即所見,對建築設計效率有巨大的提升。

業界聲音:3D建模融合生成式AI,賦予作品以靈魂

Blender 藝術家、AI創作者Simon阿文在媒體會上也分享了自己關於利用RTX GPU加速AI創作,並將其與3D建模渲染作品相結合的創作經驗。Simon阿文表示:「『AI 如何塑造我們的工作與生活』 這個在過去聽起來是少數大公司才有資格討論的問題,但在如今這個問題的答案由AI社區和創作者塑造。包括央視春晚AI動畫等作品在內,從文字、圖像到影像,我的許多探索是基於本地 RTX 4090 完成的。AIGC的可能性是一片藍海,AI PC是我的帆船。」

低俗小說 AI轉繪:在這個項目里,阿文和海辛將《低俗小說》中著名的搖擺舞,通過AI的方式轉繪為油畫、皮影戲、雕塑等多個風格並進行重新剪輯,達到一種多元宇宙的視覺效果。

擱淺的雲:靈感來自海辛的短篇《擱淺的雲》中的一句話:我在海邊遇到一朵擱淺的雲。在這個作品中,Simon阿文通過 Blender 製作簡模,並使用 ComfyUI 搭建工作流進行 AI 轉繪,把AI渲染應用到傳統的3D工作流中。

業界聲音:生成式AI視頻創作,真我與虛幻的思考

數字藝術家 & 策展人土豆人Tudou_Man在品鑒會上帶來了基於生成式AI的創作視頻產品,土豆人Tudou_Man 表示:「每天有大量AIGC內容涌現,宛如微小的青苔連續改寫當下。不久,我們的文明也將被數字所覆蓋。通過RTX 40系列AI PC平台的運算加持,震驚之餘,我使用RTX 40系列 RTX AI PC創作了《復寫苔原》系列作品,RTX 平台為像我這樣的數字藝術家提供高效的AI算力加速。我將AIGC作品注入人的思考與靈魂,在不可逆的數據洪流中保持本真。」

重塑山河:通過SVD deforum創作動態形象,更夢幻地呈現了山河之下的都城變遷,一切塵土歸為輕煙。

《咖啡浪潮的1000次演進》:為2023年的上海咖啡文化周創作一件AIGC概念作品。作品以上海蘇州河遊船為創作原型,採用實景採集與Midjourney Stable-Diffusion組合的方式創作,通過上千次的疊加演算,近乎真實地讓浪花載着一杯巨大的外賣咖啡出現在蘇州河上。

RTX AI讓AI更懂你

ChatRTX

ChatRTX可將包括智譜AI的ChatGLM3-6B在內的大語言模型與使用者本地的數據集鏈接起來,從而改變用戶與自己數據之間的交互方式,且支持語音輸入和圖像功能。

包括ChatGLM3-6B在內的大語言模型支持TensorRT-LLM加速,且英偉達與智譜AI也宣布了兩者在此方面的合作。

▲NVIDIA技術人員在會上講解ChatRTX的優勢與技術特點

業界聲音:TensorRT-LLM讓推理性能加速提升

智譜AI在品鑒會上也分享了關於AI 端雲一體大模型解決方案的內容。智譜AI於2021年研發了GLM(General Language Model通用語言模型)(ACL'22),同時解決了語言理解(BERT)和生成(GPT)方面的挑戰,讓大模型適用更多任務和場景,也更適應中文語言環境。

ChatGLM是基於GLM預訓練框架的雙語對話模型,採用了獨創的多階段增強預訓練方法,包括6B、12B、32B、66B等多種尺寸。同時ChatGLM3 支持多樣的加速工具,包括NVIDIA TRT-LLM框架,使模型性能在合理的精度損失下實現推理加速提升。

智譜AI副總裁吳瑋傑表示:「大模型加持的AI PC將帶來生產力範式革命,讓AI生產力普惠每個人。隨着端側算力和大模型能力的演進,支撐AI PC的大模型解決方案應該是端雲一體的混合AI。端側和雲側大模型無縫協同,共同為用戶提供「智力」強大、隨時在線、極速響應、安全可信、個性化的AI PC應用。我們的大語言模型 ChatGLM3-6B 支持 NVIDIA TensorRT-LLM 等加速框架,使模型推理性能實現加速提升,讓用戶在AI PC上可以獲得更加流暢的體驗。」

RTX火力全開,AI PC起飛指日可待

在這場品鑒會之後,我們真切地感受到了它所涵蓋的豐富內容以及NVIDIA對AI PC未來發展的「夢想」。在AI逐漸接軌日常生活、工作之後,它所帶來的生活質量改善與工作效率提升的效果也逐漸凸顯了出來。業界全體AI化的進化方向似乎已經不可避免,盡管行業整體都在暗自發育發力,也呈現出了一點百花齊放的苗頭,但目前來看地位最超然的仍然還是在此領域內耕耘許久且占據了先機的NVIDIA。基於RTX GPU的AI應用計算加速儼然已經走在了一眾廠商的最前列,也得到了最廣泛的應用支持。基於此,我們認為RTX AI有很大機會能掀起一場AI PC的生產力革命,並快速帶動AI應用高速前行。不信?讓我們拭目以待!