騰訊音樂全新發佈奇喵相機,天琴實驗室大模型加速技術實現10秒AI繪圖

2024年2月6日 24点热度 0人点赞

深圳商報·讀創客戶端首席記者 袁靜嫻

1月29日,騰訊音樂正式發佈了奇喵相機微信小程序,用戶可以上傳單張圖片,無需訓練等待即可在10秒內生成好玩的形象復刻照片。據騰訊音樂介紹,奇喵相機高速的繪圖背後,得益於騰訊音樂娛樂集團(TME)旗下天琴實驗室深耕多時的MUSE FaceIn形象復刻能力,以及MUSELight 大模型加速框架。在MUSELight的加持下,奇喵相機獲得了 30% 的性能提升,極大縮短了出圖時間,提升用戶體驗的“絲滑感”。

助力解決大模型部署難點,MUSELight 2.0版技術再升級

近一年來,在自然語言處理(Natural Language Processing,NLP)領域,隨著ChatGPT等大語言模型問世,國內外開源大語言模型生態逐漸豐富,在不同領域均出現了龐大的需求和應用落地案例。此外,SD模型也在視覺生成領域掀起了一場“工業革命”,帶動了一批新的AI畫圖需求和落地應用。然而,大模型部署所需的成本及硬件要求,讓多數企業望而卻步。如何提高模型的推理速度,並在一卡難求的情況下提高顯卡利用率,降低大模型部署成本,已成為業內關註的熱點問題。

作為騰訊音樂首個音視頻實驗室,天琴實驗室針對大模型應用落地的痛點,已於今年5月發佈了MUSELight大模型推理加速框架1.0版本。近日,天琴實驗室正式發行MUSELight 2.0版本,將從技術層面協助行業解決大語言模型(Large Language Models,LLMs)及Stable Diffusion(SD)模型在實際部署應用上的難點,為LLM和SD模型在多個領域的應用落地提供了有利支持,助推企業和機構更好實現數字化轉型和智能化升級。

據了解,天琴實驗室本次研發的MUSELight加速框架2.0版本引入了Flash Attention 2、Flash Decoding,啟發式自動選擇不同的 Attention 實現算子等技術,支持多個主流開源LLM及SD模型的推理加速,且加速速度在業內遙遙領先。MUSELight通過對模型重新進行自頂向下的獨創性優化,合理安排顯存內存間數據交換、顯存復用、優化計算流程,針對不同GPU架構,對不同類型計算層進行數據和計算線程的重排,以及特別的推理場景算子優化等技巧,使得其能夠大幅提升顯存利用率和計算效率,減少大量非必要的訪存、計算開銷,為解決模型推理部署中的瓶頸問題提供了強有力支持。

助推多個模型應用落地,MUSELight 2.0版廣受認可

據悉,MUSELight 2.0版對SD模型加速版本lyraSD也進行了升級,新增了支持所有SD1.X 以及SDXL 版本模型加速的功能,且加速性能與業內其他加速框架相比提升了5%-40%不等。此外,lyraSD還支持多種主流SD繪圖場景以及插件,如文生圖、圖生圖、模型熱切換,各種插件熱切換(如Lora,LCM Lora,ControlNet,IPAdapter)等,並支持stable-diffusion-webui和diffusers框架下的推理。

在奇喵相機之外,MUSELight更與騰訊雲進行深度合作,向行業合作夥伴進行賦能,助力行業提供更快的大模型推理體驗,同時大幅度降低成本。此外,MUSELight還與作為全球數字科創領域獨角獸的APUS達成了雲上雲下全方位合作,提升繪圖中臺能力30%-40%,APUS負責人評價道:“MUSELight的加速效果和使用都非常好,很好地滿足我們的需求。”

LLMs方面,升級版的MUSELight推理加速引擎可實現對ChatGLM-6B模型進行5.5倍加速,最大吞吐量達9000 tokens/s。除了實現更高效的計算外,MUSELight 2.0版本還支持長序列場景下的推理,能滿足更高的推理需求,擴充了LLM產品的應用場景,為用戶提供更優秀的使用體驗。

在實際應用落地方面,MUSELight為微信鍵盤的文本潤色模塊提供了部署支持,模型加速收益顯著,達到了大語言模型的上線標準。具體而言,短文本可以基本“秒”生成,用戶“幾乎”無需等待;同時產品場景也得到擴充,能夠支持長文本潤色,排版優化等功能,進一步提升了用戶體驗。微信鍵盤文本潤色模塊相關負責人表示:“整體上看MUSELight為微信鍵盤文本潤色模塊帶來了大約100%的速度提升以及50%的成本降低,很好地滿足了業務快速上線的需求”。

除微信鍵盤外,天琴實驗室還與騰訊會議、科恩實驗室等業務團隊合作完成了多個模型的大規模部署上線,得到了客戶的廣泛認可和高度評價。同時,MUSELight 2.0版本已為直播禮物實時繪圖、壁畫懸浮歌詞音箱繪圖等提供了解決方案。通過應用MUSELight加速框架,部署LLM及SD模型的成本大幅降低,讓更多企業承擔得起大模型的部署和應用費用,進一步推動了科技成果有效落地轉化,“智賦”各行各業。天琴實驗室表示,“未來會持續同步新功能和支持的新模型”,進一步降低企業大模型部署成本,助推大模型應用落地。