騰訊音樂全新發佈奇喵相機，天琴實驗室大模型加速技術實現10秒AI繪圖

深圳商報·讀創客戶端首席記者袁靜嫻

1月29日，騰訊音樂正式發佈了奇喵相機微信小程序，用戶可以上傳單張圖片，無需訓練等待即可在10秒內生成好玩的形象復刻照片。據騰訊音樂介紹，奇喵相機高速的繪圖背後，得益於騰訊音樂娛樂集團（TME）旗下天琴實驗室深耕多時的MUSE FaceIn形象復刻能力，以及MUSELight 大模型加速框架。在MUSELight的加持下，奇喵相機獲得了 30% 的性能提升，極大縮短了出圖時間，提升用戶體驗的“絲滑感”。

助力解決大模型部署難點，MUSELight 2.0版技術再升級

近一年來，在自然語言處理（Natural Language Processing，NLP）領域，隨著ChatGPT等大語言模型問世，國內外開源大語言模型生態逐漸豐富，在不同領域均出現了龐大的需求和應用落地案例。此外，SD模型也在視覺生成領域掀起了一場“工業革命”，帶動了一批新的AI畫圖需求和落地應用。然而，大模型部署所需的成本及硬件要求，讓多數企業望而卻步。如何提高模型的推理速度，並在一卡難求的情況下提高顯卡利用率，降低大模型部署成本，已成為業內關註的熱點問題。

作為騰訊音樂首個音視頻實驗室，天琴實驗室針對大模型應用落地的痛點，已於今年5月發佈了MUSELight大模型推理加速框架1.0版本。近日，天琴實驗室正式發行MUSELight 2.0版本，將從技術層面協助行業解決大語言模型（Large Language Models，LLMs）及Stable Diffusion（SD）模型在實際部署應用上的難點，為LLM和SD模型在多個領域的應用落地提供了有利支持，助推企業和機構更好實現數字化轉型和智能化升級。

據了解，天琴實驗室本次研發的MUSELight加速框架2.0版本引入了Flash Attention 2、Flash Decoding，啟發式自動選擇不同的 Attention 實現算子等技術，支持多個主流開源LLM及SD模型的推理加速，且加速速度在業內遙遙領先。MUSELight通過對模型重新進行自頂向下的獨創性優化，合理安排顯存內存間數據交換、顯存復用、優化計算流程，針對不同GPU架構，對不同類型計算層進行數據和計算線程的重排，以及特別的推理場景算子優化等技巧，使得其能夠大幅提升顯存利用率和計算效率，減少大量非必要的訪存、計算開銷，為解決模型推理部署中的瓶頸問題提供了強有力支持。

助推多個模型應用落地，MUSELight 2.0版廣受認可

據悉，MUSELight 2.0版對SD模型加速版本lyraSD也進行了升級，新增了支持所有SD1.X 以及SDXL 版本模型加速的功能，且加速性能與業內其他加速框架相比提升了5%-40%不等。此外，lyraSD還支持多種主流SD繪圖場景以及插件，如文生圖、圖生圖、模型熱切換，各種插件熱切換（如Lora，LCM Lora，ControlNet，IPAdapter）等，並支持stable-diffusion-webui和diffusers框架下的推理。

在奇喵相機之外，MUSELight更與騰訊雲進行深度合作，向行業合作夥伴進行賦能，助力行業提供更快的大模型推理體驗，同時大幅度降低成本。此外，MUSELight還與作為全球數字科創領域獨角獸的APUS達成了雲上雲下全方位合作，提升繪圖中臺能力30%-40%，APUS負責人評價道：“MUSELight的加速效果和使用都非常好，很好地滿足我們的需求。”

LLMs方面，升級版的MUSELight推理加速引擎可實現對ChatGLM-6B模型進行5.5倍加速，最大吞吐量達9000 tokens/s。除了實現更高效的計算外，MUSELight 2.0版本還支持長序列場景下的推理，能滿足更高的推理需求，擴充了LLM產品的應用場景，為用戶提供更優秀的使用體驗。

在實際應用落地方面，MUSELight為微信鍵盤的文本潤色模塊提供了部署支持，模型加速收益顯著，達到了大語言模型的上線標準。具體而言，短文本可以基本“秒”生成，用戶“幾乎”無需等待；同時產品場景也得到擴充，能夠支持長文本潤色，排版優化等功能，進一步提升了用戶體驗。微信鍵盤文本潤色模塊相關負責人表示：“整體上看MUSELight為微信鍵盤文本潤色模塊帶來了大約100%的速度提升以及50%的成本降低，很好地滿足了業務快速上線的需求”。

除微信鍵盤外，天琴實驗室還與騰訊會議、科恩實驗室等業務團隊合作完成了多個模型的大規模部署上線，得到了客戶的廣泛認可和高度評價。同時，MUSELight 2.0版本已為直播禮物實時繪圖、壁畫懸浮歌詞音箱繪圖等提供了解決方案。通過應用MUSELight加速框架，部署LLM及SD模型的成本大幅降低，讓更多企業承擔得起大模型的部署和應用費用，進一步推動了科技成果有效落地轉化，“智賦”各行各業。天琴實驗室表示，“未來會持續同步新功能和支持的新模型”，進一步降低企業大模型部署成本，助推大模型應用落地。