IBM著力宣傳Ceph,強調已在數據湖倉與生成式AI領域取得進展

2024年2月6日 38点热度 0人点赞

自從IBM整合紅帽旗下Ceph存儲產品路線圖已經過去了一年,如今這項技術已經在日益由AI主導的應用環境下取得進展。

Gerald Sternagl

IBM Storage Ceph技術產品經理Gerald Sternagl在日前發佈的博文中表示,“這套具備自我修復與自我管理功能的平臺,強調在行業標準硬件之上以規模化方式提供統一的文件、塊和對象存儲服務。統一存儲平臺將為客戶提供重要的跨架構橋梁,能夠將運行在獨立文件或塊存儲上的遺留應用程序同對象存儲共同囊括在同一設備之內。”

博文解釋稱,“在數據管理領域,軟件定義存儲已經成為一股變革性的力量。與傳統存儲陣列相比,其擁有諸多優勢,包括極高的靈活性與可擴展性,特別適合處理生成式AI等現代用例。”

Sternagl對於IBM的傳統存儲陣列硬件(例如大型機DS8000以及x86服務器FlashSystem陣列等)持批評態度。且在被藍色巨人收購之前,他已經作為資深專傢為紅帽工作了十餘年。

在他看來,“Ceph針對大型單站點與多站點部署進行了優化,能夠高效擴展以支持數百PB的數據和數百億個存儲對象,從而為傳統及新興生成式AI等工作負載提供至關重要的支持。”Ceph能夠適應數據湖倉、AI/機器學習開源框架以及其他“較為傳統的工作負載,包括紅帽OpenShift以及RedHat OpenStack上的MySQL與MongoDB。”

“生成式AI已經在大量非結構化數據的基礎之上迎來了蓬勃發展,並由此建立起新的反饋循環。具體來講,AI能夠不斷生成真實數據以進一步豐富並完善我們對非結構化數據集的理解,持續促進技術創新與進步。”

IBM用於數據、分析及AI工作負載的數據湖倉架構watsonx.data中,就包含約768 TiB的原始Storage Ceph容量。

Sternagl還補充稱,“組織……需要一種能夠加快數據攝取、數據清理與分類、元數據管理與增強、以及雲規模容量管理及部署速度的存儲管理解決方案。而軟件定義存儲無疑是種重要的解決思路。”此外,新的存儲方案還必須能同時支持本地和公有雲環境。

他這裡指的軟件定義存儲,自然就是Ceph。IBM肯定不會在自己的發言中推廣MinIO、Cloudian、Scality、DataCore或者WekaIO等競品。

去年12月,IBM發佈了Ceph更新,提供用於勒索軟件防護的對象鎖定不可變功能。新版本還提供對NVMe-oF及NFS的預覽版支持,用於將數據攝取至底層Ceph對象存儲當中。

評論

要想將塊、文件和對象存儲實現全面組合,最大的問題就是如何保證各自的訪問協議如何彼此對接,這可能會拖累並限制新功能(例如NVMe-oF及NFS支持)的實現。如果大傢需要在單一軟件包之內支持全部三種協議,那麼Ceph的確是個不錯的選擇。但必須承認,純塊存儲、塊加文件存儲組合、純文件組合或者對象加文件存儲組合其實可以更好地支持新功能,同時帶來更高的數據訪問速度。