如何築造數據安全邊界

2024年2月6日 22点热度 0人点赞

本文分享自華為雲社區《【雲享問答】第6期:如何築造數據安全邊界?-雲社區-華為雲》,作者: 華為雲社區精選。

當前AI技術的快速發展,大模型、大數據正在加速對海量多樣化數據的應用。數據已經成為核心資產,而數據安全和隱私保護的重要性也日益凸顯。數據脫敏作為數據安全管控體系的關鍵環節,能夠有效地保護敏感數據的安全。為了滿足開發者對於數據脫敏的需求,GaussDB(DWS) 動態脫敏功能應運而生。本期【雲享問答】通過這10個問題,帶你全方位了解GaussDB(DWS) 動態脫敏功能及效果。

1 什麼是數據脫敏?

數據脫敏是通過屏蔽敏感數據來保護數據安全的一種方法。它可以將敏感數據變形,例如身份證號、手機號、客戶姓名、郵箱地址等。數據脫敏分為靜態數據脫敏和動態數據脫敏兩種。

GaussDB(DWS)提供列級別的數據脫敏(Dynamic Data Masking)功能,GaussDB (DWS)數據脫敏功能,基於SQL引擎既有的實現框架,在受限用戶執行查詢語句過程中,實現外部不感知的實時脫敏處理。

2 數據脫敏能解決什麼問題?

數據脫敏能力對於用戶具有多重重要價值。它不僅能夠消除暴露個人敏感數據的風險,確保個人隱私安全,還能助力企業遵守CPRA、GDPR、HIPAA等隱私法規,避免因違規而引發的法律風險。同時,數據脫敏技術在處理數據時能夠保持數據的一致性和可用性,確保脫敏後的數據依然能夠支持業務運營和決策分析。此外,通過脫敏處理,還可以降低數據在高效共享過程中的風險,防止敏感信息被惡意利用,從而保護企業免受網絡攻擊和數據泄露的威脅。

3 脫敏策略是什麼?

脫敏策略(Redaction Policy)在數據安全管理中扮演著至關重要的角色。脫敏策略是與數據庫中表對象是一一對應的。一個完整的脫敏策略通常由三個關鍵部分組成:表對象、生效條件以及脫敏列與脫敏函數的對應關系。

表對象指定了策略應用的數據庫表。生效條件則是一個佈爾表達式,它決定了何時應用脫敏規則。脫敏列與脫敏函數的對應是脫敏策略的核心。不同的字段根據其存儲數據的特性和敏感性可以采用不同的脫敏函數。

當且僅當生效條件為真時,查詢語句才會觸發敏感數據的脫敏,而脫敏過程是內置在SQL引擎內部實現的,對生成環境用戶是透明不可見的,既保障了數據安全,又不幹擾用戶的數據訪問。

4 在實際開發過程中,數據脫敏怎麼用?

以DWS為例,在創建脫敏策略時,需要先確定受限制的用戶角色,識別和梳理具體業務場景的敏感字段,然後確定脫敏列需要綁定的脫敏函數,最後構造策略創建的語句並執行,從而預制好脫敏策略。

常見的使用函數語句實現脫敏效果

5 數據脫敏應用過程中,如何做到數據庫內可算僅庫外不可見?

數據庫內要求原始的敏感數據能夠參與加工計算,僅在出庫的時刻敏感數據才會被脫敏處理。例如投影列表達式、投影列函數、聚集函數、過濾條件、分組條件、子查詢位置投影列表達式等,需要原敏感數據直接參與加工計算。在表查詢、視圖查詢、COPY查詢、GDS外表導出等場景觸發時會進行數據脫敏。可算不可見功能有一個前置的條件,需要打開開關
enable_redactcol_computable=on!。

6 GaussDB(DWS)的動態脫敏功能是如何進行數據保護的?

GaussDB(DWS)的動態脫敏引擎與底層系統緊密配合,高效、安全、可靠地處理數據。其直觀的DDL語法界面,使用戶能輕松配置、調整脫敏策略,靈活應對不同場景。系統不僅內置多種常見脫敏方法,還支持用戶自定義脫敏函數,滿足個性化需求。在保障數據安全的基礎上,該引擎確保脫敏數據的高可用性,維持業務價值。同時,通過嚴格的權限和訪問控制,僅授權用戶可訪問敏感數據,全面守護數據的安全與隱私。

第三方脫敏工具多為外掛式,僅支持靜態脫敏,無法實現實時動態處理。相比之下,GaussDB(DWS)的內置脫敏功能更加透明、高效。

7 在GaussDB(DWS)中,如何快速配置和使用動態脫敏功能,並支持非固定格式的數據脫敏?

GaussDB(DWS)提供DDL語法支持用戶快速配置脫敏策略,使用無特殊要求,原SELECT語句即可觸發。GaussDB(DWS)對於常規數據類型均支持,且提供用戶自定義脫敏函數,可以對更多場景支持更靈活脫敏效果。

8 GaussDB(DWS)是否支持跨數據表傳遞脫敏數據,傳遞過程中是否繼承原脫敏策略?

在GaussDB(DWS)的庫內可算庫外不可見場景下,由於參與數據運算的是原始數據,故DML語句執行過程,寫入/更新目標表都是原始數據去更新的,故需要引入脫敏策略繼承機制,分析語句中子查詢的脫敏信息,並繼承到目標表中,此場景即涉及脫敏策略的繼承。

9 在應用GaussDB(DWS)過程中,如何保證數據脫敏的實時性?

為了確保實時性,GaussDB(DWS)采用動態數據脫敏方式。動態數據脫敏,是指數據查詢過程邊輸出邊脫敏,策略定制的脫敏函數發生變化,查詢的脫敏效果也實時更新。

這就意味著DWS在數據查詢過程中,數據會邊輸出邊脫敏。這種並行交互的方式最大限度地減少了性能損失,使得實時性得以保證。根據提供的信息,性能劣化在10%以內是可以接受的。因此,各種場景下的實時性需求都能得到滿足。

10 針對不同的用戶或角色,GaussDB(DWS)能否有不同的脫敏策略?

GaussDB(DWS)數據脫敏含有三要素:脫敏策略應用的表對象、脫敏字段-脫敏函數對、脫敏生效條件,此三部分信息通過REDACTION POLICY語法承載。WHEN表達式子句可以傳遞生效條件,針對不同的用戶或角色去判斷。

更多關於GaussDB(DWS)產品技術解析、數倉產品新特性的介紹,請關註GaussDB(DWS)論壇,技術博文分享、直播安排將第一時間發佈在:華為雲論壇_雲計算論壇_開發者論壇_技術論壇-華為雲

關註#華為雲開發者聯盟# 點擊下方,第一時間了解華為雲新鮮技術~

華為雲博客_大數據博客_AI博客_雲計算博客_開發者中心-華為雲