Immuta 更新 Databricks AI 數據安全平台

已發表: 2023-07-12

Immuta – 可互操作數據安全平台的提供商 – 宣布了將提高 Databricks 安全性的集成和更新。 Databricks 是一家由 Apache Spark 的創建者創立的軟件公司,為數據倉庫和數據湖提供解決方案。

在過去的幾年裡,Databricks 提出了一種創新的新架構方法,將倉庫與數據湖結合起來,形成新的“lakehouse”模型。 它還在人工智能(AI)方面進行了大量投資,這需要更先進的安全措施。

這就是 Immuta 的用武之地。Immuta 成立於 2015 年,是北美頂級數據安全平台提供商之一,專注於人工智能工作流程保護。 其云原生數據治理工具可實現更好的安全性、更輕鬆地發現敏感數據以及更強的訪問控制。

由於 2023 年 6 月宣布的這一新更新,Databricks 的客戶將能夠享受 Immuta 的平台功能。

關於 Immuta 和 Databricks 集成

今年 5 月,Databricks Ventures(lakehouse 公司的風險投資部門)在安全領域進行了大量投資,Immuta 和 Databricks 加強了合作關係。 雖然具體金額未公開,但 Immuta 表示這筆資金將用於產品開發。

因此,新的更新將以 Databricks 為核心,為客戶帶來大量新特性和功能,這是有道理的。

兩家公司是長期合作夥伴,自 2018 年春季 Immuta 推出適用於 Apache SparkSQL 的新工具以來一直合作。 從那時起,雙方的合作夥伴關係不斷發展和演變,最終在這次最新的升級中達到頂峰。 主要功能包括用於人工智能工作負載保護的訪問控制和敏感數據的本地發現。

AI 工作負載保護的必要性

到 2023 年,人工智能工作負載保護顯然是當前的需求。 就像雲曾經引發了一場大規模的數字革命一樣,我們正在見證人工智能的同樣情況。 超過 90% 的開發人員在工作中使用 AI 工具,另一項調查顯示,77% 的公司使用多個第三方工具來處理 AI 工作負載。

這使得像 Databricks 這樣的系統特別容易受到安全攻擊和破壞。 該公司正在大力發展人工智能,並打算通過在一個雲平台上統一客戶的數據、分析和人工智能來幫助客戶降低成本並加速創新。

但如果沒有足夠的人工智能工作負載治理,這可能意味著巨大的威脅向量。

因此,該公司最近加大了網絡安全力度。 除了Immuta對其數據安全平台進行重要升級之外,Databricks今年還與安全公司BigID、Theom和Hunters聯手。

(下載白皮書:端到端保護您的數據

Immuta 的增強型數據安全平台

現在,讓我們來看看 Immuta 最近的更新中可以期待的關鍵變化。

1. 與 Databricks Unity Catalog 的本機集成

Databricks Unity Catalog 是該公司的旗艦產品之一。 它允許您通過組織數據資產的三級命名空間來管理結構化和非結構化數據以及機器學習模型。

不同級別的數據會給工程師帶來很大的壓力,需要他們爭論訪問策略,尤其是隨著模型複雜性的增加。 Immuta 的本機集成將從三個方面提供幫助:保護數據、檢測訪問問題以及發現敏感信息。

2. 安全策略執行

新的和增強的 Immuta 不僅可以實現更智能的安全策略,而且還可以更輕鬆地執行這些策略。 您可以通過本機策略強制執行在 Unity 表級別授予或撤銷訪問權限。

3. 集中元數據管理

Immuta 將對 Databricks Lakehouse 中存儲的信息進行集中元數據管理。 從表面上看,這可以讓您自動化和編排策略。 但深入挖掘,它還有其他一些好處,例如幫助您更輕鬆地發現敏感數據。 您可以添加個人身份信息 (PII) 等標籤,以對您發現的所有敏感數據實施嚴格的策略。

4. 用戶活動監控

Immuta 可以讓您監控和記錄 Databricks 上發生的所有用戶活動。 這包括用戶查詢的審核日誌、誰更改了策略、何時更改以及用戶訪問摘要。 在這裡,Immuta 的統一審計模型 (UAM) 就發揮了作用。 Kit 確保 Unity Catalog 和主 Immuta 實例的日誌結構和元數據一致,以簡化安全性。

5. 訪問控制策略

Immuta 將自動化引入 Databricks 環境。 當您構建具有高級意圖的單個 Immuta 策略時,數據安全平台將自動創建多個策略以在 Databricks 中執行。 這顯著減少了定義訪問控制策略的手動工作量。

該公司表示,使用 Immuta 的新集成可以將需要管理的角色和策略數量減少 93 倍。

加強人工智能工作負載保護

雖然 AI 工作負載保護並不是通過 Immuta-Databricks 集成可以實現的唯一目標,但它絕對是最重要的用例之一。 隨著人工智能規模的擴大,您可能希望將人工智能數據遷移到雲端。 現在 Databricks Unity Catalog 已受到保護,您可以過濾角色、屏蔽列、發現敏感數據、控制 AI 數據訪問等等。 現在,遷移過程將更有信心進行。

除了 AI 工作負載保護之外,Immuta 還確保這些數據處理符合 HIPAA 和 GDPR 等法規。

數據安全平台還為安全分析增加了另一層信任。 通常,在分析人工智能數據工作負載是否存在漏洞時,您會面臨大量潛在風險。 其中許多都是誤報,只會花費時間而收效甚微。 Immuta 的 Detect 功能根據敏感程度為 AI 數據分配分數。

您可以確定風險的優先級,並設置實時警報,以便在真正嚴重的事件威脅人工智能工作負載治理時收到通知。

有什麼商業利益?

新發布的解決方案將為客戶帶來以下好處:

  • 在不影響安全性的情況下提高性能:Databricks Lakehouse 架構與您選擇的任何云兼容。 現在,您可以將這種自由與 Immuta 增強的安全性結合起來。 這意味著您可以將人工智能數據資產遷移到任何云環境,並在不影響安全性的情況下確保卓越的性能。
  • 簡化 Databricks 上的協作和數據共享:借助 Immuta,用戶可以參與 Databricks 上的安全協作。 這是因為集成以完全透明的方式維護詳細的審計跟踪。 相關用戶可以訪問集中式元數據存儲。 您可以委派策略管理權,甚至可以定義基於目的的訪問權限。
  • 通過一流的數據安全性獲得競爭優勢:Immuta 為 Databricks 環境帶來了尖端的安全性和 AI 工作負載保護。 Unity Catalog 用戶將能夠充分利用他們的數據存儲庫、構建新的 AI 模型並解決複雜的業務問題,而無需擔心安全性或合規性。

客戶評價

Immuta 在管理數據治理和 AI 工作負載保護方面是一位資深人士。 例如,該公司通過其數據安全平台幫助 Cognoa 的臨床研究加速符合 HIPAA 的人工智能和機器學習。

“使用 Immuta,您基本上可以模擬用戶的查詢及其權限,以準確查看他們所看到的內容。 您可以以受管控的方式查看它,並確保沒有人能夠訪問他們不應該訪問的內容。”Cognoa 數據平台所有者 Charlie Qing 說道。

新的集成為 Databricks Unity Catalog 用戶提供了類似的好處。 以下是他們的兩位共同客戶的評價:

“Databricks 幫助我們管理這些數據,而 Immuta 在管理安全和訪問控制方面發揮著重要作用。 當我們尋求新產品創新並實施多雲戰略時,我們必須正確對待數據——必須對其進行治理,”ADP 首席數據官 Jack Berkowitz 表示。

“Swedbank 需要構建一個企業級高級分析平台,該平台還可以加強對我們內部安全、管理和數據訪問的信任,同時保護客戶的資產和數據。 Immuta 和 Databricks 在幫助我們實現這一願景方面發揮了重要作用,我們很高興看到他們的合作關係更上一層樓。”Swedbank 數據湖工程主管 Vineeth Menon 說道。

結論

在人工智能時代,雲數據基礎設施通常分為三層——數據湖、數據倉庫和數據交換。 Immuta 和 Databricks 攜手增加了第四個支柱:雲中的數據安全。 人工智能需要以令人難以置信的規模和速度處理信息,這需要三件事:

  • 將政策與平台分離
  • 原生且未改裝的雲數據控件
  • 利用屬性而不是角色來標記數據

Immuta 和 Databricks 意識到,多年來,他們的共同客戶已經開始在雲上運行機器學習和人工智能等複雜的工作負載。 新的集成及其發現、檢測和安全組件為您的數據存儲提供了更好的粒度和可管理性。

現有客戶現在可以利用此集成。