AWS更新其安全部據共享服務Clean Rooms,除了添加機器學習支持,協助用戶在不共享原始數據的情況下應用機器學習模型,同時也加入了差分隱私(Differential Privacy)功能,在協作聚合數據分析結果時,模糊個人數據的貢獻。
Clean Rooms服務可讓企業(yè)和其合作伙伴安全協作數據處理,提供一種不共享原始數據就能協作和分析數據的方法,在追求效率和預測精確度的同時,也能安全地合作。Clean Rooms內置隱私控制功能,能以權限控制Clean Rooms成員所執(zhí)行的查詢和輸出。
新功能Clean Rooms ML則允許用戶使用機器學習模型生成預測性分析,同時保護敏感數據。而這項功能其中一項主要應用,是創(chuàng)建市場營銷用途的相似用戶群組,像是航空公司可以和線上預訂服務合作,針對類似特征的用戶進行營銷活動;汽車貸款和汽車保險公司也可以識別,與現有租賃車主類似特征的潛在汽車保險客戶。這項功能同樣也能用于加速研究機構和醫(yī)院的臨床研究,找到與現有臨床試驗者相似的候選人。
Clean Rooms ML會于每一次組織數據共享合作中,訓練一個由AWS管理的模型,協助用戶快速生成相似數據集,省去用戶自行創(chuàng)建、訓練和部署模型的時間。Clean Rooms ML還提供了許多靈活的控制功能,使用戶和其合作伙伴,可以調整機器學習模型預測結果。
AWS Clean Rooms現在也提供差分隱私功能,系統會在用戶的查詢結果,添加經過仔細校準的誤差,也就是噪聲,讓查詢結果足夠準確,在提供有意義的分析結果的同時,也屏蔽來自特定個人的數據貢獻。差分隱私功能包括了一個隱私預算組件,通過將隱私作為每次執(zhí)行查詢時消耗的有限資源,控制用戶數據集執(zhí)行的查詢數量,確保噪聲不能被平均,確保不會泄漏任何個人數據。當隱私預算耗盡時,在預算增加或是刷新之前,都無法于數據集中執(zhí)行更多的查詢。
差分隱私是一項增強數據共享時隱私保護的技術,能夠分享描述數據庫中部分統計特征,又不公開特定個人資訊,不過缺點就是有其實例門檻,而Clean Rooms差分隱私功能,讓應用該技術變得更容易,用戶只需要對數據表激活差分隱私功能,并在協作中配置差分隱私政策,就能簡單地應用該技術。