新闻资讯

创建分析数据集的更安全方法

发布日期:2021-08-01 08:43:55浏览量:30

作为一个组织,您坐拥大量日益增长的运营数据,您迫切希望利用这些数据对趋势和客户行为进行研究。但是,您知道复制所有数据以提供分析数据库会增加出现问题的风险。事实上,由于用于报告的数据存储通常不如一线员工使用的运营数据得到良好的监控和控制,因此风险会增加一倍以上。如果出现问题,可能会导致违规、向客户发出令人尴尬的通知、向信息专员办公室报告,并可能会被处以巨额罚款。

因此,您是放弃还是冒险?或者,您可能决定对数据进行匿名处理,以保护自己免受报告数据存储中的潜在违规行为的影响。虽然这肯定会降低您的信息风险,但它带来了重大限制,因为您还无法将其链接到当前的实时数据。您匿名的数据在您更改它的那天有效地处于假死状态,没有进一步的交易、行为或添加能够链接到记录。添加到数据集中的任何新交易或数据更改都将创建新的匿名数据,可能会扭曲数字并将信息格局模糊到您无法得出任何准确见解的程度。这真的是你想要达到的吗?

化名——第三种选择?
您希望建立一个丰富的研究数据存储库,同时操作记录仍然非常活跃,这是数据对您的分析最有价值的阶段。为此,您需要采用不同的方法。假名化是一种使用当前实时数据集中的密钥并将其转换为不可理解的技术,使您可以处理数据进行研究,而不必担心意外发布个人数据或人们无法访问他们不应该访问的个人信息。然而,与使用随机值作为记录密钥的匿名化不同,假名密钥是指向操作系统的链接,数据可以继续添加到数据集中。

即使在不同的位置和不同的系统处理时,该方法也会产生相同的伪密钥,这就是我们使不同环境在该程序中工作的方式。此外,假名信息不能被逆向工程,增加了保护。当与匹配例程相结合时,该方法有助于提供一个能够捕获整个计划中所有服务用户的环境,每个季度添加参与数据,并使研究数据分析师能够跟踪范围内人群的结果改进情况,并寻求了解影响因素。研究数据的力量不仅仅在于其数量,真正的数据力量在于元素之间的联系。

权衡你的选择
我们敦促您仔细考虑创建研究数据存储的方法,在监管机构开始在 GDPR 下展示新力量时,权衡从未如此重要。

您可以谨慎地简单地复制数据。

如果记录超出了进一步丰富数据的程度,或者您接受了限制,则匿名化可以成为记录的解决方案。

或者,您可以考虑将假名化作为在风险和数据丰富性之间取得良好平衡的最佳结果的途径。

不要指出重复数据必须包含在数据主体请求的应用中,包括 SAR(主体访问请求)、撤回同意和保留规则,后两个事件将需要从您的重复数据存储中删除数据以及操作性的。虽然对于假名数据也是如此,但有一组进程可以管理此类请求。

因此,如果您正计划创建用于分析的数据存储或开始质疑您目前拥有的方法和数据的价值,我们强烈建议您认真考虑使用假名技术,这将有助于保护您的组织、您的研究数据和大多数重要的是,您的数据主体。

标签:, ,

相关推荐