章节目录:
许多组织可能对其测试数据有特定的安全和安保考虑或要求。例如,如果开发银行业务应用程序,您可能会从数据库的真实实例中获取 SSN、账号和其他数据。如果开发电子健康记录(EHR)应用程序,那么 HIPPA 需求可能会涉及您正在测试的数据。这就是为什么以简单的方式屏蔽敏感数据的能力对于测试非常重要。
不过,屏蔽数据并不像置乱值那么简单。例如,API 可能期望数据对象以特定的格式和类型包含特定的字段。此外,屏蔽值需要跨字段保持一致。如果一条记录在两个不同的表中可用,则屏蔽值必须是一致的。
您可以使用测试数据中的屏蔽数据功能来创建一个数据集副本,其中包含符合应用程序要求的随机值。屏蔽数据安全可靠,可在测试场景中使用,而不会影响测试结果。
在开始本节之前完成本教程的捕获和管理测试数据章节。
或者,您可以使用现有数据资源库学习本教程。
测试数据选项卡以表格形式显示数据。可以使用此接口克隆、操作和管理数据。但是您可以点击模型选项卡来查看数据的表示形式,显示数据对象之间的关系。
有关模型中使用的符号、形状和颜色的更为详细的说明,可以参考数据建模概述文档。
对于 SQL 数据集,模型中心的元素(数据库图标)表示查询。查询中的每个分支表示一个 SQL 模板(返回结果的 SQL 命令集合),用于构建数据集。
为了检索正确的帐户,ParaBank 查询与该帐户关联的社会保障号。点击搜索栏并输入 SSN
查看查询。
在我们的数据集中,SSN 出现在 ResultSet3 和 ResultSet5 中(未显示)。
模型中的结果集对象是由测试数据创建的抽象,以便于更好地进行可视化。结果集是由 SQL 模板对象返回的数据的表示(上图中的“SQL3”)。您可以更改 SQL 模板显示名称,以使搜索更容易、更容易地标识模型中表示数据的对象。
除了 SQL 模板对象外,ResultSet3 对象也被更改。
社会保障号是敏感信息,因此应该进行屏蔽,以确保我们在测试场景中使用的数据是安全的。这个过程将在下面几节中讨论。
约束指的是数据的特征,如类型、最大/最小值(整数)、允许的字符(字符串)等。当测试数据推断限制条件时,它会处理所有记录的数据,并围绕每个字段设置约束。这不仅对正确屏蔽数据很重要,而且对以后生成新数据也很重要。
屏蔽并生成设置窗口包括几个用于塑造数据的选项。
SSN 列显示了为此结果集配置的屏蔽设置。
ResultSet5 中的 SSN 列仍然需要配置。此外,屏蔽需要跨结果保持一致,以保持数据的完整性。
模型中将绘制一条虚线,连接来自每个结果集的 SSN 列。这表明应用于 ResultSet3 SSN 列的屏蔽值也将应用于 ResultSet5 SSN 列。
通过配置这些设置,我们现在可以屏蔽数据。
接下来,我们将验证是否生成了一个新值。
最后,您可以点击任务选项卡查看审计追踪,以实现合规性目的。