基本概念
本文列出了蚂蚁隐私计算服务平台涉及的基本概念,以便于您更好地理解产品。
安全配置
安全配置全称为授权安全配置,离线样本被授权到多方安全分析项目后,数据所有方在项目中按照安全级别对数据进行分列、分级的配置。数据的安全性越高,对数据支持的分析灵活度越低。当脚本文件中的逻辑超出了安全配置的限制,引擎将拒绝执行 SQL 脚本文件,任务将会执行失败。
表结构
表结构定义了数据表中指定的数据字段,以及每组数据字段的数据类型和字段描述。
表结构模板
表结构模板是多个数据表共同遵循的表结构。
保护开关
启用安全配置的开关。
分组键
在模型训练中参与条件分割的字段。
服务集成
服务集成是当模型发布完成后,在模型服务需求方的节点中,开放服务调用接口的过程。用户可定义接口的出参、入参、使用的模型以及和模型相关的其他处理逻辑。
服务监控
服务监控是多方安全建模控制台的一个模块。在多方安全模型服务运行过程中,模型的调用数、模型分和入模特征的关键统计值,可在经过聚合或脱敏后在平台页面中进行展示。服务监控支持用户配置需查看的指标和监控频率,并生成可视化监控报表。
关联键
在隐私求交中作为 JOIN ON
SQL 语句的字段。
工程
工程又称为“建模工程”,是进行多方安全建模的研发场所,用户可基于虚拟宽表进行特征工程、模型研发和模型评估等操作。同时支持以可视化画布的形态编排建模流程,一个流程中可包含一个或多个组件,组件间以连线的方式表示数据的传递关系。
节点
节点的全称为隐私计算节点,是一台计算机、一台虚拟计算机或一个集群,计算方将多方安全计算协议或算法逻辑的软件执行在节点中。节点均被部署在机构本地,通过节点实现机构原始数据连接及本地计算。
脚本文件
脚本文件是在联邦建模控制台或多方安全分析控制台中,用户编写建模代码的环境。不同控制台支持的语法不同:
联邦建模控制台支持用户使用 Python 语法定义模型,并且支持
import fascia
框架中的函数。多方安全分析控制台支持用户使用 SQL 语法编写分析逻辑。在一个 SQL 脚本文件中,支持编写一个或多个 SELECT 语句,语句以(;)进行分割。SQL 脚本文件可以使用当前项目的离线样本。
离线样本
离线样本是蚂蚁隐私计算服务平台各项目中的原始数据,离线样本被存储在节点上且只支持在节点本地使用。如果需要在项目中使用样本数据,需由节点所属机构的管理员,在管理控制台中将数据授权到项目内。您可以使用离线样本,但无法获取离线样本。
联邦表
联邦表是进行联邦建模所使用的数据集。一个联邦表由多个节点的数据构成,各个节点中的数据拥有共同的列、不同的行。使用联邦表建模时的体验,类似将多份数据参与执行 UNION ALL
SQL 语句后的操作。
联邦模型
联邦模型是联邦建模过程中使用联邦算法产出的模型。当有多个节点参与模型训练时,每个节点都会保存一个联邦模型的副本。各参与方均可以独立地使用保存在本地的模型副本,同时也支持各参与方对联邦模型的副本进行微调。
模型提交
模型提交是多方安全建模控制台中模型训练模块的产品概念。完成开发的模型经过提交后,进入待部署状态。在提交过程中,支持将模型本身与模型相配的预处理、后处理逻辑打包进行提交。打包后模型、预处理和后处理可作为一个整体提供预测服务。
模型发布
完成模型的入模特征和在线特征匹配,并且发布到对应节点的过程被称为模型发布。特征匹配支持按特征名同名匹配、按预先定义的模板匹配、自定义匹配等方法。
求交结果
求交结果是隐私求交后产生的交集数据或差集数据。求交结果被存储在节点本地中。
任务
任务在不同项目类型的控制台中概念不同,以下是具体说明:
联邦建模控制台和多方安全分析控制台
在脚本文件菜单中,执行一次脚本后会产生一个任务。
多方安全建模控制台
指向节点提交的具体计算任务。一个任务中可单独执行一个组件,也可以将多个组件合并到同一个任务中执行。当一个组件被多次执行时,体现为多个任务。
隐私求交控制台
创建一次隐私求交操作后会生成一个求交任务。
数据表
数据表是多方安全计算中存储在节点的原始数据,并且只能在节点本地使用。
数据授权
在项目使用机构数据前,由机构管理员将数据表、特征组等数据授权到项目内使用的操作称为数据授权。
特征
用户离线样本的信息维度。
特征服务
提供特征查询接口的服务,即特征服务。
特征组
特征组包含特征列表和特征服务的配置信息,一个特征组可复用于多个项目的多个模型中。
特征列表
特征列表为某一类特征服务支持的特征字段集合。这些特征服务的服务地址不同,但有相同的协议、出参和入参。
特征映射
将模型训练中的入模数据表字段与线上的特征服务形成关联的过程,称为特征映射。
项目
在隐私计算的数据应用中,以项目的形式对成员、权限、节点或数据等要素进行隔离。根据不同的应用类别,项目分为不同的类型。
虚拟宽表
结合两组数据特征列并且经过 ID 对齐后,物理层面中不存在的宽表被称为虚拟宽表。用户面向虚拟宽表进行模型开发,其操作流程与体验类似中心化建模。
引擎
引擎的全称为隐私计算引擎,是在节点中执行隐私计算协议或算法逻辑的软件。作为已编排的应用,能够完成机构之间的数据隐私计算。引擎包含分析、训练、预测和联邦学习引擎。可以根据您的需求,在一个节点中集成多种不同的引擎。不同类型项目使用节点的引擎不同,下表展示了不同类型项目使用引擎的情况。
项目类型 | 引擎类型 |
联邦建模 | 联邦学习 |
多方安全建模 | 训练和预测 |
多方安全分析 | 分析 |
隐私求交 | 分析 |
隐私求交
隐私求交(Private Set Intersection,简称 PSI)是一种隐私计算方法,是将各参与方的样本数据做求交集处理。该方法可以保证在原始数据不出本地的情况下,对两份离线样本进行求交操作,以生成虚拟宽表。
组件
在多方安全建模项目中,组件是可视化建模中用户可操作的功能模块。组件中封装了特定的算法功能,用户可对组件的输入、输出和算法进行配置。
在线特征
指机构所拥有的供安全计算节点访问的内部特征服务接口,在多方安全模型的在线预测过程中,各方的计算节点需要通过接口获取各自的在线特征用于模型预测。