近日,字节跳动安全性精英团队对外开放公布开源敏感数据维护计划方案GoDLP,该方案可以运用多种多样个人隐私合规管理规范,对数据开展等级分类激光打标、分辨比较敏感等级和执行相对应的脱敏处理。
据了解,GoDLP 给予了一系列对于敏感数据的识别和处理计划方案, 主要包括敏感数据识别优化算法,数据信息脱敏处理方法,业务流程自定的配备选择项和海量信息解决工作能力。
做为字节跳动在数据脱敏维护方位完成的实际操作实例,字节数安全性精英团队决策用开源的形式向各位介绍其科研成果,与领域一同发展。字节跳动安全性精英团队所属单位表明,GoDLP会长期性维护保养升级,热烈欢迎领域人员一起有效的沟通。
字节跳动开源的GoDLP是如何?
GoDLP 可以广泛支持结构型(JSON数据信息、KV数据、golang map)和关系型数据库(多语言表达字符串数组)。
● 可完成敏感数据全自动发觉
○ GoDLP内嵌多种多样敏感数据识别标准,可遮盖市面上80%以上识别标准,较大水平识别敏感数据
● 灵便的敏感数据脱敏处理
○ GoDLP适用多种多样脱敏优化算法,客户可自主依据需要开展脱敏处理
● 业务流程自定配备选择项
○ 除默认设置的敏感性信息内容识别和解决标准外,业务流程可依据具体情况,配备自定的YAML标准,GoDLP可以依据传到的配备选择项,进行对应的数据处理方法每日任务。
GoDLP的特性主要表现
下边数据信息是在打开所有敏感数据种类状况下的結果
● 对于1K的文档,用时要4.1ms,占有128.6k的运行内存
● 1M的文档,用时为4.1s,内存占用118.6MB
(接口测试:8核vm虚拟机,Linux,amd64,Intel(R)Xeon(R)Platinum8260CPU@2.40GHz;编码版本号:v2.0.0)
GoDLP在字节数的实践活动
GoDLP已在字节跳动开展了充足的实践活动,已连接的业务流程线包含抖音短视频、电子商务、飞书、活火山模块、互联网安全、金融、文化教育、手机游戏等众多业务流程线。现阶段,字节跳动安全性精英团队已释放GitHub上开源详细地址(https://github.com/bytedance/godlp)。