熠智科技专注工业级隐私计算解决方案,自主研发DataVault可控计算、Fidelius机密计算、YeeZChain区块链、大模型推理一体机和联邦学习平台。提供TB级数据、大模型、智算中心的无侵入性隐私保护产品。

logo

可控计算框架-DataVault全球首款!

简介

随着数字经济的蓬勃发展,数据要素资产化已成为新的发展机遇。数据有效流通共享作为数据要素增值的关键环节,在数据要素市场中发挥着至关重要的作用。

制度层面,中共中央、国务院于2023年3月印发的《关于构建数据基础制度更好发挥数据要素作用的意见》专门提出了要“建立安全可控、弹性包容的数据要素治理制度”,要求把“数据可控”贯穿数据治理全过程。市场需求层面,人工智能行业对大模型的发展认知正在逐渐清晰,其中一个普遍观点就是数据质量和数据量将是下一阶段大模型能力涌现的关键。当大模型发展进入垂直细分行业,要训练出精度极高的垂直行业模型,其所需的数据就不再是互联网免费公开的数据,而是行业专业知识,甚至商业机密类型的知识。另外,面向垂直行业、走闭源的轻量化路线的大模型公司目前也面临一个部署问题:如果直接将模型交付于客户,意味着这些模型参数背后积累的行业数据和专业知识存在被二次贩卖的可能。大模型产业是从数据到应用的一个链条,本质上这个链条是各种数据(原始数据、模型参数)在不同主体间的流通链,而这个产业的商业模式则应该构建于这些流通的数据(或模型)是可以被交易的资产基础之上。隐私计算是面向隐私信息全生命周期保护的计算理论和方法,是保护数据资产,实现数据要素有效流通、价值提升的关键技术,构建了数字经济的可信安全底座。

然而,当前以多方安全计算(MPC)、可信硬件(TEE)、联邦学习(FL)和其他基于密码学的方案(同态加密(HE)、零知识证明(ZKP)等)为代表的隐私计算技术在商业化落地过程中大多会对原有业务流程产生侵入性,由此引发的连锁问题包括但不限于:引入隐私计算技术后与原有业务系统的兼容问题、隐私计算技术大量采用的加解密造成的性能损失,为解决前述问题安装隐私计算技术特有设备导致的部署成本增加等。这些问题导致现有隐私计算解决方案无法满足大数据、大算力、大模型时代下的市场需求。

针对上述痛点,熠智科技基于多年隐私计算研发和商业化落地经验提出了“可控计算”:即在数据流通过程中,严格保证数据在约定安全域内进行加工、处理;在数据分析计算过程中,对于数据的流转、分析、处理等实现可控可度量的隐私计算技术,能够同时解决垂直行业大模型所需的数据问题以及部署问题。基于可控计算,熠智科技打造了全新的隐私计算产品----DataVault,在数据要素流通场景中开创了隐私计算的新范式,对原有业务系统实现了零侵入性。

发布首款可控计算框架-DataVault,实现大规模数据/模型的无侵入性隐私保护。

DataVault基于可控计算技术,实现数据跨域流通过程中数据计算的可控可计量。产品的核心逻辑是确保数据使用方在数据提供方定义的安全域中对数据进行加工、处理。这一产品设计思想对于实现大规模数据/模型的可控流转具有重要意义,DataVault创新性地实践了“数据可控”的思想并落地实现了数据边界和用途的可控,进而实现数据要素的可信流通和资产化。

DataVault具有零侵入性、性能高和应用范围广的特点:

  •  零侵入性:不同于其他隐私计算技术的各种限制以及对原有计算逻辑的改动,DataVault对原有业务系统实现了零侵入性,包括:原有应用基于DataVault运行可以做到二进制级别兼容,无需修改或重新编译代码;支持多种CPU架构(x86 & ARM)以及基于PCI-e的计算设备(GPU、DPU、FPGA、加速卡等),无需额外采购隐私计算专用硬件;支持热插拔部署,原有业务系统可无缝迁移到隐私保护模式。
  • 高性能:基于DataVault框架的解决方案造成的性能损失远低于其他隐私计算解决方案,在大部分应用中,相比原生系统(即不用任何隐私计算技术)整体性能损失不超过5%。
  • 应用范围广:DataVault不仅适用于隐匿查询、隐私求交以及联合建模等较为简单的隐私计算应用,也支持大语言模型训练、推理等目前备受关注的大数据和深度学习应用。

此外,DataVault还具备高安全性、使用便捷等特点。

目前,DataVault已经在智算中心和大模型场景中实现商业化落地,推动数据要素价值释放。

DataVault的大规模商用试点——熠智可控计算大模型训推一体机

鉴于越来越多大型基础语言模型的免费提供使用以及大厂大模型训练框架的开源,许多大模型创业公司选择了面向垂直行业、闭源的轻量化路线。然而垂直行业大模型在训练和部署过程中,存在训练所用行业数据、专业知识以及模型参数被二次贩卖的可能,因此这些公司很难构建一个持续健康的销售模式。

为解决大模型厂商在行业垂直领域商业化过程中对于数据和模型泄露的担忧,熠智科技联合垂直领域大模型厂商粤港澳大湾区数字经济研究院(IDEA研究院)和算力运营商是石科技基于DataVault可控计算框架重磅推出全球首款带隐私保护功能的大模型训推一体机。

熠智可控计算大模型训推一体机具有以下优势:

  🔷自主可控

  • 从芯片到应用全面适配信创体系;
  • 兼容x86和国产化信创服务器;
  • 支持国产GPU;

  🔷开箱即用

  • 预装各种大模型(二郎神、是石大模型、ChatGPT等);
  • 特有的大模型训练数据;
  • 可直接加载自有行业数据,实现大模型的垂直领域微调;

  🔷模型保护

  • 可证明的隐私保护,国家级安全测试和认证;
  • 系统级防护模型泄露,防止进程间、网络、系统间模型泄露;
  • 支持代码级别加密存储,防止训推核心代码泄露。

DataVault社区版本试用

DataVault可提供Demo试用和相关产品文档下载,如需了解,请扫描下方二维码填写相关信息,熠智销售人员将尽快与您联系。