论文:A Hierarchical Graph Network for 3D Object Detection on Point Clouds由于大多数现有的点云对象检测方法不能充分适应点云的特征(例如稀疏性),所以一些关键的语义信息(如物体形状)不能被很好的捕捉到。本文提出了一种基于层级图网络(HGNet)的图卷积(GConv),可以直接将点云作为输入来预测 3D 的边界框。形状注意图卷积(SA-GConv)可以通过剑魔点的位置星系来描述物体形状,基于 SA-GConv 的 U 形网络可以通过改进的 voting 模块获取多层级的特征进而生成候选,然后一个基于图卷积的候选推理模块考虑全局的场...... Last article READ

对话翼方健数罗震:天下无难用的数据,如何让“机器人医生”更智能?

算力说

医疗领域被认为是对于隐私数据要求最高的场景,而在这个方向的数据若是共享,其效应将会巨大。医疗平台集聚个人最私密的数据,共享是否意味着即失守?开放应用生态更成无本之木?改弦更张,尝试用新一代智能数据技术替代传统的共享方式以释放数据价值,逐步成为发展共识。那么,新技术有哪些落地方式,又如何提升诊疗准确度?

8月25日,翼方健数 CEO 罗震 在SIGKDD·SDBD2020 第二届智能数据和区块链应用国际研讨会上带来《隐私安全计算下的数据和算法的互联互通》的专题分享,谈谈怎样为医疗信息系统装上智能的“最强大脑”。

1

你所认知的医疗行业的数据问题,其实在行业具有普适性

罗震介绍说,翼方健数主要在医疗行业做隐私安全计算的生根和应用。而在行业深耕多年后,最大的体会是医疗行业中间遇到的数据安全、数据共享以及数据应用方面问题,并且具有普遍性,促使我们去做更为深入的思考。

我们身处由信息时代转化到智能时代的变革中,两个时代显著的区别在于对数据的重视程度与认知方式。

信息时代我们更关注解决具体问题,当我们发现解决过程中产生的数据有很大的价值与应用空间,才逐渐开始使用。在当下的时代,更多的是我们拥有这样的数据,可以解决什么问题,这是主次先后重要性的区别。我们认为智能时代会产生海量的数据,处理数据主角是智能模型机器,而必须有大量数据才能产生比较好的智能,对数据的处理方式产生根本性的转变。

基于此,国家会提出数据是新的生产要素,并把数据和土地、资本、劳动力等同起来。但是数据作为生产要素,其实与很多传统的生产要素有许多区别。

首先数据是信息时代的遗留,由于分布在不同信息系统里边,自诞生便相互隔离,是非标准化、非结构化的,质量有高有低。

数据作为生产要素有非常独特的经济特征。其一是虚拟可再用的;其二是非竞争性的,如果我有一份数据共享给你,你就有一份一模一样的数据;其三是产生数据需要高昂成本,但分享数据几乎可以忽略成本。

数据的价值有外在性,当我们产生数据,很难确定数据价值几何。此外还有数据的非经济特征,在每个行业里边都有隐私保护,合规数据安全等行业方面的规范,在医疗行业更加如此,因为我们接触到的数据都是个人最隐私最保密的数据。

正是因为所有数据特点,恰恰是阻碍数据共享最核心的原因。从经济的角度我花了很多的价钱,产生数据,而后分享给你,数据将失去我的保护,而你有一份同样的财产。对你将来如何使用数据,我将完全失控,无法得知你可能会产生新的价值。

从另一角度,一旦原始数据流失并产生伤害,这些伤害也很难被安顿。所以我们认为数据在本质上不能被共享。共享的方式不是将原始数据拷贝给他人,而是应是试图去共享数据的价值。

2

Alice与Bob谁更多金?不仅仅是“百万富翁”

数据的时代特性引出我们所讲的隐私安全技术,或者说隐私计算基本的理念。

举例而言,有一家医学统计公司,想做筛查效果及评估。如做完癌症筛查后,想了解做过筛查的人后续是否有问题。涉及到医学统计中经常会提及的两个词,一个叫灵敏度,一个叫特异性。

一般比较直观的做法是在数据平台找到所有做过筛查的人群,观察后续发生的事情。通过原始数据和分析,最后得到评估结果。最大的问题在于如果医疗行业原始数据一旦离开数据平台保护,将来会产生问题。而统计公司只想知道筛查手段的结果,即灵敏度与特异性。所以可以将计算放在安全的环境,计算完毕之后,只需拿走统计结果。不用看到原始数据,不用将数据导出,通过这种计算的方式,实现不分享原始数据,而是分享数据的价值。

实际上,隐私安全计算面临较大的挑战。首先隐私安全计算,囊括的范围很广泛。三个主流的安全计算方式。一个方式称为多方安全计算或者同态加密,实际方法完全不同,但是信任假设是相同的。

假如没有任何可以信任的第三方,如何做计算?第二个方式使用比较多的方式是联邦学习。联邦学习是解决模型训练、模型推断的问题,在机器学习方面来解决没有信任的前提下,如何做联合计算。

那么联邦学习唯一的缺陷是指计算的方式仅仅是在机器学习的方式。如果我们有可以信任第三方,比如Alice、Bob信任第三人Charlie,他们如果将自己有多少钱告诉Charlie,Charlie就会立刻的告诉Alice、Bob你们俩谁钱更多,就可以通过安全多方计算的方式计算过程。

安全多方计算主要防备的是应用本身对平台产生的威胁。如果说安全沙箱做得好,对系统本身产生的风险小,就可以非常安全将它算出来。

另一方面,第三方中间有特殊的硬件叫 称之为TEE,Trusted Execution Environment,可信任执行环境。我们将安全沙箱计算放到TEE中算。此时可以解除对查理的信任,因为硬件可以保证哪怕Charlie是恶意的人,也没有办法看到算了Alice和Bob到底有多少钱。

抖音海外被禁事件还在持续发酵。继印度、美国之后,日本、澳大利亚等地,也开始重点讨论如何封禁Tik Tok的问题。在全球经济形势严峻、贸易摩擦不断的“多事之秋”,抖音真真切切地触动了各国最敏感的神经——隐私安全。在他们看来,它掌握着用户数据,是对国家安全的严重威胁。且不论事实是否如此,但足以见得,用户隐私安全,已经被上升到和“国家安全”一样的高度。某种程度上,抖音是无辜的。真正应该对此“负责”的,是这背后的中心化云存储技术。大量数据集中在统一的云平台上,为不法者窃取、支配数据,提供了便利条件。如何解决这一问题?越来越多企业和机构,转向了“去中心化”技术。顾名思义,这一技术下,数据不是被存放在一个......Next article READ