浦江创新论坛|聚焦数据资源:数据的共享应是有价的
·“我们真正需要对话的是更多细节:我们共享的是什么数据?生成和共享的格式是什么?在多大程度上进行共享?在什么情况下使用?”
2023浦江创新论坛(第十六届)分论坛——创新技术的新应用和新市场加速促进全球健康与发展的圆桌论坛环节。澎湃新闻记者 曹年润 摄
“数据是资源。”9月11日下午,在上海浦东新区东郊宾馆举行的2023浦江创新论坛(第十六届)分论坛——创新技术的新应用和新市场加速促进全球健康与发展的圆桌论坛环节,国际欧亚科学院院士、中国科学院深圳先进技术研究院讲席教授赵伟数次强调。
当下,医疗数字化加速推进中,大数据已经渗入医疗健康行业。数据能不能共享?如何保证数据安全?成为备受关注的问题。
“毫无疑问,应该保护个人的隐私。”赵伟表示,体温、血压值等数据是病人的,医生只是使用者而已,从这个意义上讲,病人的隐私应该得到充分的尊重。这就像消费者购买一块布料,让裁缝裁成衣服,最后做成的衣服和边角料,还是消费者的,不能说因为是裁缝做的,就归裁缝所有。
“但是如果只强调保护个人隐私,数据的价值就不能被利用。”赵伟说,人类在几千年前就知道怎么保护资源,怎么共享资源,比如种苞谷的农民和种棉花的农民都知道,自己种植的农作物归自己所有,但是为了让双方都过上好日子,两个人会进行交换,皆大欢喜。
赵伟认为:“社会要进步,数据应该共享。当然,数据共享应该是有价的共享,不应该是免费的共享。”他指出,这其中有一个很挑战性的、超出健康领域的技术性问题,即买卖数据存在问题,“因为数据太容易被复制,复制数据几乎是免费的,所以需要限制数据共享,数据交易后,不许再转手给他人,这需要一些技术手段和法律手段来满足。”
中国科学院院士、病原微生物与免疫学家高福认可赵伟的观点:“自从有了商品以后,人类社会所有的东西都有其价值,人类社会也希望最好什么东西都不需要交换,都免费购买,但实际上这只能造成社会的无序状态。”
他表示,数据共享听上去很抽象,似乎没有价值,但共享数据的平台需要人去维持,维护平台的工作人员需要工资,这是很现实的价值问题。“一切看上去很抽象、高大上的理念,比如今天我们讨论的AI和数字医疗,最后的关键是deliver(交付)。如何把他们落实到具体干活的人,落实到最需要的人,这是我们要思考的问题。”
推进数据共享,知识产权的转化和保护是避不开的问题。科学技术部外国专家服务司副司长李昕说: “现在很多新技术在应用的时候不是最终的产品,我们称之为使能技术(enabling technology,一般而言指一项或一系列的、应用面广、具有多学科特性、为完成任务,而实现目标的技术),或者称平台的技术。知识产权的安排对这些技术的扩散和应用起到非常大的作用,希望未来人们在这方面有更多的讨论。”
全球健康药物研发中心数据科学部负责人郭晋疆每天和数据打交道,他们使用最前沿的方法,包括人工智能等技术,帮助生物学家或化学家快速地发现可能的致病靶点,找到可能有效的化合物,并优化化合物。他发现,在和不同的机构合作的过程中,医院、科技公司等都会关注最后的产出,以及数据的安全问题,“所以我们通过创新的机制,例如共享IP(知识产权)等,希望以更低的成本惠及更多的人。”
“我们真正需要对话的是更多细节:我们共享的是什么数据?生成和共享的格式是什么?在多大程度上进行共享?在什么情况下使用?” 麦肯锡咨询公司高级顾问戴维仁(Steve Davis)说,“另一方面,我认为我们需要做的第一件事是剔除高质量的数据。”
郭晋疆在工作中也经常遇到数据质量问题。“人工智能在很大程度上依赖数据。大家希望人工智能在药物研发方面有更大的产出和影响力,虽然我们拥有的数据量非常大,且有不同层级的数据,但是我们经常会遇到数据不足的问题。”
如何有效地开发数据资源?赵伟说,因为数据是资源,所以人们对它的追踪、开发等,是个技术问题。“现在逐步出现一些苗头,我们可以在保护数据的同时进行有效的共享和追踪,我也坚信在5-10年内可以实现有效的、有益的、公平的、透明的数据共享。”