本月累计签到次数:

今天获取 积分

医疗人工智能

医疗人工智能

316 浏览

产业观察:预计2016年智能医疗服务机器人市场将达60.25亿美元

其它类 品管人生 2016-12-29 16:10 发表了文章 来自相关话题

智能医疗服务机器人主要包括手术机器人和康复机器人。手术机器人重点突破介入感知建模和微纳技术,达芬奇机器人拥有先进的介入感知技术,全球销量已达到3600余台。智能康复机器人特别是外骨骼机器人等运用生机电一体化技术,融合机械工程和生物医学技术领域。Rewalk外骨骼机器人采用体感芯片,捕捉患者体感运动以帮助行走。我国妙手机器人是首款临床应用的手术机器人,因高技术门槛,国内手术机器人产品较少。国内康复机器人产品创新活跃,钱璟康复机器人、迪马外骨骼机器人受到市场认可,以金山胶囊机器人为代表的微型医疗机器人产品亦有面世。







全球智能医疗服务机器人市场规模预测


2016年,全球智能医疗服务机器人市场预计达60.25亿美元。至2020年,全球智能医疗服务机器人市场规模年均增速20.5%。







2016年全球智能医疗服务机器人市场规模占比


2016年,全球智能手术机器人市场规模占比最高,达60%,高于智能康复机器人26个百分点。







中国智能医疗服务机器人市场规模预测



2016年,中国智能医疗服务机器人市场预计达20.4亿元。至2020年,中国智能医疗服务机器人市场规模年均增速27.5%。







2016年全球智能医疗服务机器人市场规模占比


2016年,中国智能手术机器人市场规模占比最高,达58%,高于智能康复机器人21个百分点。




  作者简介:


李扬,中国社会科学院管理学博士、高级工程师,现任全息智慧产业研究院咨询主管,曾任工业和信息化部赛迪智库研究室主任,参与并负责国家战略性新兴产业、电子信息产业等多项战略规划和政策文件的起草工作,主持及参与项目研究30余项,在核心权威期刊发表论文近30篇,研究成果曾获国家发展改革委、工信部相关领导高度肯定。






全息智慧产业研究院咨询主管、 管理学博士、高级工程师 李扬


转自:全息智慧产业研究院
 
 
 
 
 
更多内容请关注:www.imefuture.com
 
即将到来的十场科技革命
人们都在说人工智能,其实现在我们真正做的是智能增强
 
智造家 查看全部
智能医疗服务机器人主要包括手术机器人和康复机器人。手术机器人重点突破介入感知建模和微纳技术,达芬奇机器人拥有先进的介入感知技术,全球销量已达到3600余台。智能康复机器人特别是外骨骼机器人等运用生机电一体化技术,融合机械工程和生物医学技术领域。Rewalk外骨骼机器人采用体感芯片,捕捉患者体感运动以帮助行走。我国妙手机器人是首款临床应用的手术机器人,因高技术门槛,国内手术机器人产品较少。国内康复机器人产品创新活跃,钱璟康复机器人、迪马外骨骼机器人受到市场认可,以金山胶囊机器人为代表的微型医疗机器人产品亦有面世。


2.1_.JPG


全球智能医疗服务机器人市场规模预测


2016年,全球智能医疗服务机器人市场预计达60.25亿美元。至2020年,全球智能医疗服务机器人市场规模年均增速20.5%。


2.2_.JPG


2016年全球智能医疗服务机器人市场规模占比


2016年,全球智能手术机器人市场规模占比最高,达60%,高于智能康复机器人26个百分点。


2.3_.JPG


中国智能医疗服务机器人市场规模预测



2016年,中国智能医疗服务机器人市场预计达20.4亿元。至2020年,中国智能医疗服务机器人市场规模年均增速27.5%。


2.4_.JPG


2016年全球智能医疗服务机器人市场规模占比


2016年,中国智能手术机器人市场规模占比最高,达58%,高于智能康复机器人21个百分点。




  作者简介:


李扬,中国社会科学院管理学博士、高级工程师,现任全息智慧产业研究院咨询主管,曾任工业和信息化部赛迪智库研究室主任,参与并负责国家战略性新兴产业、电子信息产业等多项战略规划和政策文件的起草工作,主持及参与项目研究30余项,在核心权威期刊发表论文近30篇,研究成果曾获国家发展改革委、工信部相关领导高度肯定。

2.5_.JPG


全息智慧产业研究院咨询主管、 管理学博士、高级工程师 李扬


转自:全息智慧产业研究院
 
 
 
 
 
更多内容请关注:www.imefuture.com
 
即将到来的十场科技革命
人们都在说人工智能,其实现在我们真正做的是智能增强
 
智造家
463 浏览

用深度学习对抗癌症:从分子层面研究到大规模人口建模

机械自动化类 密泰传动系统 2016-12-27 13:33 发表了文章 来自相关话题

Rick Stevens 表示,首个先进癌症计算解决方案的联合设计(Joint Design of Advanced Computing Solutions for Cancer,JDACS4C)「成果」将于 2017 年第二季度的某个时间公开。JDACS4C 一共有三个试点项目,Rick 领导了其中之一,将深度学习(DL)应用到癌症治疗中去。这些项目不仅可以推进癌症研究和治疗,而且可以提高深度学习的能力和基础架构,最终着眼于百亿亿次计算机的研究,DOE 将对这些项目提供部分的资金支持。


无论以哪种标准,美国对抗癌症(U.S. War on Cancer)和 Precision Medicine Initiative(精准医学计划,PMI)都颇具野心。过去,对抗癌症一直没有很明显的进步,但也不是说没有取得很多成绩。


只是现在看来前景更为光明。生物医学的进步和下一代领先计算机的兴起(百亿亿次计算机的开发)推动着癌症治疗的发展。深度学习和数据驱动科学的快速发展,使许多人对前景报以乐观的态度,所以 2016 全球超级计算机大会重点关注精准医疗和 HPC 的作用就是偶然了。


三个 JDACS4C 试点项目,包括从分子层面到人口规模方面的诸多研究,以支持 CANcer 分布式学习环境项目(CANcer Distributed Learning Environment project):这些工作旨在洞察可扩展机器学习工具;通过深度学习、模拟和分析技术,减少治疗时间;为未来计算方案提供信息。也希望能建立「有效利用日益增长的数据和与癌症相关数据的多样性来打造预测性模型,为接下来的癌症研究提供一个新的范式,更好地理解疾病并最终提供指导,支持基于个体预期治疗结果的决策,Rick 说。


这些都是远大的目标。因此想要总结出 JDACS4C 的准确谱系,确实有点麻烦,广义上来看,它属于 PMI,美国国家癌症研究所的癌症登月计划,也集中在 美国国家战略计算计划(NSCI)之下。Stevens 指出,早在几年前就开始讨论创建这个大项目框架了,8 月拿到了第一笔资金。以下是三个试点项目的简介:

RAS 分子项目: 这个项目((Molecular Level Pilot for RAS Structure and Dynamics in Cellular Membranes)旨在开发新的计算方法,支持 RAS 计划下已经完成的研究,最终完善我们对癌症中的 RAS(基因家族)及其相关信号通路作用的理解,识别 RAS 蛋白膜信号复合物中独有的新治疗靶点。
 
临床前筛选: 该项目(Cellular Level Pilot for Predictive Modeling for Pre-clinical Screening)将开发「基于源自人源性肿瘤组织异种移植实验性生物数据的机器学习、大规模数据和预测模型」。旨在创建一个反馈回路,其中,实验模型指导计算模型的方案。这些预测模型可能给癌症治疗的指明了新目标,并帮助确定新的治疗方法。
 
人口模型:这个项目(Population Level Pilot for Population Information Integration, Analysis and Modeling))旨在建立一个可扩展的框架,能够高效提取、延展、整合及 构建癌症患者的病例信息。这样的一个「引擎」应用在医疗保健的许多方面(转移、成本控制、研究等),将会十分强大。


显而易见的是,这么复杂的工作需要很多组织的配合。国家癌症研究所的部门包括生物医学信息和信息技术中心(CBIIT),癌症治疗诊断部(DCTD),癌症控制和人口科学部(DCCPS)和弗雷德里克国家癌症研究实验室(Frederick National Laboratory for Cancer Research)。也有四个美国能源部国家实验室被正式分派从事这个项目,这四个实验室分别是阿贡国家实验室(Argonne National Laboratory)、橡树岭国家实验室(Oak Ridge National Laboratory)、劳伦斯利弗莫尔国家实验室(Lawrence Livermore National Laboratory)和洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory)。


当所有的试验项目放在一起时,Stevens 指出,我们意识到每个项目都需要深度学习,而且需要它的各种不同用途。因此,我们的想法是,既要构建软件环境和网络拓扑,也要建造这三个项目所需的所有东西,所以我们不会复制。研究人员也定义了关键标准——与我们用来解决不同癌症子问题资源相匹配的、易于处理的深度学习问题。





早期的第一步是吸引供应商参与,这充分地证明了 Stevens 所说的话,因为几乎所有的主要 HPC 供应商都在积极地加速深度学习路线图。大多数人认为 JDACS4C 试点项目是学习和完善的机会。Stevens 说,JDASC4C 已经与英特尔、Cray、NVIDIA、IBM 等公司达成了合作关系。


「所有的实验室都配备了 DGX-1,并且 NVIDIA 已经为不同 GPU、Pascal 等优化了大多数的通用框架。我们在 DGX-1 上运行的任何东西都可以很容易地实现分布式。英特尔有自己的长远计划,并且并不是所有的这些计划都是公开的。我可以表明的是,我们正在与英特尔的所有适合的部门合作。」Stevens 说,他是 ANL 研究员和临床前筛选项目的领导者。


事实上,英特尔一直很忙,忙于购买 Nervana(一个用于深度学习的完整平台),最近又推出了扩展计划。Stevens 说:「他们谈论到为机器学习而优化的 Knights X 系列的版本。Knights Mil 是他们的线路图的第一个版本,」这个芯片巨头还在 SC16 上推出了深度学习推理加速卡;它是用于神经网络加速的基于现场可编程门阵列(field-programmable gate array (FPGA))的软硬件解决方案。Stevens 认为英特尔像 NVIDIA 一样,正在制定一个应用战略。


他说:「英特尔非常想尝试确定一种战略,以区分训练和推理平台之间的某些级别。大多数深度学习系统现在在『quasi』上做推理,它比用于训练的平台更小。英特尔希望确保『未来的 IA 架构擅长推理』」。


不足为奇的是现在人们花费了大量的精力用于评估来自谷歌、微软、Facebook 等公司的深度学习框架。Stevens 说:「我们也正在评估哪些框架最适合解决我们的问题,我们正在与供应商一起在硬件上优化它们。同时我们也与 Livermore 有合作关系,他们有一个内部的被称为 LBANN 的项目,该项目旨在构建一个可扩展的人工神经网络框架。」


「该计划是想以一种独立于框架的方式去开发我们的模型,所以我们可以在不需要重新编码我们的模型的情况下交换框架。这是一个非常常见的深度学习方法,其中有一个脚本层(scripting layer)可以捕获您的模型的表示(用于训练和管理数据的元算法(meta algorithms)等),我们同时与学术界和 NVIDIA 在顶层的工作流引擎上进行合作。因此,我们有一种堆叠式架构(stacked architecture),它与深度学习全景周围的所有不同群体进行合作。」


Stevens 说:「有趣的是下一代平台的供应商强烈支持提高机器学习所需的架构理念和功能,以及传统的物理驱动仿真(physics-driven simulation)。」他指出,与传统 HPC 相比,深度学习的快速增长和市场压力正在推动它们朝着这个方向发展。「它也让我们洞察到了 DOE 应用的发展方向:将需要传统的物理驱动的仿真的地方,但通常我们也可以找到一个利用机器学习的方法。」


共享学习是试点项目的重要组成部分。Stevens 说:「我们正在为机器学习社区抽象模型问题,这也是我们正在研究的 seven candle benchmarks 的一种净化版本,」这将包括可分布式的数据、代码,这些内容都 将在 GitHub 上开放。这些元素的第一部分预计会在第二季度发行。


个别试点小组也正在与学术界开展自己的外联活动。在试点项目计算能力的方面,「我们瞄准了一些平台,特别是 CORAL 平台、Oak Ridge 和 Livermore 的新机器,然后最终选定百亿亿次(exascale)级。这是一个普遍化的概念,所以它不是具体的 GPU 或者具体的多少核。」


有趣的是,这三个项目计划会用不同的方式使用深度学习。






因为 RAS 是在分子尺度上的项目,所以它在所有项目中拥有最小尺寸规模。你可能听说过 RAS,它是一个著名的癌症基因,其编码会生成嵌入在细胞膜中信号蛋白(signaling protein)。这些蛋白质控制着可以延伸到细胞中并驱动许多不同的细胞过程的信号传导途径。RAS 目前涉及约 30% 的癌症,包括一些最棘手的癌症,例如胰腺癌。该试点项目将把模拟和湿实验室筛选数据进行结合,以详细阐述 RAS 相关信号级联的细节,并且希望可以找到用于制造能干预这种病症所使用的新药的关键点。


即使一个相对较小的肿瘤也可能有「成千上万个突变,包括驱动突变(driver mutation)和许多偶然突变(passenger mutation),」Stevens 说。这些遗传差异会改变信令网络(signaling network)的重要细节信息。多年来,RAS 本身及其相关信令网已经成为药物靶点,但正如 Stevens 指出的:「这种信令网的行为很不直观。有时如果你击中了其中一个下游组分,它其实会产生负反馈,这实际上增加了你试图去抑制的效果。」


在 RAS 项目中,仿真基本上是一种在不同粒度(一直延伸到到原子行为,包括量子效应)上进行的分子动力学运动。所需的计算能力(会非常巨大)自然取决于所仿真的粒度水平。


「机器学习被用于跟踪仿真所经历的状态空间(state space),并进行决策——这里是否放大、是否缩小、是否改变我们在集合空间(ensemble space)的不同部分中所观察的参数。它基本上像是该仿真的一个智能监督人那样去更有效地使用它。


「从某种意义上讲,这就像是网络正在观看一部电影并且说道,『好吧,我之前已经看过电影的这个部分了,让我们快进吧,或是哇这真有趣,我之前从来没见过,让我们用慢镜头并放大看。』这种就是机器学习在模拟中所做的事情。在某种意义上,它能够快进并且跳过,「Stevens 说。由 Stevens 领导的这个临床前筛选项目是一个雄心勃勃的尝试,它基本上是从所能得到的尽可能多的临床前及临床癌症数据中进行精筛,并与小鼠模型中产生的新数据结合来建立药物-肿瘤相互作用的预测模型。这是一种生物信息学的和实验性的反馈方法。最终,给定一个特定肿瘤,其分子属性(基因表达、单核苷酸的多态性(Single Nucleotide Polymorphisms/SNP)、蛋白质组学等)已被确定,那么将该数据插到模型中来确定最佳治疗方案就应该是可以实现的。


此处的微妙之处在于,这种在单一类肿瘤或相对小门类药物上进行的小规模机器学习工作已做了很多,Stevens 说。「我们正在尝试使用深度学习来整合所有对象(成千上万的细胞系以及从较小数量细胞系中筛选出的化合物)的信息,然后就能将其应用在实验鼠身上。你培养了一群源自该人类肿瘤的实验鼠,而这些小鼠会成为人类临床试验的替代物。因此我可以在肿瘤鼠群体中尝试不同化合物来提供信息——我的肿瘤对给定药物可能会如何反应。」


一个巨大的挑战来自于是否能够理解所有历史数据,其中大部分数据是非结构化的,且往往是主观的(如病理报告)。「我们所做的第一件事情之一是建立分类器,它可以告诉我们该肿瘤的类型或者是它在身体的哪个部位(根据不同的数据),」他说。数据可疑的情况并不少见。「我们通过我们的分类器来运行它,而如果它是一个新的数据集,那么分类器就可能会说,它真不是来自肝脏,它来自一些其他部位。」通常临床前数据是基于结果的;它不会解释该结果是如何实现的。


「现在我们所建立的机器学习模型能够十分精确地预测出一个药物反应或肿瘤类型/结果,但它们不能相当有效地告诉我们个中原因。它们不是解释性的,不是机械论的,」Stevens 说,「我们要做的是以某种方式带来一些机械论的模型或机械论的数据,并将其与机器学习模型混合从而得到两样东西——拥有高精度预测能力的模型以及拥有预测解释能力的模型。因此这种混合方法的思想是一个宽广的开放空间,而我们认为这将会被推广到许多领域。」获得大而高质量的训练模型数据仍然具有挑战性,他说。


第三个项目致力于开发可预测人口规模的模型,Stevens 称之为「病人轨迹(patient trajectories)」,它基本上是在挖掘全国的监控数据。虽然该数据有些分散,但美国国家癌症研究所(National Cancer Institute/NCI)、美国国立卫生研究院(National Institutes of Health/NIH)、美国食品和药物管理局(Food and Drug Administration/FDA)、制药公司和付款人组织(病理报告、疗法、结果、生活方式、人口统计等)所持有的病人数据体量却十分庞大。不幸的是,在很大程度上它像许多生物医学数据一样是非结构化的。「我们不能真正以我们所希望的方式用它进行计算,因此我们正在使用机器学习来将非结构化数据翻译成我们可用于计算的结构化数据,」Stevens 说。


「因此,例如我们想用一台机器来读取所有病理报告并输出生物标记物(biomarkers)、突变状态或药物之类的信息,这样我们才能创建出具有一致性的病例报告。将它看做是一个以人口为基础的模型。在临床前筛选试点项目中,比如我们发现了一些对治疗某一类癌症非常有效的疗法和策略。我们想提取这些信息并将其输入到人口模型中,并说『如果这成为一种常见疗法的话,那么它在全球或全国范围内会对统计数字有多少改变?』或类似的话。」


这也是一种连接所有试点项目的方法,Stevens 说。从 RAS 项目中获得的认识以后可能会被用于观察那些或许适用于新疗法的一部分癌症;再反过来把它纳入人口模型项目中以了解可能会产生的影响。


JDACS4C 试点项目仍处在初期阶段,但希望很高。Stevens 指出,NCI 和 DOE 都获得了它们无法轻易获得的东西。「NCI 没有 DOE 所拥有的众多数学家和计算机科学家。他们也没办法使用最领先的机器。我们(DOE)所获得的是访问所有这些伟大的实验数据、实验设施和公共数据库的权限。」
 
 
来源:机器之心
 
 
 
 
 
 
更多内容请关注:www.imefuture.com
 
机器真的已经战胜人类医生了吗?医学AI标题党文章中的三大陷阱
深度学习与计算机视觉课时16-迁移学习之物体定位与检测(上)
深度学习与计算机视觉课时15-卷积神经网络详解(下)
 
智造家 查看全部
Rick Stevens 表示,首个先进癌症计算解决方案的联合设计(Joint Design of Advanced Computing Solutions for Cancer,JDACS4C)「成果」将于 2017 年第二季度的某个时间公开。JDACS4C 一共有三个试点项目,Rick 领导了其中之一,将深度学习(DL)应用到癌症治疗中去。这些项目不仅可以推进癌症研究和治疗,而且可以提高深度学习的能力和基础架构,最终着眼于百亿亿次计算机的研究,DOE 将对这些项目提供部分的资金支持。


无论以哪种标准,美国对抗癌症(U.S. War on Cancer)和 Precision Medicine Initiative(精准医学计划,PMI)都颇具野心。过去,对抗癌症一直没有很明显的进步,但也不是说没有取得很多成绩。


只是现在看来前景更为光明。生物医学的进步和下一代领先计算机的兴起(百亿亿次计算机的开发)推动着癌症治疗的发展。深度学习和数据驱动科学的快速发展,使许多人对前景报以乐观的态度,所以 2016 全球超级计算机大会重点关注精准医疗和 HPC 的作用就是偶然了。


三个 JDACS4C 试点项目,包括从分子层面到人口规模方面的诸多研究,以支持 CANcer 分布式学习环境项目(CANcer Distributed Learning Environment project):这些工作旨在洞察可扩展机器学习工具;通过深度学习、模拟和分析技术,减少治疗时间;为未来计算方案提供信息。也希望能建立「有效利用日益增长的数据和与癌症相关数据的多样性来打造预测性模型,为接下来的癌症研究提供一个新的范式,更好地理解疾病并最终提供指导,支持基于个体预期治疗结果的决策,Rick 说。


这些都是远大的目标。因此想要总结出 JDACS4C 的准确谱系,确实有点麻烦,广义上来看,它属于 PMI,美国国家癌症研究所的癌症登月计划,也集中在 美国国家战略计算计划(NSCI)之下。Stevens 指出,早在几年前就开始讨论创建这个大项目框架了,8 月拿到了第一笔资金。以下是三个试点项目的简介:

  • RAS 分子项目: 这个项目((Molecular Level Pilot for RAS Structure and Dynamics in Cellular Membranes)旨在开发新的计算方法,支持 RAS 计划下已经完成的研究,最终完善我们对癌症中的 RAS(基因家族)及其相关信号通路作用的理解,识别 RAS 蛋白膜信号复合物中独有的新治疗靶点。

 
  • 临床前筛选: 该项目(Cellular Level Pilot for Predictive Modeling for Pre-clinical Screening)将开发「基于源自人源性肿瘤组织异种移植实验性生物数据的机器学习、大规模数据和预测模型」。旨在创建一个反馈回路,其中,实验模型指导计算模型的方案。这些预测模型可能给癌症治疗的指明了新目标,并帮助确定新的治疗方法。

 
  • 人口模型:这个项目(Population Level Pilot for Population Information Integration, Analysis and Modeling))旨在建立一个可扩展的框架,能够高效提取、延展、整合及 构建癌症患者的病例信息。这样的一个「引擎」应用在医疗保健的许多方面(转移、成本控制、研究等),将会十分强大。



显而易见的是,这么复杂的工作需要很多组织的配合。国家癌症研究所的部门包括生物医学信息和信息技术中心(CBIIT),癌症治疗诊断部(DCTD),癌症控制和人口科学部(DCCPS)和弗雷德里克国家癌症研究实验室(Frederick National Laboratory for Cancer Research)。也有四个美国能源部国家实验室被正式分派从事这个项目,这四个实验室分别是阿贡国家实验室(Argonne National Laboratory)、橡树岭国家实验室(Oak Ridge National Laboratory)、劳伦斯利弗莫尔国家实验室(Lawrence Livermore National Laboratory)和洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory)。


当所有的试验项目放在一起时,Stevens 指出,我们意识到每个项目都需要深度学习,而且需要它的各种不同用途。因此,我们的想法是,既要构建软件环境和网络拓扑,也要建造这三个项目所需的所有东西,所以我们不会复制。研究人员也定义了关键标准——与我们用来解决不同癌症子问题资源相匹配的、易于处理的深度学习问题。

2.1_.jpg

早期的第一步是吸引供应商参与,这充分地证明了 Stevens 所说的话,因为几乎所有的主要 HPC 供应商都在积极地加速深度学习路线图。大多数人认为 JDACS4C 试点项目是学习和完善的机会。Stevens 说,JDASC4C 已经与英特尔、Cray、NVIDIA、IBM 等公司达成了合作关系。


「所有的实验室都配备了 DGX-1,并且 NVIDIA 已经为不同 GPU、Pascal 等优化了大多数的通用框架。我们在 DGX-1 上运行的任何东西都可以很容易地实现分布式。英特尔有自己的长远计划,并且并不是所有的这些计划都是公开的。我可以表明的是,我们正在与英特尔的所有适合的部门合作。」Stevens 说,他是 ANL 研究员和临床前筛选项目的领导者。


事实上,英特尔一直很忙,忙于购买 Nervana(一个用于深度学习的完整平台),最近又推出了扩展计划。Stevens 说:「他们谈论到为机器学习而优化的 Knights X 系列的版本。Knights Mil 是他们的线路图的第一个版本,」这个芯片巨头还在 SC16 上推出了深度学习推理加速卡;它是用于神经网络加速的基于现场可编程门阵列(field-programmable gate array (FPGA))的软硬件解决方案。Stevens 认为英特尔像 NVIDIA 一样,正在制定一个应用战略。


他说:「英特尔非常想尝试确定一种战略,以区分训练和推理平台之间的某些级别。大多数深度学习系统现在在『quasi』上做推理,它比用于训练的平台更小。英特尔希望确保『未来的 IA 架构擅长推理』」。


不足为奇的是现在人们花费了大量的精力用于评估来自谷歌、微软、Facebook 等公司的深度学习框架。Stevens 说:「我们也正在评估哪些框架最适合解决我们的问题,我们正在与供应商一起在硬件上优化它们。同时我们也与 Livermore 有合作关系,他们有一个内部的被称为 LBANN 的项目,该项目旨在构建一个可扩展的人工神经网络框架。」


「该计划是想以一种独立于框架的方式去开发我们的模型,所以我们可以在不需要重新编码我们的模型的情况下交换框架。这是一个非常常见的深度学习方法,其中有一个脚本层(scripting layer)可以捕获您的模型的表示(用于训练和管理数据的元算法(meta algorithms)等),我们同时与学术界和 NVIDIA 在顶层的工作流引擎上进行合作。因此,我们有一种堆叠式架构(stacked architecture),它与深度学习全景周围的所有不同群体进行合作。」


Stevens 说:「有趣的是下一代平台的供应商强烈支持提高机器学习所需的架构理念和功能,以及传统的物理驱动仿真(physics-driven simulation)。」他指出,与传统 HPC 相比,深度学习的快速增长和市场压力正在推动它们朝着这个方向发展。「它也让我们洞察到了 DOE 应用的发展方向:将需要传统的物理驱动的仿真的地方,但通常我们也可以找到一个利用机器学习的方法。」


共享学习是试点项目的重要组成部分。Stevens 说:「我们正在为机器学习社区抽象模型问题,这也是我们正在研究的 seven candle benchmarks 的一种净化版本,」这将包括可分布式的数据、代码,这些内容都 将在 GitHub 上开放。这些元素的第一部分预计会在第二季度发行。


个别试点小组也正在与学术界开展自己的外联活动。在试点项目计算能力的方面,「我们瞄准了一些平台,特别是 CORAL 平台、Oak Ridge 和 Livermore 的新机器,然后最终选定百亿亿次(exascale)级。这是一个普遍化的概念,所以它不是具体的 GPU 或者具体的多少核。」


有趣的是,这三个项目计划会用不同的方式使用深度学习。

2.2_.jpg


因为 RAS 是在分子尺度上的项目,所以它在所有项目中拥有最小尺寸规模。你可能听说过 RAS,它是一个著名的癌症基因,其编码会生成嵌入在细胞膜中信号蛋白(signaling protein)。这些蛋白质控制着可以延伸到细胞中并驱动许多不同的细胞过程的信号传导途径。RAS 目前涉及约 30% 的癌症,包括一些最棘手的癌症,例如胰腺癌。该试点项目将把模拟和湿实验室筛选数据进行结合,以详细阐述 RAS 相关信号级联的细节,并且希望可以找到用于制造能干预这种病症所使用的新药的关键点。


即使一个相对较小的肿瘤也可能有「成千上万个突变,包括驱动突变(driver mutation)和许多偶然突变(passenger mutation),」Stevens 说。这些遗传差异会改变信令网络(signaling network)的重要细节信息。多年来,RAS 本身及其相关信令网已经成为药物靶点,但正如 Stevens 指出的:「这种信令网的行为很不直观。有时如果你击中了其中一个下游组分,它其实会产生负反馈,这实际上增加了你试图去抑制的效果。」


在 RAS 项目中,仿真基本上是一种在不同粒度(一直延伸到到原子行为,包括量子效应)上进行的分子动力学运动。所需的计算能力(会非常巨大)自然取决于所仿真的粒度水平。


「机器学习被用于跟踪仿真所经历的状态空间(state space),并进行决策——这里是否放大、是否缩小、是否改变我们在集合空间(ensemble space)的不同部分中所观察的参数。它基本上像是该仿真的一个智能监督人那样去更有效地使用它。


「从某种意义上讲,这就像是网络正在观看一部电影并且说道,『好吧,我之前已经看过电影的这个部分了,让我们快进吧,或是哇这真有趣,我之前从来没见过,让我们用慢镜头并放大看。』这种就是机器学习在模拟中所做的事情。在某种意义上,它能够快进并且跳过,「Stevens 说。由 Stevens 领导的这个临床前筛选项目是一个雄心勃勃的尝试,它基本上是从所能得到的尽可能多的临床前及临床癌症数据中进行精筛,并与小鼠模型中产生的新数据结合来建立药物-肿瘤相互作用的预测模型。这是一种生物信息学的和实验性的反馈方法。最终,给定一个特定肿瘤,其分子属性(基因表达、单核苷酸的多态性(Single Nucleotide Polymorphisms/SNP)、蛋白质组学等)已被确定,那么将该数据插到模型中来确定最佳治疗方案就应该是可以实现的。


此处的微妙之处在于,这种在单一类肿瘤或相对小门类药物上进行的小规模机器学习工作已做了很多,Stevens 说。「我们正在尝试使用深度学习来整合所有对象(成千上万的细胞系以及从较小数量细胞系中筛选出的化合物)的信息,然后就能将其应用在实验鼠身上。你培养了一群源自该人类肿瘤的实验鼠,而这些小鼠会成为人类临床试验的替代物。因此我可以在肿瘤鼠群体中尝试不同化合物来提供信息——我的肿瘤对给定药物可能会如何反应。」


一个巨大的挑战来自于是否能够理解所有历史数据,其中大部分数据是非结构化的,且往往是主观的(如病理报告)。「我们所做的第一件事情之一是建立分类器,它可以告诉我们该肿瘤的类型或者是它在身体的哪个部位(根据不同的数据),」他说。数据可疑的情况并不少见。「我们通过我们的分类器来运行它,而如果它是一个新的数据集,那么分类器就可能会说,它真不是来自肝脏,它来自一些其他部位。」通常临床前数据是基于结果的;它不会解释该结果是如何实现的。


「现在我们所建立的机器学习模型能够十分精确地预测出一个药物反应或肿瘤类型/结果,但它们不能相当有效地告诉我们个中原因。它们不是解释性的,不是机械论的,」Stevens 说,「我们要做的是以某种方式带来一些机械论的模型或机械论的数据,并将其与机器学习模型混合从而得到两样东西——拥有高精度预测能力的模型以及拥有预测解释能力的模型。因此这种混合方法的思想是一个宽广的开放空间,而我们认为这将会被推广到许多领域。」获得大而高质量的训练模型数据仍然具有挑战性,他说。


第三个项目致力于开发可预测人口规模的模型,Stevens 称之为「病人轨迹(patient trajectories)」,它基本上是在挖掘全国的监控数据。虽然该数据有些分散,但美国国家癌症研究所(National Cancer Institute/NCI)、美国国立卫生研究院(National Institutes of Health/NIH)、美国食品和药物管理局(Food and Drug Administration/FDA)、制药公司和付款人组织(病理报告、疗法、结果、生活方式、人口统计等)所持有的病人数据体量却十分庞大。不幸的是,在很大程度上它像许多生物医学数据一样是非结构化的。「我们不能真正以我们所希望的方式用它进行计算,因此我们正在使用机器学习来将非结构化数据翻译成我们可用于计算的结构化数据,」Stevens 说。


「因此,例如我们想用一台机器来读取所有病理报告并输出生物标记物(biomarkers)、突变状态或药物之类的信息,这样我们才能创建出具有一致性的病例报告。将它看做是一个以人口为基础的模型。在临床前筛选试点项目中,比如我们发现了一些对治疗某一类癌症非常有效的疗法和策略。我们想提取这些信息并将其输入到人口模型中,并说『如果这成为一种常见疗法的话,那么它在全球或全国范围内会对统计数字有多少改变?』或类似的话。」


这也是一种连接所有试点项目的方法,Stevens 说。从 RAS 项目中获得的认识以后可能会被用于观察那些或许适用于新疗法的一部分癌症;再反过来把它纳入人口模型项目中以了解可能会产生的影响。


JDACS4C 试点项目仍处在初期阶段,但希望很高。Stevens 指出,NCI 和 DOE 都获得了它们无法轻易获得的东西。「NCI 没有 DOE 所拥有的众多数学家和计算机科学家。他们也没办法使用最领先的机器。我们(DOE)所获得的是访问所有这些伟大的实验数据、实验设施和公共数据库的权限。」
 
 
来源:机器之心
 
 
 
 
 
 
更多内容请关注:www.imefuture.com
 
机器真的已经战胜人类医生了吗?医学AI标题党文章中的三大陷阱
深度学习与计算机视觉课时16-迁移学习之物体定位与检测(上)
深度学习与计算机视觉课时15-卷积神经网络详解(下)
 
智造家
305 浏览

世界首例成功的人类脑机接口实验

机械自动化类 密泰传动系统 2016-11-15 13:48 发表了文章 来自相关话题

荷兰一名渐冻症女病人成为了第一个装配新型大脑植入体的人,这种植入传感器能让不能说话也不能移动的病人完全使用自己的思想与外界交流!点击阅读原文查看论文链接。

这种新型植入物是一套脑机接口的一部分,这套接口能够帮助这位病人拼写词语和句子。而且更重要的是,这套接口几乎可以随时随地使用,让她即使在户外也能够与朋友进行交谈,而不需要医疗专家在一旁随时提供帮助。





Hanneke de Bruijne 演示该系统


「这是有史以来的第一例,」荷兰乌特勒支大学医学院神经科学家和首席研究员 Nick Ramsay 告诉 CNN,「这是一种可以完全植入的系统,可以在家里工作,不需要任何专家的协助。」

这位女病人名叫 Hanneke de Bruijne,她在 2008 年被确诊患有肌萎缩侧索硬化(ALS),不久之后,她的神经细胞就完全萎缩了。

在仅仅不到两年的时间之内,她就从一个健康人变成了一个没有呼吸机就不能呼吸的病人,她再也不能移动或说话了。

在 Ramsey 遇到 de Bruijne 之前,她通过一个可以追踪她眼部移动的系统与外界交流,该系统让她可以选择出现在计算机屏幕上的特定词和字母来组成句子。

但即使这种方法也可能无法长时间使用。正如 New Scientist 曾经报道过的 Jessica Hamzelou 一样,她是三位因患有 ALS 而失去了运动能力乃至眼动能力的病人中的一个。

Ramsey 想搞清楚如何设计一个完全不用依赖任何形式的物理运动的系统(斯蒂芬·霍金所使用的那个有名的系统依赖于病人对他们的面部肌肉的控制)。

这意味需要打造一种新东西——思想读取设备。

过去一二十年来,我们已经见过了很多为瘫痪病人或失去肢体的病人装备的不同类型的大脑植入设备,但这项技术仍然还是一项很新的技术,大部分的研究都是在实验里面进展缓慢,很少有能走出实验室并进入人们的家庭的成果。Ramsey 及其团队想要打造一款能够让用户在家里面使用的设备,而不需要医疗专家的持续监管。

「不知怎的,它们从来没有实现突破而成为临床应用,」他告诉 CNN,「还没有人能让它在家里面工作。」

该设备是通过外科手术植入大脑之中的,其带有两个安装在大脑皮层运动区的电极,用户可以通过它们控制运动。

这些电极的确切位置是非常关键的——一个必须安装在大脑中负责右手运动的位置,另一个则会在你想要倒计数时开始工作。

这些电极连接着安装在 de Bruijne 胸部的起搏器大小的发射器,发射器可以与她面前的计算机屏幕进行无线通信。

当 de Bruijne 注视屏幕时,她会看到虚拟键盘上有一个可移动的光标,当光标移动到她想选择的字母上时,她必须想象右手点击了那个字母。





脑机接口工作原理示意图


当然,de Bruijne 无法使用她的右手,但她的大脑仍然可以发出运动的指令,而电极会收集这些信号,传递到发射器,然后传递到计算机和屏幕上。

仅仅六个月的训练之后,de Bruijne 已经可以正常使用这套系统了,打字正确率已到 95%。





系统设备示意图

「使用该设备进行交流是一个缓慢的过程——即使拼出一个单词也要花上几分钟——但随着训练的进行,de Bruijne 拼写的速度越来越快。」Hamzelou 在报告中说道。

「一开始,她需要花上五十多秒才能选中一个字母——现在她只需要花二十多秒时间了。」


虽然有一些对于在病人体内植入机械的质疑声,但 de Bruijne 认为新系统正让她变得更加自信,更加乐于与人交流,特别是在自然光照强烈使眼部追踪设备失灵的情形下。

「现在我已经可以在眼部追踪计算机不工作的时候出门与人交流了,」她告诉 Hamzelou,「我变得更加自信和独立。」

当然,迄今为止,这个系统只在一名患者身上得到过测试,尽管这是一项巨大的突破,科研团队也正在将设备转移至 Bruijne 的家中,但它在下一个受邀患者身上可能就没那么成功了,我们对此只能保持谨慎的乐观。

Ramsey 的下一个目标是通过增加电极来加快 de Bruijne 的交流速度。他希望在未来能够将这一系统发展成具有 30 到 60 个电极,可以更快地解码手语和内部语音。

「那时你就可以拼写聋哑人的手语了。」他告诉 CNN,「这是我们的目标」。

这项研究已在《New England Journal of Medicine》中发表。

论文:在一个患有肌萎缩侧索硬化(ALS)的闭锁综合征患者中的完全植入式脑机接口(Fully Implanted Brain–Computer Interface in a Locked-In Patient with ALS)






对于患有严重瘫痪而失去了说话能力的病人而言,没有多少可以与外界进行交流的选择。我们描述了一种可被患有晚期肌萎缩侧索硬化(ALS)的病人用于交流的方法,该方法涉及到一种完全植入式的脑机接口(brain–computer interface),其包含了安装在大脑皮层运动区的膜下电极(subdural electrodes)和一个安装在胸部左侧皮下的发射器(transmitter)。通过尝试移动在植入的电极另一侧的手,该病人在被植入了电极 28 周之后,已经能够准确和独立地控制一个计算机打字程序了,差不多一分钟可以打出 2 个字母。这个脑机接口提供了一种自动化的通信方法,可以补充甚至有时候可以取代该病人的眼部追踪设备。

 
 
 
本文由机器之心编译
智造家提供 查看全部
荷兰一名渐冻症女病人成为了第一个装配新型大脑植入体的人,这种植入传感器能让不能说话也不能移动的病人完全使用自己的思想与外界交流!点击阅读原文查看论文链接。

这种新型植入物是一套脑机接口的一部分,这套接口能够帮助这位病人拼写词语和句子。而且更重要的是,这套接口几乎可以随时随地使用,让她即使在户外也能够与朋友进行交谈,而不需要医疗专家在一旁随时提供帮助。

2.1_.jpg

Hanneke de Bruijne 演示该系统


「这是有史以来的第一例,」荷兰乌特勒支大学医学院神经科学家和首席研究员 Nick Ramsay 告诉 CNN,「这是一种可以完全植入的系统,可以在家里工作,不需要任何专家的协助。」

这位女病人名叫 Hanneke de Bruijne,她在 2008 年被确诊患有肌萎缩侧索硬化(ALS),不久之后,她的神经细胞就完全萎缩了。

在仅仅不到两年的时间之内,她就从一个健康人变成了一个没有呼吸机就不能呼吸的病人,她再也不能移动或说话了。

在 Ramsey 遇到 de Bruijne 之前,她通过一个可以追踪她眼部移动的系统与外界交流,该系统让她可以选择出现在计算机屏幕上的特定词和字母来组成句子。

但即使这种方法也可能无法长时间使用。正如 New Scientist 曾经报道过的 Jessica Hamzelou 一样,她是三位因患有 ALS 而失去了运动能力乃至眼动能力的病人中的一个。

Ramsey 想搞清楚如何设计一个完全不用依赖任何形式的物理运动的系统(斯蒂芬·霍金所使用的那个有名的系统依赖于病人对他们的面部肌肉的控制)。

这意味需要打造一种新东西——思想读取设备。

过去一二十年来,我们已经见过了很多为瘫痪病人或失去肢体的病人装备的不同类型的大脑植入设备,但这项技术仍然还是一项很新的技术,大部分的研究都是在实验里面进展缓慢,很少有能走出实验室并进入人们的家庭的成果。Ramsey 及其团队想要打造一款能够让用户在家里面使用的设备,而不需要医疗专家的持续监管。

「不知怎的,它们从来没有实现突破而成为临床应用,」他告诉 CNN,「还没有人能让它在家里面工作。」

该设备是通过外科手术植入大脑之中的,其带有两个安装在大脑皮层运动区的电极,用户可以通过它们控制运动。

这些电极的确切位置是非常关键的——一个必须安装在大脑中负责右手运动的位置,另一个则会在你想要倒计数时开始工作。

这些电极连接着安装在 de Bruijne 胸部的起搏器大小的发射器,发射器可以与她面前的计算机屏幕进行无线通信。

当 de Bruijne 注视屏幕时,她会看到虚拟键盘上有一个可移动的光标,当光标移动到她想选择的字母上时,她必须想象右手点击了那个字母。

2.2_.jpg

脑机接口工作原理示意图


当然,de Bruijne 无法使用她的右手,但她的大脑仍然可以发出运动的指令,而电极会收集这些信号,传递到发射器,然后传递到计算机和屏幕上。

仅仅六个月的训练之后,de Bruijne 已经可以正常使用这套系统了,打字正确率已到 95%。

2.3_.jpg

系统设备示意图

「使用该设备进行交流是一个缓慢的过程——即使拼出一个单词也要花上几分钟——但随着训练的进行,de Bruijne 拼写的速度越来越快。」Hamzelou 在报告中说道。

「一开始,她需要花上五十多秒才能选中一个字母——现在她只需要花二十多秒时间了。」


虽然有一些对于在病人体内植入机械的质疑声,但 de Bruijne 认为新系统正让她变得更加自信,更加乐于与人交流,特别是在自然光照强烈使眼部追踪设备失灵的情形下。

「现在我已经可以在眼部追踪计算机不工作的时候出门与人交流了,」她告诉 Hamzelou,「我变得更加自信和独立。」

当然,迄今为止,这个系统只在一名患者身上得到过测试,尽管这是一项巨大的突破,科研团队也正在将设备转移至 Bruijne 的家中,但它在下一个受邀患者身上可能就没那么成功了,我们对此只能保持谨慎的乐观。

Ramsey 的下一个目标是通过增加电极来加快 de Bruijne 的交流速度。他希望在未来能够将这一系统发展成具有 30 到 60 个电极,可以更快地解码手语和内部语音。

「那时你就可以拼写聋哑人的手语了。」他告诉 CNN,「这是我们的目标」。

这项研究已在《New England Journal of Medicine》中发表。

论文:在一个患有肌萎缩侧索硬化(ALS)的闭锁综合征患者中的完全植入式脑机接口(Fully Implanted Brain–Computer Interface in a Locked-In Patient with ALS)

2.4_.jpg


对于患有严重瘫痪而失去了说话能力的病人而言,没有多少可以与外界进行交流的选择。我们描述了一种可被患有晚期肌萎缩侧索硬化(ALS)的病人用于交流的方法,该方法涉及到一种完全植入式的脑机接口(brain–computer interface),其包含了安装在大脑皮层运动区的膜下电极(subdural electrodes)和一个安装在胸部左侧皮下的发射器(transmitter)。通过尝试移动在植入的电极另一侧的手,该病人在被植入了电极 28 周之后,已经能够准确和独立地控制一个计算机打字程序了,差不多一分钟可以打出 2 个字母。这个脑机接口提供了一种自动化的通信方法,可以补充甚至有时候可以取代该病人的眼部追踪设备。

 
 
 
本文由机器之心编译
智造家提供
482 浏览

2016年全球医疗机器人市场发展情况分析

机械自动化类 爱在有生之年 2016-10-05 10:23 发表了文章 来自相关话题

2016年全球医疗机器人市场发展情况分析
2016年全球医疗机器人市场发展情况分析
593 浏览

梦想更大,还是坑更大? | 医疗人工智能报告

机械自动化类 小螺号 2016-09-20 11:37 发表了文章 来自相关话题

由于医疗资源的短缺以及成本支出的快速增加,医疗人工智能存在着切实的需求。但美国在医疗人工智能领域将近五十年的探索后,尚没有取得明显突破。

从中国的创业现状来看,智能水平普遍比较低,而且在面向机构的服务方面也比较欠缺,未来这些领域都会有比较大的成长空间。

但医疗数据的获取、医疗本身的复杂性和人力物力财力等方面的巨大投入,都将成为这个领域的巨大挑战。
 
医疗领域人工智能的应用,激发了人们对未来的许多想象。计算机的运算速度快、储存量大、质量稳定且不知疲倦,如果能够在医疗领域应用,必将能够大大提高医疗质量和供给量,并最终降低医疗成本。加上商业前景的光环,医疗人工智能的探索真可以说是“引无数英雄竞折腰”。


但梦想照进现实,总需要一条切实可行的路径。有人认为路径很清晰,用“医疗大数据+算法”来训练机器人,就可以实现人工智能,无非是积累和获取数据的问题。但有人认为路上的坑很多,因为医疗太复杂,未知太多,尤其还事关人命。


讨论和思考都在继续,行动也在全球范围内轰轰烈烈的开展起来。我在这份报告里梳理了145家中国和美国在人工智能大方向上的创业公司,他们中的很多已经受到投资人的热捧。不仅如此,IBM和Google这样的巨头也都涉足医疗人工智能。尤其是IBM的Watson,更是已经在全球范围内的医疗机构当中付诸应用。


真正的重点是,这些先行者的实践究竟具有哪些更普世的价值。他们已经探索和尚未探索的领域中,究竟还埋藏着哪些机会。尤其是,那些若隐若现的坑究竟又在哪里,克服困境的方法已经找到了么?毕竟,在过去五十年有关医疗人工智能的探索都收效甚微的背景下,今天的创业者究竟可能面对怎样的未来?


于是,我在这篇文章里对医疗人工智能做了一个系统的分析,重点希望解决这样几个问题:
 
现实医疗真的需要人工智能吗?又有多需要?关于医疗人工智能,已经做过什么,又做成了什么?在医疗人工智能当中,有多少不同类型的尝试?究竟人们口中的那些坑是什么?


医疗的创业创新正经历一个瓶颈。与其他领域的资本寒冬不同,医疗创业面临瓶颈的原因是这个领域本身门槛很高又太过复杂。在一个行业困境时唱衰它,只不过是哗众取宠、秀智商下限的行为。改变不是不可能,只是需要时间。所以,我一直保持着积极的心态,与这个行业里最坚持的创新者、投资人交流,期待能够在他们的思考中找到任何一个改变的可能。这也是我写本系列文章的由来。以下我们进入正题。








Part.1 序章


1.1 关于医疗人工智能的讨论范围

人工智能火得烫手。前些天一个同事说他下午刚报道了一个人工智能方面的项目,当天吃晚饭的空里就有二十家投资机构上门要联系方式。这种火法让人依稀看到了曾经O2O的影子,但愿历史不要重演。同样,医疗领域在这股浪潮中也到了一种神魂颠倒的地步,“智能”二字几乎已经是每家公司产品的标配。可是,当我们在讨论人工智能的时候,我们究竟在讨论什么?


首先,我们来对医疗领域人工智能的应用做一个基本的设定:

①关于人工智能在医疗当中应用的终极想象,当然是电脑能够替代人来为患者诊断、治疗。这个理想并不是刚刚出现,至少可以追随到上世纪六七十年代。只不过实现起来,理想与现实的差距太大。

②比直接用电脑替代人来看病的难度略低一些的是临床决策辅助系统(Clinical decision support system,简称CDSS),这是目前尝试比较多、发展也相对比较快的领域。

③在实现人工智能的道路上,一个必备的条件是积累医疗大数据。所以,在人工智能创业领域的一个“近亲”,就是医疗大数据积累、挖掘和应用。也可以将其看做是实现人工智能的一个中间环节。

④向前再推进一步,就是获取数据的问题。从医疗机构获取数据是一个路径,而且无捷径可循;另外一个就是从患者端获取数据,特别是通过可穿戴硬件来获取患者的健康数据来实施健康管理。


从目前已经观察到的情况,有关人工智能在医疗领域探索大体有这么四种类型。如果单独讨论某一种类型,恐怕都不能完整的反应医疗领域人工智能的进展。所以,本文在讨论人工智能的过程中将采取最广义的概念,包含前述的四种类型。



1.2 医疗人工智能的现实需求


人工智能的火究竟是虚火而昙花一现,还是方兴未艾、志存高远。况且,医疗是否真的需要人工智能,还仅仅是跟风?有关这些问题,可以从以下几个方面来分析:


首先,医疗领域最突出的问题就是优质医疗资源不足。这个问题不止中国存在。美国这几年就经常爆出医生短缺的消息,最近还有预测说美国未来十年会短缺6到9万名内科医生。老龄化比较严重的日本也面临这个问题的困扰,每千人口中仅两人从医。就连每千人拥有4名医生的瑞士,近年也开始重视医生数量不足的问题。而医疗资源不足的问题,在我国还会因为分布不均而加剧。











再加上人口老龄化的加剧,未来对医生的需求量很有可能是有增无减。解决医生资源不足的问题,在增加供给量方面,培养医生需要周期;而调整结构则需要配套政策。或者简单的说,靠人来解决这个问题需要很长的时间,而且供给量也不是无限增加的。于是,人们开始寄希望于机器。因为一旦能够实现机器看病,供给量将会是无限增加。


解决医疗资源不足,恐怕是对人工智能的最根本需求和发展动力所在。而医疗领域面对的另外一个问题就是费用支出持续增加,财政支出和社会负担的压力越来越大。医疗负担上升是多种因素共同促成的结果,包括人口老龄化、慢性疾病增长、新技术的采用等。







人工智能在解决成本压力方面被寄予厚望有几个方面的原因:一是通过人工智能提高患者自查自诊自我管理的比例,降低医疗支出;二是通过人工智能手段实现更早期发现、更好管理,减少后续的医疗费用支出;三是通过人工智能手段提高医疗机构、医生的工作效率,降低医疗成本;再有就是通过人工智能制定科学合理的健康医疗方案,减少不合理的医疗支出。


此外,还有一些虽然不是急性且刚性的需求,也提高了人们对人工智能的期待。比如机器的运算速度、准确程度、更新速度、稳定性都要好于人工。比如肿瘤领域的研究论文,2009年到2013年,全球共产生了16万份肿瘤相关的研究,平均每年3.2万份。而到了2015年,这个数字已经达到了4.4万份,平均每天就有超过120篇新的研究发表。显然,这已经远远超出人类认知能力的范围。


综合这些因素,人工智能在医疗领域的应用,不仅有可能解决医疗资源短缺、成本支出增加的困境,而且还有可能带来医疗能力、医疗体验上的提升。从这两个方面的需求来看,人工智能在医疗领域确实拥有相当广阔的成长空间。



Part.2 医疗人工智能的五十年现实


从现在面向未来,库兹韦尔曾做出过预测,人工智能的水平超过人类智力的水平将在2045年出现。20多年后,奇点就将来临的猜想让很多人觉得过于疯狂。实际上,人类对人工智能的想象,至少已经有80年。1936,阿兰.图灵就提供了机器模拟人类数学运算的构想。二十年后,达特茅斯会议将人工智能确定成为一门科学。人类由此开始有计划、有目标的朝人工智能的目标努力。


2.1 早期医疗人工智能的尝试


从1956年之后的二十年里,人类雄心勃勃。后来AlphaGo算法核心内容的雏形就在这个时期出现,即贝尔曼公式。而最早的一波在医疗领域进行人工智能探索的尝试,也在这个时期出现。1972年,由利兹大学研发的AAPHelp是资料记载当中,医疗领域最早出现的人工智能系统。这个系统基于贝叶斯理论开发,主要是用于腹部剧痛的辅助诊断以及手术的相关需求。


在随后的整个七十年代当中,又产生了不少新的成果。INTERNIST I 于1974年由匹兹堡大学研发问世,主要用于内科复杂疾病的辅助诊断。这套系统在当时被认为极具价值,并于80年代在其基础了开发了CADUCEUS和QMR系统,开始了商业化尝试。MYCIN于1976年有斯坦福大学研发,主要用于血液感染疾病的辅助诊断。


此外,还有罗格斯大学开发的CASNET/Glaucoma,MIT开发的PIP、ABEL,斯坦福大学开发的ONCOCIN等。而且上世纪80年代,已经有一些商业化应用系统的出现,比如前面提到的QMR(Quick Medical Reference),还有哈佛医学院开发的DXplain,主要是依据临床表现提供诊断方案。DXplain的知识库中,已经收录了2200种疾病,和5000多种症状。








2.2 早期医疗人工智能尝试的局限性


事情并没有预期的那么顺利。在随后很长的一段时间里,人工智能在医疗领域当中的应用并没有取得特别明显的突破。人们所期待的机器替代人看病的场景并没有出现,反而越来越多的看到人工智能在医疗领域当中应用时的局限性。


在医疗服务当中,临床诊断是最为关键的环节。而对于临床医生来讲,只有当计算机能够达到“专家”的水平时,也许才会应用。但诊断的过程过于复杂,存在着大量的“变量”。即便是专家本人的诊断,亦有相当多的不确定因素。这样的话,对于人工智能的开发则需要理解专家从症状到做出诊断整个过程的逻辑,同时还需要将这种能力“教会”计算机。


再有,现在人们越来越多的认识到,要让医生愿意采用人工智能的系统,必须能够有效的将新系统合适地整合到医生原有的工作流当中。而且其实特别重要的一点是,需要让医生们相信,人工智能可以帮助他们改善临床效果、提升工作效率。但目前有关这一点,似乎并不是那么确定。


德国夏里特医院的学者曾经对辅助诊断系统在五年应用当中,针对抗生素滥用的效果进行了研究。结果显示,辅助诊断系统对抗生素滥用和临床诊疗的改善起到了不错的效果。


但也有不少研究的结论,则并不让人那么乐观。比如米兰大学在2014年的研究得出结论称,辅助诊断系统并没有明显对死亡率产生影响;而伦敦帝国学院的在2011年对过去13年数据的研究则显示,计算机在医疗领域的应用现实与理想状况差距很大,并且迄今为止,没有坚实的证据能够表明辅助诊断系统能够降低医疗成本并改善患者的治疗效果。


总的来说,医疗人工智能方面过往的大多数探索都并不成功。不过,这样的现状只能说明医疗的高度复杂性,并没有阻止人类在医疗领域探索人工智能的尝试。实际上,IBM研发的Watson机器人医生就在一路高歌猛进。除了技术本身的进步之外,Watson的实践本身还有怎样更重要的意义?



Part.3 Watson的意义


IBM在人工智能上的突破也不过是在最近十年当中取得的。1997年,“深蓝”战胜象棋大师卡斯帕罗夫之后的很长时间里,人工智能在辅助工作方面取得了很大的进展,比如处理繁琐的公司文件。但距离真正意义上的人工智能,相去甚远。以至于当挑战“Jeopardy!”的提议第一次出现在IBM的时候,甚至引来嘘声一片。


《纽约时报》记载过一个故事,2006年,IBM测试自己的最先进系统在“Jeopardy!”当中的表现。结果人类冠军答题的正确率是85-95%,而IBM系统的正确率却仅有15%,显得愚钝不堪(slow and dumb)。语言识别是当时人机对话的主要困难。然而仅5年之后,以IBM创始人托马斯.沃森命名的Watson机器人就在“Jeopardy!”当中击败了人类冠军。


这可以算是Watson“医生”的前传。很快,IBM就将Watson应用的重点转移到了医疗领域。








3.1 Watson成长史


在这次突破之后,吸取了深蓝教训的IBM开始了将Watson推向商业化应用的尝试,而健康成为了他们确定的重点方向之一。那么IBM“训练”Watson的教学方法是怎样的?2014年1月份,Watson“自立门户”,并推出Watsonfoundation将认知计算技术与大数据分析技术结合起来,奠定了整个Watson运作的基本逻辑。而Watson在健康领域的推进则是从2014年底开始的。


首先是Watson先后与苹果、强生和美敦力三巨头建立的合作。Watson和苹果的合作包括两个层面,一个是基于Healthkit面向普通用户的数据采集和储存,另一个是基于Researchkit面向研究人员的数据分析;与强生的合作主要是在关节、脊柱术前和术后的患者护理,以及慢病管理;与美敦力的合作,主要是通过美敦力的医疗器械采集糖尿病患者的数据,并为他们提供个性化的管理方案。


第一步还只是合作,很快IBM就掏出了真金白银。2015年,IBM一举并购了两家医疗大数据公司Phytel和Explorys。Phytel公司主要是应用云工具,帮助临床医生为患者提供质量更好的医疗服务。而Explorys最初则是由克利夫兰诊所发起成立的公司,主要为医疗服务机构提供数据管理,服务全美360家医院,拥有超过5000万个患者的医疗记录。






完成了这两家公司的并购后,IBM Watson Health正式成立。不过IBM的并购却并没有就此结束,2015年8月,IBM斥资10亿美元收购医疗影像数据公司Merge Healthcare;2016年2月,IBM又花了26亿美元收购了健康大数据公司Truven Health Analytics。


Merge是美国的一家老牌医疗影像公司,用户包括7500多家医院、科研机构、药企等。并购完成之后,Watson还将应用Merge的技术分析已经储存的超过三千亿个医疗影像数据。Truven Health Analytics服务超过8500个用户,拥有超过2亿名患者的诊断和医疗支出的数据。


到这时为止,IBM在不到一年的时间里在并购上投入了40亿美元,给Watson补充不同类型的数据和分析技术。投入之大,足见Watson的“饥渴”。








3.2 Watson商业化


现在Watson已经相当强大,能够读懂非结构化数据,而且能够在15秒内阅读完成4千万份文件。Watson需要商业化,只掏钱肯定是不行的,要赚钱就要尽可能扩大应用的范围。而从IBM的应用推广来看,除了在他们的北美大本营之外,Watson在亚洲的应用推广进展非常好,在中国和印度两个人口大国都有所斩获。


2014年10月,IBM宣布与东南亚地区最大的私立医院康民国际医院达成合作,Watson将为康民医院位于曼谷的医疗中心和其他16个国家的转诊办公室提供服务。


2015年5月,在Watson Health成立后不久,IBM就宣布,14家美国和加拿大的肿瘤医院将引进Watson,通过患者的基因测序数据来提供适当的治疗方案。


2015年12月,IBM宣布与印度的第三大医院Manipal Hospitals达成合作,Watson将帮助肿瘤医生为患者提供诊断和治疗。每年,有超过20万肿瘤患者在Manipal Hospitals医院接受治疗。


2016年8月,Watson落地中国,与中山大学附属肿瘤防治中心、中国医科大学附属第四医院、浙江省中医院、复旦大学附属肿瘤医院等21家医院达成合作。杭州认知网络是Watson在中国的本地服务商。


此外,Watson在医疗领域还与Talkspace、Welltok、hc1等新兴的移动医疗公司建立了合作。Watson将基于这些应用的数据采集,来为他们的用户提供相应的医疗服务。








3.3 “学以致用”的Watson


总结起来,IBM Watson的整个发展历程可以概括为“学以致用”。


在Watson发展早期,IBM豪掷亿金接连并购4家拥有医疗大数据的公司。而在此之前,Watson的“早教”阶段,IBM也是一直抱着梅奥诊所、MD安德森、纪念斯隆—凯特林癌症研究中心、纽约基因组研究中心等美国几家王牌医疗机构的大腿。


这个思路也被Google的DeepMind延续了下来。今年六月的信息,DeepMind与NHS达成了合作,能够获取超过160万患者的医疗健康数据。而很快就有类似MedConfidential这样的组织质疑Google获取患者数据的正当性。


相比于学,用的部分同样重要。尤其是让医生相信人工智能的作用并在实践当中应用,这个过程仍然需要大量的市场教育。而从IBM的策略中也可以看出,选择肿瘤这种刚需又优质医生短缺的领域是其重点方向。Manipal Hospitals的CEO Dr. Ajay Bakshi谈到,在印度平均每位肿瘤医生要服务1600名肿瘤患者,而且随着肿瘤发生率的上升,这种短缺还将加剧。另外,在中国市场,IBM也很明智的选择了本土的运营商来做市场开拓。


但Watson也并非没有问题。Watson主要解决的是肿瘤领域的疾病,尤其是肺癌、乳腺癌、结肠癌等。这几种癌症虽然日渐高发,但究竟Watson会有多大的用武之地是存在疑问的。除非Watson能够成为诊疗路径的一部分,但这恐怕又是难上加难。



Part.4 82家美国公司和63家中国公司


尽管Watson和DeepMind有IBM和Google这样的强大靠山,但他们在医疗领域也仅仅是入门级。众多医疗创业公司还有巨大的成长空间。本节,我们对中美两国在人工智能领域的创业公司做了一个基本梳理。其中,包括美国的82家公司,中国的63家公司。美国公司的数据主要参考了CBinsights的整理,而中国公司的数据则主要来自公开报道。


对这些公司的梳理首先遵循了我们最初设置的定义,即广义人工智能。从数据监测、采集、分析、应用、辅助诊断到电脑医生,各个类型的公司都在其中。



4.1 82家美国公司


首先来看美国公司。整体上,82家美国公司分成了7大类,分别是医疗影像类、健康管理类、医疗服务类、机构信息化、药企研发类、医疗大数据以及基因检测。当然这是个很粗的分类,每种公司的类型和归属并不是那么清晰。分类只是帮助我们认识,有哪些角度可以成为人工智能探索的切入点。以下来逐一分析:






医学影像类:美国公司在影像领域主要也是基于人工智能、深度学习的技术,帮助医生更快更准确的读取病人的影像数据,以更好的做出诊断。CBInsights的判断,这个领域的创业公司正越来越多。2015年以来,已经有17家公司完成首轮融资。这至少说明,影像分析这个事儿是被美国投资者认可的。


健康管理类:这里主要把对个人的健康管理和以个人用户为主的可穿戴设备,都归入其中。这类公司主要是根据用户个人的健康数据来预测疾病风险、提供健康管理方案。总体看,这类公司在美国也并没有出现什么新的花样。不过,这倒是在医疗人工智能领域少有的直接to C的服务。


医疗服务类:这在医疗服务方面应用人工智能的尝试是最多的。这类公司包括两类,一类是由医生提供在线的咨询服务或机器版的手机医生;另一类就是通常所理解的临床诊断辅助系统,包括早期筛查、诊断、康复,手术风险监测,用药安全等,而且会分不同领域,比如血液、睡眠、神经、心理等。


机构信息化:这类公司主要是通过数据监测和分析的方式,帮助医疗机构提升运营效率和诊疗效果,降低支出成本。美国的医疗机构市场化占主导,而且商业保险公司发育比较充分,这些因素也促使医疗机构更加注重效率和成本的,为机构信息化类的创业公司提供了市场空间。


药企研发类:新药研发的需求特别明确,就是解决成本高、周期长的问题。有研究显示,一种新药研发的成本已经接近26亿美元,平均需要10-15年的时间。瞄准这个痛点的创业公司,就是希望通过应用大数据和人工智能的技术,来帮助药企缩短研发周期、减低成本。






医疗大数据:这个分类相对比较模糊,因为实际上其他几个类型都离不开医疗大数据。不过,这类公司相比而言更加注重数据本身的研究和分析。比如鼎鼎大名的Flatiron,就是搭建肿瘤大数据平台、累计肿瘤患者数据,并通过对数据的研发和分析服务临床、科研、新药以及患者治疗。


基因测序:基因测序公司这里列举的比较少。这类公司有点“跨界”的性质。基因测序实际上是人体本身的数据化,并通过对这些数据的分析提供精准治疗。但基因测序的数据由于与通常的医疗大数据含义不一样。但也可以理解,未来人工智能和精准医疗在基因测序这个环节上,也许是连通的。


总体来看,美国创业公司主要面向药企、医疗机构等B端提供服务。而且,这些服务仍然主要是在辅助诊断系统、大数据挖掘等方面,可见美国整体上在人工智能上的探索进展也比较有限。



4.2 63家中国公司


与美国公司类似,中国公司的大体分类也包括医疗大数据、机构信息化、医疗医保类、医学影响类、医药研发类、健康管理类和基因测序了。这61家公司仅是统计到的部分创业公司,也欢迎各相关领域的创业公司主动与我们联系寻求报道(liuyong@36kr.com)。






同美国公司相比,中国公司大体上呈现了这么几个特点:智能化程度不够高,不少医疗类的项目主要还是在线咨询服务;to C类产品仍然占据大多数,B端服务开发不足;医疗机构信息化领域比较活跃,主要是解决机构信息互联互通的问题。


对比美国的公司,中国在医疗人工智能上还有哪些成长的空间:


首先是辅助诊断系统,应用人工智能为医生诊断提供帮助,提高效率和准确性。中国公司目前与医疗机构打交道更多仍然是获取医疗资源,提供简单的在线咨询服务。但这种对互联网的应用方式,已经显得普及化、大众化,渐渐失去了商业价值。


第二是服务医药器械企业,降低药品和器械的研发成本、缩短研发周期。实际上,中国公司不缺乏服务药企的的项目,但大多数仅仅是应用互联网做药品营销。虽然这也是一个赚钱的业务,但相比直接服务新药研发,仍然显得技术含量不足。


第三是医学影像,这里包括普通的影像,也包括病理、放疗涉及到“读片”的大影像概念。IBM收购Merge表明,读懂影像类数据对人工智能的发展是有价值的。而且美国过去一年的投资记录也可以看到,美国投资人对影像类人工智能的应用也比较看好。


总体上,中国公司在医疗人工智能方面的探索仍然逊色于美国。但这也许是多种因素作用的结果。而中国因为人口庞大而在医疗大数据上的巨大优势,还没有充分发挥出来。或许,在瓶颈突破之后,赶超美国公司只是时间问题。



Part.5 医疗人工智能的条件具备了吗?


前面我们说到,人工智能现在的火爆有点像当年的O2O。但如果细想这个问题,O2O可以一哄而上,人工智能也能一哄而上吗?恐怕很难,尤其是在医疗领域。人工智能的门槛显然比O2O高多了。不过,真正让很多人们对医疗人工智能望而却步的,却并不是技术问题这么简单,而是“坑”太多。



5.1 坑One:训练机器人的医疗数据从哪里来?或者更准确的说,是怎么来?


无论故事怎么讲,最庞大的医疗数据储存地必然是医疗机构。但这种涉及到患者隐私的高度敏感的问题,也必然是政策高度管制的地带。政府政策的态度就显得至关重要。


美国政府的态度还是很明确,对于医疗信息的商业化应用必须严格符合HIPAA和HITECH两个法案的规定。所以,很多医疗信息化的创业公司都会在自己的介绍中加上这么一个词儿“HIPAA-Compliant”。要想成为“HIPAA-Compliant”企业,就必须在physical和technical上符合HIPAA的要求。说白了,就是未经授权,无论是物理手段还是技术手段,都不能接触医疗信息。






到中国是什么情况?2016年6月,国务院办公厅公布了《关于促进和规范健康医疗大数据应用发展的指导意见》。这份写了一年半的指导意见,也成为我国医疗大数据应用纲领性文件。


文件发布后,国家卫计委的官方媒体《健康报》组织专家做了解读并专文刊登。其中一段话特别有趣:专家表示,健康医疗大数据既不能简单说是谁的,也不能简单说不是谁的,首先要客观理性看待我们的基础。目前,我国的公民隐私保护、个人信息保护、数据保护还没有法律支持。定位它是国家重要的基础性战略资源,回避了未来要做权属分割的问题,重点放在规范和应用上,有利于行业的发展和创新。


这段话的背景是,医疗信息的归属问题一直是我国行业内热议的问题。国务院的指导意见第一句话就指出:健康医疗大数据是国家重要的基础性战略资源。如果按照“专家们”的意思,国家这个表态就是说,归属问题不要再争了,关键是好好想想怎么用。


但不管怎么用,医疗数据都存在医疗机构里面。医疗机构对医疗信息的态度就变得非常重要。然而,刚刚颁行不久《深圳经济特区医疗条例》第五十条规定了,医疗机构向患者开放全部病历。如果未来能够在更大范围推广,将极有可能改变当年医疗信息应用的格局。



5.2 坑Two:医疗问题太过复杂!


总体上来讲,医疗是个有限集合。因为基本上普通病、常见病的种类、症状以及检测的指标等,数量和范围都是比较明确的。理想状况下,可以像AlphaGo一样算清所有变化。但问题是,医疗因为是发生在人身上的事情,就让这个问题复杂了许多。


直观上讲,同种疾病会有不同症状,同种症状会对应不同疾病,在疾病的症状与结果之间没有确定的对应关系,不同疾病之间也没有清晰的边界,而且还会存在同时发病的情况。这种情况,就让很多依靠知识库建立在“if-then”逻辑上的智能问诊应用面临很大问题,起码可应用的范围就会大大缩小。


进一步分析,疾病的治疗过程是不可逆的,这就是它与AlphaGo下棋完全不是一回事;究竟是哪些因素导致的疾病,并不是所有的信息都是清楚的;正因为病因上不够清楚,以及医学本身的有限性,造成了疾病的治疗结果不稳定性。


正是因为医疗如此复杂,造成了过去五十年对这个问题的研究迟迟没有突破。而这些问题还是在第一环节诊断上,到后面的治疗环节就会遇到当前互联网医疗在商业化方面的各种问题,比如与医院、医生、药店建立怎样的商业生态。当然还有一个最重要的问题是,就算你的应用真的很牛逼,如何让你的用户用起来,以及如何获得用户都是相当艰巨的问题。



5.3 坑three:工作量巨大无比


IBM在连花了40亿美金之后,骄傲的宣布自己已经拥有1亿份患者病历,3000万份影像数据以及2亿份保险记录,数据总量超过60万TB,覆盖人数约3亿。Google抱上了NHS的大腿,获得了160万患者的健康数据。但这些,在中国每年80亿就诊人次面前,简直是沧海一粟。






医疗人工智能的核心就是医疗数据,从这个角度出发,中国公司简直是幸福得“鼻涕冒泡”。但因为医疗数据基本都是以自然语言形态存在的,所以其实真正重要的环节是数据的结构化。这一步的工作量就将巨大无比。


但工作还远没有结束。就像不同专科的医生,拥有不同的知识结构一样,不同疾病的数据也需要不同的算法模型。这也就是为什么,我们看到的绝大多数在人工智能领域探索的医疗创业公司,包括Watson在内,都只能选择少数几个单病种。即使是机器,也没法一口就吃成胖子。


巨大的工作量起码意味着两件事情:人力和时间。对于创业公司来讲,完成前期的工作需要投入人力;而且完成每一个病种机器的训练都需要比较多的时间。这都意味着大量资金的投入。虽然我们都相信机器取代人类将是必然趋势,但这件事究竟在多久以后发生没人知道。也就是说,究竟有多少人愿意在这里面烧钱就很成问题。




Part.6 总结和讨论



6.1 一些总结


首先,由于医疗资源的短缺以及成本支出的快速增加,对医疗人工智能存在着切实的需求。但至少美国在医疗人工智能领域将近五十年的探索后,尚没有取得明显突破。所谓人工智能,大多数主要是临床辅助决策系统。而且,临床辅助决策系统究竟能够改善医疗效果,还存在争议。


IBM持续在Watson上烧钱,推动了它的明显进步,并在亚洲地区的中国、印度、东南亚等地应用推广上取得了不小的进展。但包括IBM、Google这些巨头也都仅仅是医疗人工智能的入门级水平,大量创业公司仍然存在巨大的商业机会。


但从中国的创业现状来看,智能水平普遍比较低,而且在面向机构的服务方面也比较欠缺,未来这些领域都会有比较大的成长空间。不过,在医疗人工智能领域,医疗数据的获取和结构化、医疗问题本身的巨大复杂性以及医疗人工智能在人力物力财力方面的巨大投入,都将成为这个领域的巨大挑战。



6.2 一些讨论


本文相对侧重于医疗人工智能实践路径的讨论,而对于之后的商业模式探寻不多。实际上,这两者应该是密不可分的。只有当医疗人工智能每个阶段的产品都有合适的应用时,这个领域才能够产生持续投入、持续产出的良性循环。


而从应用的角度看,究竟是从to B的角度切入,还是从to C的角度切入也有所不同。美国to B的应用比较多,而中国未来除了发展to B的应用外,能否在to C的应用上也有所突破?


另外还有一些相对比较宏观的问题,比如当下究竟是不是人工智能创业的最佳时机?虽然大家都在讨论,但这并不一定意味着时机合适。比如现在人工智能的成本是否一定低于人力成本,如果不够低,显然无法推开。比如在中国,当前医疗信息的互联互通还存在问题的情况下,医疗人工智能是否还为时太早?这些都是未来需要进一步探讨的问题。
 
 
 
 
文章来源于 36氪智造家平台提供 查看全部
6.0_.jpg

由于医疗资源的短缺以及成本支出的快速增加,医疗人工智能存在着切实的需求。但美国在医疗人工智能领域将近五十年的探索后,尚没有取得明显突破。

从中国的创业现状来看,智能水平普遍比较低,而且在面向机构的服务方面也比较欠缺,未来这些领域都会有比较大的成长空间。

但医疗数据的获取、医疗本身的复杂性和人力物力财力等方面的巨大投入,都将成为这个领域的巨大挑战。
 
医疗领域人工智能的应用,激发了人们对未来的许多想象。计算机的运算速度快、储存量大、质量稳定且不知疲倦,如果能够在医疗领域应用,必将能够大大提高医疗质量和供给量,并最终降低医疗成本。加上商业前景的光环,医疗人工智能的探索真可以说是“引无数英雄竞折腰”。


但梦想照进现实,总需要一条切实可行的路径。有人认为路径很清晰,用“医疗大数据+算法”来训练机器人,就可以实现人工智能,无非是积累和获取数据的问题。但有人认为路上的坑很多,因为医疗太复杂,未知太多,尤其还事关人命。


讨论和思考都在继续,行动也在全球范围内轰轰烈烈的开展起来。我在这份报告里梳理了145家中国和美国在人工智能大方向上的创业公司,他们中的很多已经受到投资人的热捧。不仅如此,IBM和Google这样的巨头也都涉足医疗人工智能。尤其是IBM的Watson,更是已经在全球范围内的医疗机构当中付诸应用。


真正的重点是,这些先行者的实践究竟具有哪些更普世的价值。他们已经探索和尚未探索的领域中,究竟还埋藏着哪些机会。尤其是,那些若隐若现的坑究竟又在哪里,克服困境的方法已经找到了么?毕竟,在过去五十年有关医疗人工智能的探索都收效甚微的背景下,今天的创业者究竟可能面对怎样的未来?


于是,我在这篇文章里对医疗人工智能做了一个系统的分析,重点希望解决这样几个问题:
 
  • 现实医疗真的需要人工智能吗?又有多需要?
  • 关于医疗人工智能,已经做过什么,又做成了什么?
  • 在医疗人工智能当中,有多少不同类型的尝试?
  • 究竟人们口中的那些坑是什么?



医疗的创业创新正经历一个瓶颈。与其他领域的资本寒冬不同,医疗创业面临瓶颈的原因是这个领域本身门槛很高又太过复杂。在一个行业困境时唱衰它,只不过是哗众取宠、秀智商下限的行为。改变不是不可能,只是需要时间。所以,我一直保持着积极的心态,与这个行业里最坚持的创新者、投资人交流,期待能够在他们的思考中找到任何一个改变的可能。这也是我写本系列文章的由来。以下我们进入正题。

6.1_.PNG




Part.1 序章


1.1 关于医疗人工智能的讨论范围

人工智能火得烫手。前些天一个同事说他下午刚报道了一个人工智能方面的项目,当天吃晚饭的空里就有二十家投资机构上门要联系方式。这种火法让人依稀看到了曾经O2O的影子,但愿历史不要重演。同样,医疗领域在这股浪潮中也到了一种神魂颠倒的地步,“智能”二字几乎已经是每家公司产品的标配。可是,当我们在讨论人工智能的时候,我们究竟在讨论什么?


首先,我们来对医疗领域人工智能的应用做一个基本的设定:

①关于人工智能在医疗当中应用的终极想象,当然是电脑能够替代人来为患者诊断、治疗。这个理想并不是刚刚出现,至少可以追随到上世纪六七十年代。只不过实现起来,理想与现实的差距太大。

②比直接用电脑替代人来看病的难度略低一些的是临床决策辅助系统(Clinical decision support system,简称CDSS),这是目前尝试比较多、发展也相对比较快的领域。

③在实现人工智能的道路上,一个必备的条件是积累医疗大数据。所以,在人工智能创业领域的一个“近亲”,就是医疗大数据积累、挖掘和应用。也可以将其看做是实现人工智能的一个中间环节。

④向前再推进一步,就是获取数据的问题。从医疗机构获取数据是一个路径,而且无捷径可循;另外一个就是从患者端获取数据,特别是通过可穿戴硬件来获取患者的健康数据来实施健康管理。


从目前已经观察到的情况,有关人工智能在医疗领域探索大体有这么四种类型。如果单独讨论某一种类型,恐怕都不能完整的反应医疗领域人工智能的进展。所以,本文在讨论人工智能的过程中将采取最广义的概念,包含前述的四种类型。



1.2 医疗人工智能的现实需求


人工智能的火究竟是虚火而昙花一现,还是方兴未艾、志存高远。况且,医疗是否真的需要人工智能,还仅仅是跟风?有关这些问题,可以从以下几个方面来分析:


首先,医疗领域最突出的问题就是优质医疗资源不足。这个问题不止中国存在。美国这几年就经常爆出医生短缺的消息,最近还有预测说美国未来十年会短缺6到9万名内科医生。老龄化比较严重的日本也面临这个问题的困扰,每千人口中仅两人从医。就连每千人拥有4名医生的瑞士,近年也开始重视医生数量不足的问题。而医疗资源不足的问题,在我国还会因为分布不均而加剧。

6.2_.jpg


6.3_.jpg


再加上人口老龄化的加剧,未来对医生的需求量很有可能是有增无减。解决医生资源不足的问题,在增加供给量方面,培养医生需要周期;而调整结构则需要配套政策。或者简单的说,靠人来解决这个问题需要很长的时间,而且供给量也不是无限增加的。于是,人们开始寄希望于机器。因为一旦能够实现机器看病,供给量将会是无限增加。


解决医疗资源不足,恐怕是对人工智能的最根本需求和发展动力所在。而医疗领域面对的另外一个问题就是费用支出持续增加,财政支出和社会负担的压力越来越大。医疗负担上升是多种因素共同促成的结果,包括人口老龄化、慢性疾病增长、新技术的采用等。

6.4_.jpg



人工智能在解决成本压力方面被寄予厚望有几个方面的原因:一是通过人工智能提高患者自查自诊自我管理的比例,降低医疗支出;二是通过人工智能手段实现更早期发现、更好管理,减少后续的医疗费用支出;三是通过人工智能手段提高医疗机构、医生的工作效率,降低医疗成本;再有就是通过人工智能制定科学合理的健康医疗方案,减少不合理的医疗支出。


此外,还有一些虽然不是急性且刚性的需求,也提高了人们对人工智能的期待。比如机器的运算速度、准确程度、更新速度、稳定性都要好于人工。比如肿瘤领域的研究论文,2009年到2013年,全球共产生了16万份肿瘤相关的研究,平均每年3.2万份。而到了2015年,这个数字已经达到了4.4万份,平均每天就有超过120篇新的研究发表。显然,这已经远远超出人类认知能力的范围。


综合这些因素,人工智能在医疗领域的应用,不仅有可能解决医疗资源短缺、成本支出增加的困境,而且还有可能带来医疗能力、医疗体验上的提升。从这两个方面的需求来看,人工智能在医疗领域确实拥有相当广阔的成长空间。



Part.2 医疗人工智能的五十年现实


从现在面向未来,库兹韦尔曾做出过预测,人工智能的水平超过人类智力的水平将在2045年出现。20多年后,奇点就将来临的猜想让很多人觉得过于疯狂。实际上,人类对人工智能的想象,至少已经有80年。1936,阿兰.图灵就提供了机器模拟人类数学运算的构想。二十年后,达特茅斯会议将人工智能确定成为一门科学。人类由此开始有计划、有目标的朝人工智能的目标努力。


2.1 早期医疗人工智能的尝试


从1956年之后的二十年里,人类雄心勃勃。后来AlphaGo算法核心内容的雏形就在这个时期出现,即贝尔曼公式。而最早的一波在医疗领域进行人工智能探索的尝试,也在这个时期出现。1972年,由利兹大学研发的AAPHelp是资料记载当中,医疗领域最早出现的人工智能系统。这个系统基于贝叶斯理论开发,主要是用于腹部剧痛的辅助诊断以及手术的相关需求。


在随后的整个七十年代当中,又产生了不少新的成果。INTERNIST I 于1974年由匹兹堡大学研发问世,主要用于内科复杂疾病的辅助诊断。这套系统在当时被认为极具价值,并于80年代在其基础了开发了CADUCEUS和QMR系统,开始了商业化尝试。MYCIN于1976年有斯坦福大学研发,主要用于血液感染疾病的辅助诊断。


此外,还有罗格斯大学开发的CASNET/Glaucoma,MIT开发的PIP、ABEL,斯坦福大学开发的ONCOCIN等。而且上世纪80年代,已经有一些商业化应用系统的出现,比如前面提到的QMR(Quick Medical Reference),还有哈佛医学院开发的DXplain,主要是依据临床表现提供诊断方案。DXplain的知识库中,已经收录了2200种疾病,和5000多种症状。

6.5_.JPG




2.2 早期医疗人工智能尝试的局限性


事情并没有预期的那么顺利。在随后很长的一段时间里,人工智能在医疗领域当中的应用并没有取得特别明显的突破。人们所期待的机器替代人看病的场景并没有出现,反而越来越多的看到人工智能在医疗领域当中应用时的局限性。


在医疗服务当中,临床诊断是最为关键的环节。而对于临床医生来讲,只有当计算机能够达到“专家”的水平时,也许才会应用。但诊断的过程过于复杂,存在着大量的“变量”。即便是专家本人的诊断,亦有相当多的不确定因素。这样的话,对于人工智能的开发则需要理解专家从症状到做出诊断整个过程的逻辑,同时还需要将这种能力“教会”计算机。


再有,现在人们越来越多的认识到,要让医生愿意采用人工智能的系统,必须能够有效的将新系统合适地整合到医生原有的工作流当中。而且其实特别重要的一点是,需要让医生们相信,人工智能可以帮助他们改善临床效果、提升工作效率。但目前有关这一点,似乎并不是那么确定。


德国夏里特医院的学者曾经对辅助诊断系统在五年应用当中,针对抗生素滥用的效果进行了研究。结果显示,辅助诊断系统对抗生素滥用和临床诊疗的改善起到了不错的效果。


但也有不少研究的结论,则并不让人那么乐观。比如米兰大学在2014年的研究得出结论称,辅助诊断系统并没有明显对死亡率产生影响;而伦敦帝国学院的在2011年对过去13年数据的研究则显示,计算机在医疗领域的应用现实与理想状况差距很大,并且迄今为止,没有坚实的证据能够表明辅助诊断系统能够降低医疗成本并改善患者的治疗效果。


总的来说,医疗人工智能方面过往的大多数探索都并不成功。不过,这样的现状只能说明医疗的高度复杂性,并没有阻止人类在医疗领域探索人工智能的尝试。实际上,IBM研发的Watson机器人医生就在一路高歌猛进。除了技术本身的进步之外,Watson的实践本身还有怎样更重要的意义?



Part.3 Watson的意义


IBM在人工智能上的突破也不过是在最近十年当中取得的。1997年,“深蓝”战胜象棋大师卡斯帕罗夫之后的很长时间里,人工智能在辅助工作方面取得了很大的进展,比如处理繁琐的公司文件。但距离真正意义上的人工智能,相去甚远。以至于当挑战“Jeopardy!”的提议第一次出现在IBM的时候,甚至引来嘘声一片。


《纽约时报》记载过一个故事,2006年,IBM测试自己的最先进系统在“Jeopardy!”当中的表现。结果人类冠军答题的正确率是85-95%,而IBM系统的正确率却仅有15%,显得愚钝不堪(slow and dumb)。语言识别是当时人机对话的主要困难。然而仅5年之后,以IBM创始人托马斯.沃森命名的Watson机器人就在“Jeopardy!”当中击败了人类冠军。


这可以算是Watson“医生”的前传。很快,IBM就将Watson应用的重点转移到了医疗领域。

6.6_.jpg




3.1 Watson成长史


在这次突破之后,吸取了深蓝教训的IBM开始了将Watson推向商业化应用的尝试,而健康成为了他们确定的重点方向之一。那么IBM“训练”Watson的教学方法是怎样的?2014年1月份,Watson“自立门户”,并推出Watsonfoundation将认知计算技术与大数据分析技术结合起来,奠定了整个Watson运作的基本逻辑。而Watson在健康领域的推进则是从2014年底开始的。


首先是Watson先后与苹果、强生和美敦力三巨头建立的合作。Watson和苹果的合作包括两个层面,一个是基于Healthkit面向普通用户的数据采集和储存,另一个是基于Researchkit面向研究人员的数据分析;与强生的合作主要是在关节、脊柱术前和术后的患者护理,以及慢病管理;与美敦力的合作,主要是通过美敦力的医疗器械采集糖尿病患者的数据,并为他们提供个性化的管理方案。


第一步还只是合作,很快IBM就掏出了真金白银。2015年,IBM一举并购了两家医疗大数据公司Phytel和Explorys。Phytel公司主要是应用云工具,帮助临床医生为患者提供质量更好的医疗服务。而Explorys最初则是由克利夫兰诊所发起成立的公司,主要为医疗服务机构提供数据管理,服务全美360家医院,拥有超过5000万个患者的医疗记录。

6.7_.jpg


完成了这两家公司的并购后,IBM Watson Health正式成立。不过IBM的并购却并没有就此结束,2015年8月,IBM斥资10亿美元收购医疗影像数据公司Merge Healthcare;2016年2月,IBM又花了26亿美元收购了健康大数据公司Truven Health Analytics。


Merge是美国的一家老牌医疗影像公司,用户包括7500多家医院、科研机构、药企等。并购完成之后,Watson还将应用Merge的技术分析已经储存的超过三千亿个医疗影像数据。Truven Health Analytics服务超过8500个用户,拥有超过2亿名患者的诊断和医疗支出的数据。


到这时为止,IBM在不到一年的时间里在并购上投入了40亿美元,给Watson补充不同类型的数据和分析技术。投入之大,足见Watson的“饥渴”。

6.8_.JPG




3.2 Watson商业化


现在Watson已经相当强大,能够读懂非结构化数据,而且能够在15秒内阅读完成4千万份文件。Watson需要商业化,只掏钱肯定是不行的,要赚钱就要尽可能扩大应用的范围。而从IBM的应用推广来看,除了在他们的北美大本营之外,Watson在亚洲的应用推广进展非常好,在中国和印度两个人口大国都有所斩获。


2014年10月,IBM宣布与东南亚地区最大的私立医院康民国际医院达成合作,Watson将为康民医院位于曼谷的医疗中心和其他16个国家的转诊办公室提供服务。


2015年5月,在Watson Health成立后不久,IBM就宣布,14家美国和加拿大的肿瘤医院将引进Watson,通过患者的基因测序数据来提供适当的治疗方案。


2015年12月,IBM宣布与印度的第三大医院Manipal Hospitals达成合作,Watson将帮助肿瘤医生为患者提供诊断和治疗。每年,有超过20万肿瘤患者在Manipal Hospitals医院接受治疗。


2016年8月,Watson落地中国,与中山大学附属肿瘤防治中心、中国医科大学附属第四医院、浙江省中医院、复旦大学附属肿瘤医院等21家医院达成合作。杭州认知网络是Watson在中国的本地服务商。


此外,Watson在医疗领域还与Talkspace、Welltok、hc1等新兴的移动医疗公司建立了合作。Watson将基于这些应用的数据采集,来为他们的用户提供相应的医疗服务。

6.9_.jpg




3.3 “学以致用”的Watson


总结起来,IBM Watson的整个发展历程可以概括为“学以致用”。


在Watson发展早期,IBM豪掷亿金接连并购4家拥有医疗大数据的公司。而在此之前,Watson的“早教”阶段,IBM也是一直抱着梅奥诊所、MD安德森、纪念斯隆—凯特林癌症研究中心、纽约基因组研究中心等美国几家王牌医疗机构的大腿。


这个思路也被Google的DeepMind延续了下来。今年六月的信息,DeepMind与NHS达成了合作,能够获取超过160万患者的医疗健康数据。而很快就有类似MedConfidential这样的组织质疑Google获取患者数据的正当性。


相比于学,用的部分同样重要。尤其是让医生相信人工智能的作用并在实践当中应用,这个过程仍然需要大量的市场教育。而从IBM的策略中也可以看出,选择肿瘤这种刚需又优质医生短缺的领域是其重点方向。Manipal Hospitals的CEO Dr. Ajay Bakshi谈到,在印度平均每位肿瘤医生要服务1600名肿瘤患者,而且随着肿瘤发生率的上升,这种短缺还将加剧。另外,在中国市场,IBM也很明智的选择了本土的运营商来做市场开拓。


但Watson也并非没有问题。Watson主要解决的是肿瘤领域的疾病,尤其是肺癌、乳腺癌、结肠癌等。这几种癌症虽然日渐高发,但究竟Watson会有多大的用武之地是存在疑问的。除非Watson能够成为诊疗路径的一部分,但这恐怕又是难上加难。



Part.4 82家美国公司和63家中国公司


尽管Watson和DeepMind有IBM和Google这样的强大靠山,但他们在医疗领域也仅仅是入门级。众多医疗创业公司还有巨大的成长空间。本节,我们对中美两国在人工智能领域的创业公司做了一个基本梳理。其中,包括美国的82家公司,中国的63家公司。美国公司的数据主要参考了CBinsights的整理,而中国公司的数据则主要来自公开报道。


对这些公司的梳理首先遵循了我们最初设置的定义,即广义人工智能。从数据监测、采集、分析、应用、辅助诊断到电脑医生,各个类型的公司都在其中。



4.1 82家美国公司


首先来看美国公司。整体上,82家美国公司分成了7大类,分别是医疗影像类、健康管理类、医疗服务类、机构信息化、药企研发类、医疗大数据以及基因检测。当然这是个很粗的分类,每种公司的类型和归属并不是那么清晰。分类只是帮助我们认识,有哪些角度可以成为人工智能探索的切入点。以下来逐一分析:

6.10_.jpg


医学影像类:美国公司在影像领域主要也是基于人工智能、深度学习的技术,帮助医生更快更准确的读取病人的影像数据,以更好的做出诊断。CBInsights的判断,这个领域的创业公司正越来越多。2015年以来,已经有17家公司完成首轮融资。这至少说明,影像分析这个事儿是被美国投资者认可的。


健康管理类:这里主要把对个人的健康管理和以个人用户为主的可穿戴设备,都归入其中。这类公司主要是根据用户个人的健康数据来预测疾病风险、提供健康管理方案。总体看,这类公司在美国也并没有出现什么新的花样。不过,这倒是在医疗人工智能领域少有的直接to C的服务。


医疗服务类:这在医疗服务方面应用人工智能的尝试是最多的。这类公司包括两类,一类是由医生提供在线的咨询服务或机器版的手机医生;另一类就是通常所理解的临床诊断辅助系统,包括早期筛查、诊断、康复,手术风险监测,用药安全等,而且会分不同领域,比如血液、睡眠、神经、心理等。


机构信息化:这类公司主要是通过数据监测和分析的方式,帮助医疗机构提升运营效率和诊疗效果,降低支出成本。美国的医疗机构市场化占主导,而且商业保险公司发育比较充分,这些因素也促使医疗机构更加注重效率和成本的,为机构信息化类的创业公司提供了市场空间。


药企研发类:新药研发的需求特别明确,就是解决成本高、周期长的问题。有研究显示,一种新药研发的成本已经接近26亿美元,平均需要10-15年的时间。瞄准这个痛点的创业公司,就是希望通过应用大数据和人工智能的技术,来帮助药企缩短研发周期、减低成本。

6.15_.jpg


医疗大数据:这个分类相对比较模糊,因为实际上其他几个类型都离不开医疗大数据。不过,这类公司相比而言更加注重数据本身的研究和分析。比如鼎鼎大名的Flatiron,就是搭建肿瘤大数据平台、累计肿瘤患者数据,并通过对数据的研发和分析服务临床、科研、新药以及患者治疗。


基因测序:基因测序公司这里列举的比较少。这类公司有点“跨界”的性质。基因测序实际上是人体本身的数据化,并通过对这些数据的分析提供精准治疗。但基因测序的数据由于与通常的医疗大数据含义不一样。但也可以理解,未来人工智能和精准医疗在基因测序这个环节上,也许是连通的。


总体来看,美国创业公司主要面向药企、医疗机构等B端提供服务。而且,这些服务仍然主要是在辅助诊断系统、大数据挖掘等方面,可见美国整体上在人工智能上的探索进展也比较有限。



4.2 63家中国公司


与美国公司类似,中国公司的大体分类也包括医疗大数据、机构信息化、医疗医保类、医学影响类、医药研发类、健康管理类和基因测序了。这61家公司仅是统计到的部分创业公司,也欢迎各相关领域的创业公司主动与我们联系寻求报道(liuyong@36kr.com)。

6.11_.jpg


同美国公司相比,中国公司大体上呈现了这么几个特点:智能化程度不够高,不少医疗类的项目主要还是在线咨询服务;to C类产品仍然占据大多数,B端服务开发不足;医疗机构信息化领域比较活跃,主要是解决机构信息互联互通的问题。


对比美国的公司,中国在医疗人工智能上还有哪些成长的空间:


首先是辅助诊断系统,应用人工智能为医生诊断提供帮助,提高效率和准确性。中国公司目前与医疗机构打交道更多仍然是获取医疗资源,提供简单的在线咨询服务。但这种对互联网的应用方式,已经显得普及化、大众化,渐渐失去了商业价值。


第二是服务医药器械企业,降低药品和器械的研发成本、缩短研发周期。实际上,中国公司不缺乏服务药企的的项目,但大多数仅仅是应用互联网做药品营销。虽然这也是一个赚钱的业务,但相比直接服务新药研发,仍然显得技术含量不足。


第三是医学影像,这里包括普通的影像,也包括病理、放疗涉及到“读片”的大影像概念。IBM收购Merge表明,读懂影像类数据对人工智能的发展是有价值的。而且美国过去一年的投资记录也可以看到,美国投资人对影像类人工智能的应用也比较看好。


总体上,中国公司在医疗人工智能方面的探索仍然逊色于美国。但这也许是多种因素作用的结果。而中国因为人口庞大而在医疗大数据上的巨大优势,还没有充分发挥出来。或许,在瓶颈突破之后,赶超美国公司只是时间问题。



Part.5 医疗人工智能的条件具备了吗?


前面我们说到,人工智能现在的火爆有点像当年的O2O。但如果细想这个问题,O2O可以一哄而上,人工智能也能一哄而上吗?恐怕很难,尤其是在医疗领域。人工智能的门槛显然比O2O高多了。不过,真正让很多人们对医疗人工智能望而却步的,却并不是技术问题这么简单,而是“坑”太多。



5.1 坑One:训练机器人的医疗数据从哪里来?或者更准确的说,是怎么来?


无论故事怎么讲,最庞大的医疗数据储存地必然是医疗机构。但这种涉及到患者隐私的高度敏感的问题,也必然是政策高度管制的地带。政府政策的态度就显得至关重要。


美国政府的态度还是很明确,对于医疗信息的商业化应用必须严格符合HIPAA和HITECH两个法案的规定。所以,很多医疗信息化的创业公司都会在自己的介绍中加上这么一个词儿“HIPAA-Compliant”。要想成为“HIPAA-Compliant”企业,就必须在physical和technical上符合HIPAA的要求。说白了,就是未经授权,无论是物理手段还是技术手段,都不能接触医疗信息。

6.12_.JPG


到中国是什么情况?2016年6月,国务院办公厅公布了《关于促进和规范健康医疗大数据应用发展的指导意见》。这份写了一年半的指导意见,也成为我国医疗大数据应用纲领性文件。


文件发布后,国家卫计委的官方媒体《健康报》组织专家做了解读并专文刊登。其中一段话特别有趣:专家表示,健康医疗大数据既不能简单说是谁的,也不能简单说不是谁的,首先要客观理性看待我们的基础。目前,我国的公民隐私保护、个人信息保护、数据保护还没有法律支持。定位它是国家重要的基础性战略资源,回避了未来要做权属分割的问题,重点放在规范和应用上,有利于行业的发展和创新。


这段话的背景是,医疗信息的归属问题一直是我国行业内热议的问题。国务院的指导意见第一句话就指出:健康医疗大数据是国家重要的基础性战略资源。如果按照“专家们”的意思,国家这个表态就是说,归属问题不要再争了,关键是好好想想怎么用。


但不管怎么用,医疗数据都存在医疗机构里面。医疗机构对医疗信息的态度就变得非常重要。然而,刚刚颁行不久《深圳经济特区医疗条例》第五十条规定了,医疗机构向患者开放全部病历。如果未来能够在更大范围推广,将极有可能改变当年医疗信息应用的格局。



5.2 坑Two:医疗问题太过复杂!


总体上来讲,医疗是个有限集合。因为基本上普通病、常见病的种类、症状以及检测的指标等,数量和范围都是比较明确的。理想状况下,可以像AlphaGo一样算清所有变化。但问题是,医疗因为是发生在人身上的事情,就让这个问题复杂了许多。


直观上讲,同种疾病会有不同症状,同种症状会对应不同疾病,在疾病的症状与结果之间没有确定的对应关系,不同疾病之间也没有清晰的边界,而且还会存在同时发病的情况。这种情况,就让很多依靠知识库建立在“if-then”逻辑上的智能问诊应用面临很大问题,起码可应用的范围就会大大缩小。


进一步分析,疾病的治疗过程是不可逆的,这就是它与AlphaGo下棋完全不是一回事;究竟是哪些因素导致的疾病,并不是所有的信息都是清楚的;正因为病因上不够清楚,以及医学本身的有限性,造成了疾病的治疗结果不稳定性。


正是因为医疗如此复杂,造成了过去五十年对这个问题的研究迟迟没有突破。而这些问题还是在第一环节诊断上,到后面的治疗环节就会遇到当前互联网医疗在商业化方面的各种问题,比如与医院、医生、药店建立怎样的商业生态。当然还有一个最重要的问题是,就算你的应用真的很牛逼,如何让你的用户用起来,以及如何获得用户都是相当艰巨的问题。



5.3 坑three:工作量巨大无比


IBM在连花了40亿美金之后,骄傲的宣布自己已经拥有1亿份患者病历,3000万份影像数据以及2亿份保险记录,数据总量超过60万TB,覆盖人数约3亿。Google抱上了NHS的大腿,获得了160万患者的健康数据。但这些,在中国每年80亿就诊人次面前,简直是沧海一粟。

6.13_.jpg


医疗人工智能的核心就是医疗数据,从这个角度出发,中国公司简直是幸福得“鼻涕冒泡”。但因为医疗数据基本都是以自然语言形态存在的,所以其实真正重要的环节是数据的结构化。这一步的工作量就将巨大无比。


但工作还远没有结束。就像不同专科的医生,拥有不同的知识结构一样,不同疾病的数据也需要不同的算法模型。这也就是为什么,我们看到的绝大多数在人工智能领域探索的医疗创业公司,包括Watson在内,都只能选择少数几个单病种。即使是机器,也没法一口就吃成胖子。


巨大的工作量起码意味着两件事情:人力和时间。对于创业公司来讲,完成前期的工作需要投入人力;而且完成每一个病种机器的训练都需要比较多的时间。这都意味着大量资金的投入。虽然我们都相信机器取代人类将是必然趋势,但这件事究竟在多久以后发生没人知道。也就是说,究竟有多少人愿意在这里面烧钱就很成问题。




Part.6 总结和讨论



6.1 一些总结


首先,由于医疗资源的短缺以及成本支出的快速增加,对医疗人工智能存在着切实的需求。但至少美国在医疗人工智能领域将近五十年的探索后,尚没有取得明显突破。所谓人工智能,大多数主要是临床辅助决策系统。而且,临床辅助决策系统究竟能够改善医疗效果,还存在争议。


IBM持续在Watson上烧钱,推动了它的明显进步,并在亚洲地区的中国、印度、东南亚等地应用推广上取得了不小的进展。但包括IBM、Google这些巨头也都仅仅是医疗人工智能的入门级水平,大量创业公司仍然存在巨大的商业机会。


但从中国的创业现状来看,智能水平普遍比较低,而且在面向机构的服务方面也比较欠缺,未来这些领域都会有比较大的成长空间。不过,在医疗人工智能领域,医疗数据的获取和结构化、医疗问题本身的巨大复杂性以及医疗人工智能在人力物力财力方面的巨大投入,都将成为这个领域的巨大挑战。



6.2 一些讨论


本文相对侧重于医疗人工智能实践路径的讨论,而对于之后的商业模式探寻不多。实际上,这两者应该是密不可分的。只有当医疗人工智能每个阶段的产品都有合适的应用时,这个领域才能够产生持续投入、持续产出的良性循环。


而从应用的角度看,究竟是从to B的角度切入,还是从to C的角度切入也有所不同。美国to B的应用比较多,而中国未来除了发展to B的应用外,能否在to C的应用上也有所突破?


另外还有一些相对比较宏观的问题,比如当下究竟是不是人工智能创业的最佳时机?虽然大家都在讨论,但这并不一定意味着时机合适。比如现在人工智能的成本是否一定低于人力成本,如果不够低,显然无法推开。比如在中国,当前医疗信息的互联互通还存在问题的情况下,医疗人工智能是否还为时太早?这些都是未来需要进一步探讨的问题。
 
 
 
 
  • 文章来源于 36氪
  • 智造家平台提供

316 浏览

产业观察:预计2016年智能医疗服务机器人市场将达60.25亿美元

其它类 品管人生 2016-12-29 16:10 发表了文章 来自相关话题

智能医疗服务机器人主要包括手术机器人和康复机器人。手术机器人重点突破介入感知建模和微纳技术,达芬奇机器人拥有先进的介入感知技术,全球销量已达到3600余台。智能康复机器人特别是外骨骼机器人等运用生机电一体化技术,融合机械工程和生物医学技术领域。Rewalk外骨骼机器人采用体感芯片,捕捉患者体感运动以帮助行走。我国妙手机器人是首款临床应用的手术机器人,因高技术门槛,国内手术机器人产品较少。国内康复机器人产品创新活跃,钱璟康复机器人、迪马外骨骼机器人受到市场认可,以金山胶囊机器人为代表的微型医疗机器人产品亦有面世。







全球智能医疗服务机器人市场规模预测


2016年,全球智能医疗服务机器人市场预计达60.25亿美元。至2020年,全球智能医疗服务机器人市场规模年均增速20.5%。







2016年全球智能医疗服务机器人市场规模占比


2016年,全球智能手术机器人市场规模占比最高,达60%,高于智能康复机器人26个百分点。







中国智能医疗服务机器人市场规模预测



2016年,中国智能医疗服务机器人市场预计达20.4亿元。至2020年,中国智能医疗服务机器人市场规模年均增速27.5%。







2016年全球智能医疗服务机器人市场规模占比


2016年,中国智能手术机器人市场规模占比最高,达58%,高于智能康复机器人21个百分点。




  作者简介:


李扬,中国社会科学院管理学博士、高级工程师,现任全息智慧产业研究院咨询主管,曾任工业和信息化部赛迪智库研究室主任,参与并负责国家战略性新兴产业、电子信息产业等多项战略规划和政策文件的起草工作,主持及参与项目研究30余项,在核心权威期刊发表论文近30篇,研究成果曾获国家发展改革委、工信部相关领导高度肯定。






全息智慧产业研究院咨询主管、 管理学博士、高级工程师 李扬


转自:全息智慧产业研究院
 
 
 
 
 
更多内容请关注:www.imefuture.com
 
即将到来的十场科技革命
人们都在说人工智能,其实现在我们真正做的是智能增强
 
智造家 查看全部
智能医疗服务机器人主要包括手术机器人和康复机器人。手术机器人重点突破介入感知建模和微纳技术,达芬奇机器人拥有先进的介入感知技术,全球销量已达到3600余台。智能康复机器人特别是外骨骼机器人等运用生机电一体化技术,融合机械工程和生物医学技术领域。Rewalk外骨骼机器人采用体感芯片,捕捉患者体感运动以帮助行走。我国妙手机器人是首款临床应用的手术机器人,因高技术门槛,国内手术机器人产品较少。国内康复机器人产品创新活跃,钱璟康复机器人、迪马外骨骼机器人受到市场认可,以金山胶囊机器人为代表的微型医疗机器人产品亦有面世。


2.1_.JPG


全球智能医疗服务机器人市场规模预测


2016年,全球智能医疗服务机器人市场预计达60.25亿美元。至2020年,全球智能医疗服务机器人市场规模年均增速20.5%。


2.2_.JPG


2016年全球智能医疗服务机器人市场规模占比


2016年,全球智能手术机器人市场规模占比最高,达60%,高于智能康复机器人26个百分点。


2.3_.JPG


中国智能医疗服务机器人市场规模预测



2016年,中国智能医疗服务机器人市场预计达20.4亿元。至2020年,中国智能医疗服务机器人市场规模年均增速27.5%。


2.4_.JPG


2016年全球智能医疗服务机器人市场规模占比


2016年,中国智能手术机器人市场规模占比最高,达58%,高于智能康复机器人21个百分点。




  作者简介:


李扬,中国社会科学院管理学博士、高级工程师,现任全息智慧产业研究院咨询主管,曾任工业和信息化部赛迪智库研究室主任,参与并负责国家战略性新兴产业、电子信息产业等多项战略规划和政策文件的起草工作,主持及参与项目研究30余项,在核心权威期刊发表论文近30篇,研究成果曾获国家发展改革委、工信部相关领导高度肯定。

2.5_.JPG


全息智慧产业研究院咨询主管、 管理学博士、高级工程师 李扬


转自:全息智慧产业研究院
 
 
 
 
 
更多内容请关注:www.imefuture.com
 
即将到来的十场科技革命
人们都在说人工智能,其实现在我们真正做的是智能增强
 
智造家
463 浏览

用深度学习对抗癌症:从分子层面研究到大规模人口建模

机械自动化类 密泰传动系统 2016-12-27 13:33 发表了文章 来自相关话题

Rick Stevens 表示,首个先进癌症计算解决方案的联合设计(Joint Design of Advanced Computing Solutions for Cancer,JDACS4C)「成果」将于 2017 年第二季度的某个时间公开。JDACS4C 一共有三个试点项目,Rick 领导了其中之一,将深度学习(DL)应用到癌症治疗中去。这些项目不仅可以推进癌症研究和治疗,而且可以提高深度学习的能力和基础架构,最终着眼于百亿亿次计算机的研究,DOE 将对这些项目提供部分的资金支持。


无论以哪种标准,美国对抗癌症(U.S. War on Cancer)和 Precision Medicine Initiative(精准医学计划,PMI)都颇具野心。过去,对抗癌症一直没有很明显的进步,但也不是说没有取得很多成绩。


只是现在看来前景更为光明。生物医学的进步和下一代领先计算机的兴起(百亿亿次计算机的开发)推动着癌症治疗的发展。深度学习和数据驱动科学的快速发展,使许多人对前景报以乐观的态度,所以 2016 全球超级计算机大会重点关注精准医疗和 HPC 的作用就是偶然了。


三个 JDACS4C 试点项目,包括从分子层面到人口规模方面的诸多研究,以支持 CANcer 分布式学习环境项目(CANcer Distributed Learning Environment project):这些工作旨在洞察可扩展机器学习工具;通过深度学习、模拟和分析技术,减少治疗时间;为未来计算方案提供信息。也希望能建立「有效利用日益增长的数据和与癌症相关数据的多样性来打造预测性模型,为接下来的癌症研究提供一个新的范式,更好地理解疾病并最终提供指导,支持基于个体预期治疗结果的决策,Rick 说。


这些都是远大的目标。因此想要总结出 JDACS4C 的准确谱系,确实有点麻烦,广义上来看,它属于 PMI,美国国家癌症研究所的癌症登月计划,也集中在 美国国家战略计算计划(NSCI)之下。Stevens 指出,早在几年前就开始讨论创建这个大项目框架了,8 月拿到了第一笔资金。以下是三个试点项目的简介:

RAS 分子项目: 这个项目((Molecular Level Pilot for RAS Structure and Dynamics in Cellular Membranes)旨在开发新的计算方法,支持 RAS 计划下已经完成的研究,最终完善我们对癌症中的 RAS(基因家族)及其相关信号通路作用的理解,识别 RAS 蛋白膜信号复合物中独有的新治疗靶点。
 
临床前筛选: 该项目(Cellular Level Pilot for Predictive Modeling for Pre-clinical Screening)将开发「基于源自人源性肿瘤组织异种移植实验性生物数据的机器学习、大规模数据和预测模型」。旨在创建一个反馈回路,其中,实验模型指导计算模型的方案。这些预测模型可能给癌症治疗的指明了新目标,并帮助确定新的治疗方法。
 
人口模型:这个项目(Population Level Pilot for Population Information Integration, Analysis and Modeling))旨在建立一个可扩展的框架,能够高效提取、延展、整合及 构建癌症患者的病例信息。这样的一个「引擎」应用在医疗保健的许多方面(转移、成本控制、研究等),将会十分强大。


显而易见的是,这么复杂的工作需要很多组织的配合。国家癌症研究所的部门包括生物医学信息和信息技术中心(CBIIT),癌症治疗诊断部(DCTD),癌症控制和人口科学部(DCCPS)和弗雷德里克国家癌症研究实验室(Frederick National Laboratory for Cancer Research)。也有四个美国能源部国家实验室被正式分派从事这个项目,这四个实验室分别是阿贡国家实验室(Argonne National Laboratory)、橡树岭国家实验室(Oak Ridge National Laboratory)、劳伦斯利弗莫尔国家实验室(Lawrence Livermore National Laboratory)和洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory)。


当所有的试验项目放在一起时,Stevens 指出,我们意识到每个项目都需要深度学习,而且需要它的各种不同用途。因此,我们的想法是,既要构建软件环境和网络拓扑,也要建造这三个项目所需的所有东西,所以我们不会复制。研究人员也定义了关键标准——与我们用来解决不同癌症子问题资源相匹配的、易于处理的深度学习问题。





早期的第一步是吸引供应商参与,这充分地证明了 Stevens 所说的话,因为几乎所有的主要 HPC 供应商都在积极地加速深度学习路线图。大多数人认为 JDACS4C 试点项目是学习和完善的机会。Stevens 说,JDASC4C 已经与英特尔、Cray、NVIDIA、IBM 等公司达成了合作关系。


「所有的实验室都配备了 DGX-1,并且 NVIDIA 已经为不同 GPU、Pascal 等优化了大多数的通用框架。我们在 DGX-1 上运行的任何东西都可以很容易地实现分布式。英特尔有自己的长远计划,并且并不是所有的这些计划都是公开的。我可以表明的是,我们正在与英特尔的所有适合的部门合作。」Stevens 说,他是 ANL 研究员和临床前筛选项目的领导者。


事实上,英特尔一直很忙,忙于购买 Nervana(一个用于深度学习的完整平台),最近又推出了扩展计划。Stevens 说:「他们谈论到为机器学习而优化的 Knights X 系列的版本。Knights Mil 是他们的线路图的第一个版本,」这个芯片巨头还在 SC16 上推出了深度学习推理加速卡;它是用于神经网络加速的基于现场可编程门阵列(field-programmable gate array (FPGA))的软硬件解决方案。Stevens 认为英特尔像 NVIDIA 一样,正在制定一个应用战略。


他说:「英特尔非常想尝试确定一种战略,以区分训练和推理平台之间的某些级别。大多数深度学习系统现在在『quasi』上做推理,它比用于训练的平台更小。英特尔希望确保『未来的 IA 架构擅长推理』」。


不足为奇的是现在人们花费了大量的精力用于评估来自谷歌、微软、Facebook 等公司的深度学习框架。Stevens 说:「我们也正在评估哪些框架最适合解决我们的问题,我们正在与供应商一起在硬件上优化它们。同时我们也与 Livermore 有合作关系,他们有一个内部的被称为 LBANN 的项目,该项目旨在构建一个可扩展的人工神经网络框架。」


「该计划是想以一种独立于框架的方式去开发我们的模型,所以我们可以在不需要重新编码我们的模型的情况下交换框架。这是一个非常常见的深度学习方法,其中有一个脚本层(scripting layer)可以捕获您的模型的表示(用于训练和管理数据的元算法(meta algorithms)等),我们同时与学术界和 NVIDIA 在顶层的工作流引擎上进行合作。因此,我们有一种堆叠式架构(stacked architecture),它与深度学习全景周围的所有不同群体进行合作。」


Stevens 说:「有趣的是下一代平台的供应商强烈支持提高机器学习所需的架构理念和功能,以及传统的物理驱动仿真(physics-driven simulation)。」他指出,与传统 HPC 相比,深度学习的快速增长和市场压力正在推动它们朝着这个方向发展。「它也让我们洞察到了 DOE 应用的发展方向:将需要传统的物理驱动的仿真的地方,但通常我们也可以找到一个利用机器学习的方法。」


共享学习是试点项目的重要组成部分。Stevens 说:「我们正在为机器学习社区抽象模型问题,这也是我们正在研究的 seven candle benchmarks 的一种净化版本,」这将包括可分布式的数据、代码,这些内容都 将在 GitHub 上开放。这些元素的第一部分预计会在第二季度发行。


个别试点小组也正在与学术界开展自己的外联活动。在试点项目计算能力的方面,「我们瞄准了一些平台,特别是 CORAL 平台、Oak Ridge 和 Livermore 的新机器,然后最终选定百亿亿次(exascale)级。这是一个普遍化的概念,所以它不是具体的 GPU 或者具体的多少核。」


有趣的是,这三个项目计划会用不同的方式使用深度学习。






因为 RAS 是在分子尺度上的项目,所以它在所有项目中拥有最小尺寸规模。你可能听说过 RAS,它是一个著名的癌症基因,其编码会生成嵌入在细胞膜中信号蛋白(signaling protein)。这些蛋白质控制着可以延伸到细胞中并驱动许多不同的细胞过程的信号传导途径。RAS 目前涉及约 30% 的癌症,包括一些最棘手的癌症,例如胰腺癌。该试点项目将把模拟和湿实验室筛选数据进行结合,以详细阐述 RAS 相关信号级联的细节,并且希望可以找到用于制造能干预这种病症所使用的新药的关键点。


即使一个相对较小的肿瘤也可能有「成千上万个突变,包括驱动突变(driver mutation)和许多偶然突变(passenger mutation),」Stevens 说。这些遗传差异会改变信令网络(signaling network)的重要细节信息。多年来,RAS 本身及其相关信令网已经成为药物靶点,但正如 Stevens 指出的:「这种信令网的行为很不直观。有时如果你击中了其中一个下游组分,它其实会产生负反馈,这实际上增加了你试图去抑制的效果。」


在 RAS 项目中,仿真基本上是一种在不同粒度(一直延伸到到原子行为,包括量子效应)上进行的分子动力学运动。所需的计算能力(会非常巨大)自然取决于所仿真的粒度水平。


「机器学习被用于跟踪仿真所经历的状态空间(state space),并进行决策——这里是否放大、是否缩小、是否改变我们在集合空间(ensemble space)的不同部分中所观察的参数。它基本上像是该仿真的一个智能监督人那样去更有效地使用它。


「从某种意义上讲,这就像是网络正在观看一部电影并且说道,『好吧,我之前已经看过电影的这个部分了,让我们快进吧,或是哇这真有趣,我之前从来没见过,让我们用慢镜头并放大看。』这种就是机器学习在模拟中所做的事情。在某种意义上,它能够快进并且跳过,「Stevens 说。由 Stevens 领导的这个临床前筛选项目是一个雄心勃勃的尝试,它基本上是从所能得到的尽可能多的临床前及临床癌症数据中进行精筛,并与小鼠模型中产生的新数据结合来建立药物-肿瘤相互作用的预测模型。这是一种生物信息学的和实验性的反馈方法。最终,给定一个特定肿瘤,其分子属性(基因表达、单核苷酸的多态性(Single Nucleotide Polymorphisms/SNP)、蛋白质组学等)已被确定,那么将该数据插到模型中来确定最佳治疗方案就应该是可以实现的。


此处的微妙之处在于,这种在单一类肿瘤或相对小门类药物上进行的小规模机器学习工作已做了很多,Stevens 说。「我们正在尝试使用深度学习来整合所有对象(成千上万的细胞系以及从较小数量细胞系中筛选出的化合物)的信息,然后就能将其应用在实验鼠身上。你培养了一群源自该人类肿瘤的实验鼠,而这些小鼠会成为人类临床试验的替代物。因此我可以在肿瘤鼠群体中尝试不同化合物来提供信息——我的肿瘤对给定药物可能会如何反应。」


一个巨大的挑战来自于是否能够理解所有历史数据,其中大部分数据是非结构化的,且往往是主观的(如病理报告)。「我们所做的第一件事情之一是建立分类器,它可以告诉我们该肿瘤的类型或者是它在身体的哪个部位(根据不同的数据),」他说。数据可疑的情况并不少见。「我们通过我们的分类器来运行它,而如果它是一个新的数据集,那么分类器就可能会说,它真不是来自肝脏,它来自一些其他部位。」通常临床前数据是基于结果的;它不会解释该结果是如何实现的。


「现在我们所建立的机器学习模型能够十分精确地预测出一个药物反应或肿瘤类型/结果,但它们不能相当有效地告诉我们个中原因。它们不是解释性的,不是机械论的,」Stevens 说,「我们要做的是以某种方式带来一些机械论的模型或机械论的数据,并将其与机器学习模型混合从而得到两样东西——拥有高精度预测能力的模型以及拥有预测解释能力的模型。因此这种混合方法的思想是一个宽广的开放空间,而我们认为这将会被推广到许多领域。」获得大而高质量的训练模型数据仍然具有挑战性,他说。


第三个项目致力于开发可预测人口规模的模型,Stevens 称之为「病人轨迹(patient trajectories)」,它基本上是在挖掘全国的监控数据。虽然该数据有些分散,但美国国家癌症研究所(National Cancer Institute/NCI)、美国国立卫生研究院(National Institutes of Health/NIH)、美国食品和药物管理局(Food and Drug Administration/FDA)、制药公司和付款人组织(病理报告、疗法、结果、生活方式、人口统计等)所持有的病人数据体量却十分庞大。不幸的是,在很大程度上它像许多生物医学数据一样是非结构化的。「我们不能真正以我们所希望的方式用它进行计算,因此我们正在使用机器学习来将非结构化数据翻译成我们可用于计算的结构化数据,」Stevens 说。


「因此,例如我们想用一台机器来读取所有病理报告并输出生物标记物(biomarkers)、突变状态或药物之类的信息,这样我们才能创建出具有一致性的病例报告。将它看做是一个以人口为基础的模型。在临床前筛选试点项目中,比如我们发现了一些对治疗某一类癌症非常有效的疗法和策略。我们想提取这些信息并将其输入到人口模型中,并说『如果这成为一种常见疗法的话,那么它在全球或全国范围内会对统计数字有多少改变?』或类似的话。」


这也是一种连接所有试点项目的方法,Stevens 说。从 RAS 项目中获得的认识以后可能会被用于观察那些或许适用于新疗法的一部分癌症;再反过来把它纳入人口模型项目中以了解可能会产生的影响。


JDACS4C 试点项目仍处在初期阶段,但希望很高。Stevens 指出,NCI 和 DOE 都获得了它们无法轻易获得的东西。「NCI 没有 DOE 所拥有的众多数学家和计算机科学家。他们也没办法使用最领先的机器。我们(DOE)所获得的是访问所有这些伟大的实验数据、实验设施和公共数据库的权限。」
 
 
来源:机器之心
 
 
 
 
 
 
更多内容请关注:www.imefuture.com
 
机器真的已经战胜人类医生了吗?医学AI标题党文章中的三大陷阱
深度学习与计算机视觉课时16-迁移学习之物体定位与检测(上)
深度学习与计算机视觉课时15-卷积神经网络详解(下)
 
智造家 查看全部
Rick Stevens 表示,首个先进癌症计算解决方案的联合设计(Joint Design of Advanced Computing Solutions for Cancer,JDACS4C)「成果」将于 2017 年第二季度的某个时间公开。JDACS4C 一共有三个试点项目,Rick 领导了其中之一,将深度学习(DL)应用到癌症治疗中去。这些项目不仅可以推进癌症研究和治疗,而且可以提高深度学习的能力和基础架构,最终着眼于百亿亿次计算机的研究,DOE 将对这些项目提供部分的资金支持。


无论以哪种标准,美国对抗癌症(U.S. War on Cancer)和 Precision Medicine Initiative(精准医学计划,PMI)都颇具野心。过去,对抗癌症一直没有很明显的进步,但也不是说没有取得很多成绩。


只是现在看来前景更为光明。生物医学的进步和下一代领先计算机的兴起(百亿亿次计算机的开发)推动着癌症治疗的发展。深度学习和数据驱动科学的快速发展,使许多人对前景报以乐观的态度,所以 2016 全球超级计算机大会重点关注精准医疗和 HPC 的作用就是偶然了。


三个 JDACS4C 试点项目,包括从分子层面到人口规模方面的诸多研究,以支持 CANcer 分布式学习环境项目(CANcer Distributed Learning Environment project):这些工作旨在洞察可扩展机器学习工具;通过深度学习、模拟和分析技术,减少治疗时间;为未来计算方案提供信息。也希望能建立「有效利用日益增长的数据和与癌症相关数据的多样性来打造预测性模型,为接下来的癌症研究提供一个新的范式,更好地理解疾病并最终提供指导,支持基于个体预期治疗结果的决策,Rick 说。


这些都是远大的目标。因此想要总结出 JDACS4C 的准确谱系,确实有点麻烦,广义上来看,它属于 PMI,美国国家癌症研究所的癌症登月计划,也集中在 美国国家战略计算计划(NSCI)之下。Stevens 指出,早在几年前就开始讨论创建这个大项目框架了,8 月拿到了第一笔资金。以下是三个试点项目的简介:

  • RAS 分子项目: 这个项目((Molecular Level Pilot for RAS Structure and Dynamics in Cellular Membranes)旨在开发新的计算方法,支持 RAS 计划下已经完成的研究,最终完善我们对癌症中的 RAS(基因家族)及其相关信号通路作用的理解,识别 RAS 蛋白膜信号复合物中独有的新治疗靶点。

 
  • 临床前筛选: 该项目(Cellular Level Pilot for Predictive Modeling for Pre-clinical Screening)将开发「基于源自人源性肿瘤组织异种移植实验性生物数据的机器学习、大规模数据和预测模型」。旨在创建一个反馈回路,其中,实验模型指导计算模型的方案。这些预测模型可能给癌症治疗的指明了新目标,并帮助确定新的治疗方法。

 
  • 人口模型:这个项目(Population Level Pilot for Population Information Integration, Analysis and Modeling))旨在建立一个可扩展的框架,能够高效提取、延展、整合及 构建癌症患者的病例信息。这样的一个「引擎」应用在医疗保健的许多方面(转移、成本控制、研究等),将会十分强大。



显而易见的是,这么复杂的工作需要很多组织的配合。国家癌症研究所的部门包括生物医学信息和信息技术中心(CBIIT),癌症治疗诊断部(DCTD),癌症控制和人口科学部(DCCPS)和弗雷德里克国家癌症研究实验室(Frederick National Laboratory for Cancer Research)。也有四个美国能源部国家实验室被正式分派从事这个项目,这四个实验室分别是阿贡国家实验室(Argonne National Laboratory)、橡树岭国家实验室(Oak Ridge National Laboratory)、劳伦斯利弗莫尔国家实验室(Lawrence Livermore National Laboratory)和洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory)。


当所有的试验项目放在一起时,Stevens 指出,我们意识到每个项目都需要深度学习,而且需要它的各种不同用途。因此,我们的想法是,既要构建软件环境和网络拓扑,也要建造这三个项目所需的所有东西,所以我们不会复制。研究人员也定义了关键标准——与我们用来解决不同癌症子问题资源相匹配的、易于处理的深度学习问题。

2.1_.jpg

早期的第一步是吸引供应商参与,这充分地证明了 Stevens 所说的话,因为几乎所有的主要 HPC 供应商都在积极地加速深度学习路线图。大多数人认为 JDACS4C 试点项目是学习和完善的机会。Stevens 说,JDASC4C 已经与英特尔、Cray、NVIDIA、IBM 等公司达成了合作关系。


「所有的实验室都配备了 DGX-1,并且 NVIDIA 已经为不同 GPU、Pascal 等优化了大多数的通用框架。我们在 DGX-1 上运行的任何东西都可以很容易地实现分布式。英特尔有自己的长远计划,并且并不是所有的这些计划都是公开的。我可以表明的是,我们正在与英特尔的所有适合的部门合作。」Stevens 说,他是 ANL 研究员和临床前筛选项目的领导者。


事实上,英特尔一直很忙,忙于购买 Nervana(一个用于深度学习的完整平台),最近又推出了扩展计划。Stevens 说:「他们谈论到为机器学习而优化的 Knights X 系列的版本。Knights Mil 是他们的线路图的第一个版本,」这个芯片巨头还在 SC16 上推出了深度学习推理加速卡;它是用于神经网络加速的基于现场可编程门阵列(field-programmable gate array (FPGA))的软硬件解决方案。Stevens 认为英特尔像 NVIDIA 一样,正在制定一个应用战略。


他说:「英特尔非常想尝试确定一种战略,以区分训练和推理平台之间的某些级别。大多数深度学习系统现在在『quasi』上做推理,它比用于训练的平台更小。英特尔希望确保『未来的 IA 架构擅长推理』」。


不足为奇的是现在人们花费了大量的精力用于评估来自谷歌、微软、Facebook 等公司的深度学习框架。Stevens 说:「我们也正在评估哪些框架最适合解决我们的问题,我们正在与供应商一起在硬件上优化它们。同时我们也与 Livermore 有合作关系,他们有一个内部的被称为 LBANN 的项目,该项目旨在构建一个可扩展的人工神经网络框架。」


「该计划是想以一种独立于框架的方式去开发我们的模型,所以我们可以在不需要重新编码我们的模型的情况下交换框架。这是一个非常常见的深度学习方法,其中有一个脚本层(scripting layer)可以捕获您的模型的表示(用于训练和管理数据的元算法(meta algorithms)等),我们同时与学术界和 NVIDIA 在顶层的工作流引擎上进行合作。因此,我们有一种堆叠式架构(stacked architecture),它与深度学习全景周围的所有不同群体进行合作。」


Stevens 说:「有趣的是下一代平台的供应商强烈支持提高机器学习所需的架构理念和功能,以及传统的物理驱动仿真(physics-driven simulation)。」他指出,与传统 HPC 相比,深度学习的快速增长和市场压力正在推动它们朝着这个方向发展。「它也让我们洞察到了 DOE 应用的发展方向:将需要传统的物理驱动的仿真的地方,但通常我们也可以找到一个利用机器学习的方法。」


共享学习是试点项目的重要组成部分。Stevens 说:「我们正在为机器学习社区抽象模型问题,这也是我们正在研究的 seven candle benchmarks 的一种净化版本,」这将包括可分布式的数据、代码,这些内容都 将在 GitHub 上开放。这些元素的第一部分预计会在第二季度发行。


个别试点小组也正在与学术界开展自己的外联活动。在试点项目计算能力的方面,「我们瞄准了一些平台,特别是 CORAL 平台、Oak Ridge 和 Livermore 的新机器,然后最终选定百亿亿次(exascale)级。这是一个普遍化的概念,所以它不是具体的 GPU 或者具体的多少核。」


有趣的是,这三个项目计划会用不同的方式使用深度学习。

2.2_.jpg


因为 RAS 是在分子尺度上的项目,所以它在所有项目中拥有最小尺寸规模。你可能听说过 RAS,它是一个著名的癌症基因,其编码会生成嵌入在细胞膜中信号蛋白(signaling protein)。这些蛋白质控制着可以延伸到细胞中并驱动许多不同的细胞过程的信号传导途径。RAS 目前涉及约 30% 的癌症,包括一些最棘手的癌症,例如胰腺癌。该试点项目将把模拟和湿实验室筛选数据进行结合,以详细阐述 RAS 相关信号级联的细节,并且希望可以找到用于制造能干预这种病症所使用的新药的关键点。


即使一个相对较小的肿瘤也可能有「成千上万个突变,包括驱动突变(driver mutation)和许多偶然突变(passenger mutation),」Stevens 说。这些遗传差异会改变信令网络(signaling network)的重要细节信息。多年来,RAS 本身及其相关信令网已经成为药物靶点,但正如 Stevens 指出的:「这种信令网的行为很不直观。有时如果你击中了其中一个下游组分,它其实会产生负反馈,这实际上增加了你试图去抑制的效果。」


在 RAS 项目中,仿真基本上是一种在不同粒度(一直延伸到到原子行为,包括量子效应)上进行的分子动力学运动。所需的计算能力(会非常巨大)自然取决于所仿真的粒度水平。


「机器学习被用于跟踪仿真所经历的状态空间(state space),并进行决策——这里是否放大、是否缩小、是否改变我们在集合空间(ensemble space)的不同部分中所观察的参数。它基本上像是该仿真的一个智能监督人那样去更有效地使用它。


「从某种意义上讲,这就像是网络正在观看一部电影并且说道,『好吧,我之前已经看过电影的这个部分了,让我们快进吧,或是哇这真有趣,我之前从来没见过,让我们用慢镜头并放大看。』这种就是机器学习在模拟中所做的事情。在某种意义上,它能够快进并且跳过,「Stevens 说。由 Stevens 领导的这个临床前筛选项目是一个雄心勃勃的尝试,它基本上是从所能得到的尽可能多的临床前及临床癌症数据中进行精筛,并与小鼠模型中产生的新数据结合来建立药物-肿瘤相互作用的预测模型。这是一种生物信息学的和实验性的反馈方法。最终,给定一个特定肿瘤,其分子属性(基因表达、单核苷酸的多态性(Single Nucleotide Polymorphisms/SNP)、蛋白质组学等)已被确定,那么将该数据插到模型中来确定最佳治疗方案就应该是可以实现的。


此处的微妙之处在于,这种在单一类肿瘤或相对小门类药物上进行的小规模机器学习工作已做了很多,Stevens 说。「我们正在尝试使用深度学习来整合所有对象(成千上万的细胞系以及从较小数量细胞系中筛选出的化合物)的信息,然后就能将其应用在实验鼠身上。你培养了一群源自该人类肿瘤的实验鼠,而这些小鼠会成为人类临床试验的替代物。因此我可以在肿瘤鼠群体中尝试不同化合物来提供信息——我的肿瘤对给定药物可能会如何反应。」


一个巨大的挑战来自于是否能够理解所有历史数据,其中大部分数据是非结构化的,且往往是主观的(如病理报告)。「我们所做的第一件事情之一是建立分类器,它可以告诉我们该肿瘤的类型或者是它在身体的哪个部位(根据不同的数据),」他说。数据可疑的情况并不少见。「我们通过我们的分类器来运行它,而如果它是一个新的数据集,那么分类器就可能会说,它真不是来自肝脏,它来自一些其他部位。」通常临床前数据是基于结果的;它不会解释该结果是如何实现的。


「现在我们所建立的机器学习模型能够十分精确地预测出一个药物反应或肿瘤类型/结果,但它们不能相当有效地告诉我们个中原因。它们不是解释性的,不是机械论的,」Stevens 说,「我们要做的是以某种方式带来一些机械论的模型或机械论的数据,并将其与机器学习模型混合从而得到两样东西——拥有高精度预测能力的模型以及拥有预测解释能力的模型。因此这种混合方法的思想是一个宽广的开放空间,而我们认为这将会被推广到许多领域。」获得大而高质量的训练模型数据仍然具有挑战性,他说。


第三个项目致力于开发可预测人口规模的模型,Stevens 称之为「病人轨迹(patient trajectories)」,它基本上是在挖掘全国的监控数据。虽然该数据有些分散,但美国国家癌症研究所(National Cancer Institute/NCI)、美国国立卫生研究院(National Institutes of Health/NIH)、美国食品和药物管理局(Food and Drug Administration/FDA)、制药公司和付款人组织(病理报告、疗法、结果、生活方式、人口统计等)所持有的病人数据体量却十分庞大。不幸的是,在很大程度上它像许多生物医学数据一样是非结构化的。「我们不能真正以我们所希望的方式用它进行计算,因此我们正在使用机器学习来将非结构化数据翻译成我们可用于计算的结构化数据,」Stevens 说。


「因此,例如我们想用一台机器来读取所有病理报告并输出生物标记物(biomarkers)、突变状态或药物之类的信息,这样我们才能创建出具有一致性的病例报告。将它看做是一个以人口为基础的模型。在临床前筛选试点项目中,比如我们发现了一些对治疗某一类癌症非常有效的疗法和策略。我们想提取这些信息并将其输入到人口模型中,并说『如果这成为一种常见疗法的话,那么它在全球或全国范围内会对统计数字有多少改变?』或类似的话。」


这也是一种连接所有试点项目的方法,Stevens 说。从 RAS 项目中获得的认识以后可能会被用于观察那些或许适用于新疗法的一部分癌症;再反过来把它纳入人口模型项目中以了解可能会产生的影响。


JDACS4C 试点项目仍处在初期阶段,但希望很高。Stevens 指出,NCI 和 DOE 都获得了它们无法轻易获得的东西。「NCI 没有 DOE 所拥有的众多数学家和计算机科学家。他们也没办法使用最领先的机器。我们(DOE)所获得的是访问所有这些伟大的实验数据、实验设施和公共数据库的权限。」
 
 
来源:机器之心
 
 
 
 
 
 
更多内容请关注:www.imefuture.com
 
机器真的已经战胜人类医生了吗?医学AI标题党文章中的三大陷阱
深度学习与计算机视觉课时16-迁移学习之物体定位与检测(上)
深度学习与计算机视觉课时15-卷积神经网络详解(下)
 
智造家
305 浏览

世界首例成功的人类脑机接口实验

机械自动化类 密泰传动系统 2016-11-15 13:48 发表了文章 来自相关话题

荷兰一名渐冻症女病人成为了第一个装配新型大脑植入体的人,这种植入传感器能让不能说话也不能移动的病人完全使用自己的思想与外界交流!点击阅读原文查看论文链接。

这种新型植入物是一套脑机接口的一部分,这套接口能够帮助这位病人拼写词语和句子。而且更重要的是,这套接口几乎可以随时随地使用,让她即使在户外也能够与朋友进行交谈,而不需要医疗专家在一旁随时提供帮助。





Hanneke de Bruijne 演示该系统


「这是有史以来的第一例,」荷兰乌特勒支大学医学院神经科学家和首席研究员 Nick Ramsay 告诉 CNN,「这是一种可以完全植入的系统,可以在家里工作,不需要任何专家的协助。」

这位女病人名叫 Hanneke de Bruijne,她在 2008 年被确诊患有肌萎缩侧索硬化(ALS),不久之后,她的神经细胞就完全萎缩了。

在仅仅不到两年的时间之内,她就从一个健康人变成了一个没有呼吸机就不能呼吸的病人,她再也不能移动或说话了。

在 Ramsey 遇到 de Bruijne 之前,她通过一个可以追踪她眼部移动的系统与外界交流,该系统让她可以选择出现在计算机屏幕上的特定词和字母来组成句子。

但即使这种方法也可能无法长时间使用。正如 New Scientist 曾经报道过的 Jessica Hamzelou 一样,她是三位因患有 ALS 而失去了运动能力乃至眼动能力的病人中的一个。

Ramsey 想搞清楚如何设计一个完全不用依赖任何形式的物理运动的系统(斯蒂芬·霍金所使用的那个有名的系统依赖于病人对他们的面部肌肉的控制)。

这意味需要打造一种新东西——思想读取设备。

过去一二十年来,我们已经见过了很多为瘫痪病人或失去肢体的病人装备的不同类型的大脑植入设备,但这项技术仍然还是一项很新的技术,大部分的研究都是在实验里面进展缓慢,很少有能走出实验室并进入人们的家庭的成果。Ramsey 及其团队想要打造一款能够让用户在家里面使用的设备,而不需要医疗专家的持续监管。

「不知怎的,它们从来没有实现突破而成为临床应用,」他告诉 CNN,「还没有人能让它在家里面工作。」

该设备是通过外科手术植入大脑之中的,其带有两个安装在大脑皮层运动区的电极,用户可以通过它们控制运动。

这些电极的确切位置是非常关键的——一个必须安装在大脑中负责右手运动的位置,另一个则会在你想要倒计数时开始工作。

这些电极连接着安装在 de Bruijne 胸部的起搏器大小的发射器,发射器可以与她面前的计算机屏幕进行无线通信。

当 de Bruijne 注视屏幕时,她会看到虚拟键盘上有一个可移动的光标,当光标移动到她想选择的字母上时,她必须想象右手点击了那个字母。





脑机接口工作原理示意图


当然,de Bruijne 无法使用她的右手,但她的大脑仍然可以发出运动的指令,而电极会收集这些信号,传递到发射器,然后传递到计算机和屏幕上。

仅仅六个月的训练之后,de Bruijne 已经可以正常使用这套系统了,打字正确率已到 95%。





系统设备示意图

「使用该设备进行交流是一个缓慢的过程——即使拼出一个单词也要花上几分钟——但随着训练的进行,de Bruijne 拼写的速度越来越快。」Hamzelou 在报告中说道。

「一开始,她需要花上五十多秒才能选中一个字母——现在她只需要花二十多秒时间了。」


虽然有一些对于在病人体内植入机械的质疑声,但 de Bruijne 认为新系统正让她变得更加自信,更加乐于与人交流,特别是在自然光照强烈使眼部追踪设备失灵的情形下。

「现在我已经可以在眼部追踪计算机不工作的时候出门与人交流了,」她告诉 Hamzelou,「我变得更加自信和独立。」

当然,迄今为止,这个系统只在一名患者身上得到过测试,尽管这是一项巨大的突破,科研团队也正在将设备转移至 Bruijne 的家中,但它在下一个受邀患者身上可能就没那么成功了,我们对此只能保持谨慎的乐观。

Ramsey 的下一个目标是通过增加电极来加快 de Bruijne 的交流速度。他希望在未来能够将这一系统发展成具有 30 到 60 个电极,可以更快地解码手语和内部语音。

「那时你就可以拼写聋哑人的手语了。」他告诉 CNN,「这是我们的目标」。

这项研究已在《New England Journal of Medicine》中发表。

论文:在一个患有肌萎缩侧索硬化(ALS)的闭锁综合征患者中的完全植入式脑机接口(Fully Implanted Brain–Computer Interface in a Locked-In Patient with ALS)






对于患有严重瘫痪而失去了说话能力的病人而言,没有多少可以与外界进行交流的选择。我们描述了一种可被患有晚期肌萎缩侧索硬化(ALS)的病人用于交流的方法,该方法涉及到一种完全植入式的脑机接口(brain–computer interface),其包含了安装在大脑皮层运动区的膜下电极(subdural electrodes)和一个安装在胸部左侧皮下的发射器(transmitter)。通过尝试移动在植入的电极另一侧的手,该病人在被植入了电极 28 周之后,已经能够准确和独立地控制一个计算机打字程序了,差不多一分钟可以打出 2 个字母。这个脑机接口提供了一种自动化的通信方法,可以补充甚至有时候可以取代该病人的眼部追踪设备。

 
 
 
本文由机器之心编译
智造家提供 查看全部
荷兰一名渐冻症女病人成为了第一个装配新型大脑植入体的人,这种植入传感器能让不能说话也不能移动的病人完全使用自己的思想与外界交流!点击阅读原文查看论文链接。

这种新型植入物是一套脑机接口的一部分,这套接口能够帮助这位病人拼写词语和句子。而且更重要的是,这套接口几乎可以随时随地使用,让她即使在户外也能够与朋友进行交谈,而不需要医疗专家在一旁随时提供帮助。

2.1_.jpg

Hanneke de Bruijne 演示该系统


「这是有史以来的第一例,」荷兰乌特勒支大学医学院神经科学家和首席研究员 Nick Ramsay 告诉 CNN,「这是一种可以完全植入的系统,可以在家里工作,不需要任何专家的协助。」

这位女病人名叫 Hanneke de Bruijne,她在 2008 年被确诊患有肌萎缩侧索硬化(ALS),不久之后,她的神经细胞就完全萎缩了。

在仅仅不到两年的时间之内,她就从一个健康人变成了一个没有呼吸机就不能呼吸的病人,她再也不能移动或说话了。

在 Ramsey 遇到 de Bruijne 之前,她通过一个可以追踪她眼部移动的系统与外界交流,该系统让她可以选择出现在计算机屏幕上的特定词和字母来组成句子。

但即使这种方法也可能无法长时间使用。正如 New Scientist 曾经报道过的 Jessica Hamzelou 一样,她是三位因患有 ALS 而失去了运动能力乃至眼动能力的病人中的一个。

Ramsey 想搞清楚如何设计一个完全不用依赖任何形式的物理运动的系统(斯蒂芬·霍金所使用的那个有名的系统依赖于病人对他们的面部肌肉的控制)。

这意味需要打造一种新东西——思想读取设备。

过去一二十年来,我们已经见过了很多为瘫痪病人或失去肢体的病人装备的不同类型的大脑植入设备,但这项技术仍然还是一项很新的技术,大部分的研究都是在实验里面进展缓慢,很少有能走出实验室并进入人们的家庭的成果。Ramsey 及其团队想要打造一款能够让用户在家里面使用的设备,而不需要医疗专家的持续监管。

「不知怎的,它们从来没有实现突破而成为临床应用,」他告诉 CNN,「还没有人能让它在家里面工作。」

该设备是通过外科手术植入大脑之中的,其带有两个安装在大脑皮层运动区的电极,用户可以通过它们控制运动。

这些电极的确切位置是非常关键的——一个必须安装在大脑中负责右手运动的位置,另一个则会在你想要倒计数时开始工作。

这些电极连接着安装在 de Bruijne 胸部的起搏器大小的发射器,发射器可以与她面前的计算机屏幕进行无线通信。

当 de Bruijne 注视屏幕时,她会看到虚拟键盘上有一个可移动的光标,当光标移动到她想选择的字母上时,她必须想象右手点击了那个字母。

2.2_.jpg

脑机接口工作原理示意图


当然,de Bruijne 无法使用她的右手,但她的大脑仍然可以发出运动的指令,而电极会收集这些信号,传递到发射器,然后传递到计算机和屏幕上。

仅仅六个月的训练之后,de Bruijne 已经可以正常使用这套系统了,打字正确率已到 95%。

2.3_.jpg

系统设备示意图

「使用该设备进行交流是一个缓慢的过程——即使拼出一个单词也要花上几分钟——但随着训练的进行,de Bruijne 拼写的速度越来越快。」Hamzelou 在报告中说道。

「一开始,她需要花上五十多秒才能选中一个字母——现在她只需要花二十多秒时间了。」


虽然有一些对于在病人体内植入机械的质疑声,但 de Bruijne 认为新系统正让她变得更加自信,更加乐于与人交流,特别是在自然光照强烈使眼部追踪设备失灵的情形下。

「现在我已经可以在眼部追踪计算机不工作的时候出门与人交流了,」她告诉 Hamzelou,「我变得更加自信和独立。」

当然,迄今为止,这个系统只在一名患者身上得到过测试,尽管这是一项巨大的突破,科研团队也正在将设备转移至 Bruijne 的家中,但它在下一个受邀患者身上可能就没那么成功了,我们对此只能保持谨慎的乐观。

Ramsey 的下一个目标是通过增加电极来加快 de Bruijne 的交流速度。他希望在未来能够将这一系统发展成具有 30 到 60 个电极,可以更快地解码手语和内部语音。

「那时你就可以拼写聋哑人的手语了。」他告诉 CNN,「这是我们的目标」。

这项研究已在《New England Journal of Medicine》中发表。

论文:在一个患有肌萎缩侧索硬化(ALS)的闭锁综合征患者中的完全植入式脑机接口(Fully Implanted Brain–Computer Interface in a Locked-In Patient with ALS)

2.4_.jpg


对于患有严重瘫痪而失去了说话能力的病人而言,没有多少可以与外界进行交流的选择。我们描述了一种可被患有晚期肌萎缩侧索硬化(ALS)的病人用于交流的方法,该方法涉及到一种完全植入式的脑机接口(brain–computer interface),其包含了安装在大脑皮层运动区的膜下电极(subdural electrodes)和一个安装在胸部左侧皮下的发射器(transmitter)。通过尝试移动在植入的电极另一侧的手,该病人在被植入了电极 28 周之后,已经能够准确和独立地控制一个计算机打字程序了,差不多一分钟可以打出 2 个字母。这个脑机接口提供了一种自动化的通信方法,可以补充甚至有时候可以取代该病人的眼部追踪设备。

 
 
 
本文由机器之心编译
智造家提供
482 浏览

2016年全球医疗机器人市场发展情况分析

机械自动化类 爱在有生之年 2016-10-05 10:23 发表了文章 来自相关话题

2016年全球医疗机器人市场发展情况分析
2016年全球医疗机器人市场发展情况分析
593 浏览

梦想更大,还是坑更大? | 医疗人工智能报告

机械自动化类 小螺号 2016-09-20 11:37 发表了文章 来自相关话题

由于医疗资源的短缺以及成本支出的快速增加,医疗人工智能存在着切实的需求。但美国在医疗人工智能领域将近五十年的探索后,尚没有取得明显突破。

从中国的创业现状来看,智能水平普遍比较低,而且在面向机构的服务方面也比较欠缺,未来这些领域都会有比较大的成长空间。

但医疗数据的获取、医疗本身的复杂性和人力物力财力等方面的巨大投入,都将成为这个领域的巨大挑战。
 
医疗领域人工智能的应用,激发了人们对未来的许多想象。计算机的运算速度快、储存量大、质量稳定且不知疲倦,如果能够在医疗领域应用,必将能够大大提高医疗质量和供给量,并最终降低医疗成本。加上商业前景的光环,医疗人工智能的探索真可以说是“引无数英雄竞折腰”。


但梦想照进现实,总需要一条切实可行的路径。有人认为路径很清晰,用“医疗大数据+算法”来训练机器人,就可以实现人工智能,无非是积累和获取数据的问题。但有人认为路上的坑很多,因为医疗太复杂,未知太多,尤其还事关人命。


讨论和思考都在继续,行动也在全球范围内轰轰烈烈的开展起来。我在这份报告里梳理了145家中国和美国在人工智能大方向上的创业公司,他们中的很多已经受到投资人的热捧。不仅如此,IBM和Google这样的巨头也都涉足医疗人工智能。尤其是IBM的Watson,更是已经在全球范围内的医疗机构当中付诸应用。


真正的重点是,这些先行者的实践究竟具有哪些更普世的价值。他们已经探索和尚未探索的领域中,究竟还埋藏着哪些机会。尤其是,那些若隐若现的坑究竟又在哪里,克服困境的方法已经找到了么?毕竟,在过去五十年有关医疗人工智能的探索都收效甚微的背景下,今天的创业者究竟可能面对怎样的未来?


于是,我在这篇文章里对医疗人工智能做了一个系统的分析,重点希望解决这样几个问题:
 
现实医疗真的需要人工智能吗?又有多需要?关于医疗人工智能,已经做过什么,又做成了什么?在医疗人工智能当中,有多少不同类型的尝试?究竟人们口中的那些坑是什么?


医疗的创业创新正经历一个瓶颈。与其他领域的资本寒冬不同,医疗创业面临瓶颈的原因是这个领域本身门槛很高又太过复杂。在一个行业困境时唱衰它,只不过是哗众取宠、秀智商下限的行为。改变不是不可能,只是需要时间。所以,我一直保持着积极的心态,与这个行业里最坚持的创新者、投资人交流,期待能够在他们的思考中找到任何一个改变的可能。这也是我写本系列文章的由来。以下我们进入正题。








Part.1 序章


1.1 关于医疗人工智能的讨论范围

人工智能火得烫手。前些天一个同事说他下午刚报道了一个人工智能方面的项目,当天吃晚饭的空里就有二十家投资机构上门要联系方式。这种火法让人依稀看到了曾经O2O的影子,但愿历史不要重演。同样,医疗领域在这股浪潮中也到了一种神魂颠倒的地步,“智能”二字几乎已经是每家公司产品的标配。可是,当我们在讨论人工智能的时候,我们究竟在讨论什么?


首先,我们来对医疗领域人工智能的应用做一个基本的设定:

①关于人工智能在医疗当中应用的终极想象,当然是电脑能够替代人来为患者诊断、治疗。这个理想并不是刚刚出现,至少可以追随到上世纪六七十年代。只不过实现起来,理想与现实的差距太大。

②比直接用电脑替代人来看病的难度略低一些的是临床决策辅助系统(Clinical decision support system,简称CDSS),这是目前尝试比较多、发展也相对比较快的领域。

③在实现人工智能的道路上,一个必备的条件是积累医疗大数据。所以,在人工智能创业领域的一个“近亲”,就是医疗大数据积累、挖掘和应用。也可以将其看做是实现人工智能的一个中间环节。

④向前再推进一步,就是获取数据的问题。从医疗机构获取数据是一个路径,而且无捷径可循;另外一个就是从患者端获取数据,特别是通过可穿戴硬件来获取患者的健康数据来实施健康管理。


从目前已经观察到的情况,有关人工智能在医疗领域探索大体有这么四种类型。如果单独讨论某一种类型,恐怕都不能完整的反应医疗领域人工智能的进展。所以,本文在讨论人工智能的过程中将采取最广义的概念,包含前述的四种类型。



1.2 医疗人工智能的现实需求


人工智能的火究竟是虚火而昙花一现,还是方兴未艾、志存高远。况且,医疗是否真的需要人工智能,还仅仅是跟风?有关这些问题,可以从以下几个方面来分析:


首先,医疗领域最突出的问题就是优质医疗资源不足。这个问题不止中国存在。美国这几年就经常爆出医生短缺的消息,最近还有预测说美国未来十年会短缺6到9万名内科医生。老龄化比较严重的日本也面临这个问题的困扰,每千人口中仅两人从医。就连每千人拥有4名医生的瑞士,近年也开始重视医生数量不足的问题。而医疗资源不足的问题,在我国还会因为分布不均而加剧。











再加上人口老龄化的加剧,未来对医生的需求量很有可能是有增无减。解决医生资源不足的问题,在增加供给量方面,培养医生需要周期;而调整结构则需要配套政策。或者简单的说,靠人来解决这个问题需要很长的时间,而且供给量也不是无限增加的。于是,人们开始寄希望于机器。因为一旦能够实现机器看病,供给量将会是无限增加。


解决医疗资源不足,恐怕是对人工智能的最根本需求和发展动力所在。而医疗领域面对的另外一个问题就是费用支出持续增加,财政支出和社会负担的压力越来越大。医疗负担上升是多种因素共同促成的结果,包括人口老龄化、慢性疾病增长、新技术的采用等。







人工智能在解决成本压力方面被寄予厚望有几个方面的原因:一是通过人工智能提高患者自查自诊自我管理的比例,降低医疗支出;二是通过人工智能手段实现更早期发现、更好管理,减少后续的医疗费用支出;三是通过人工智能手段提高医疗机构、医生的工作效率,降低医疗成本;再有就是通过人工智能制定科学合理的健康医疗方案,减少不合理的医疗支出。


此外,还有一些虽然不是急性且刚性的需求,也提高了人们对人工智能的期待。比如机器的运算速度、准确程度、更新速度、稳定性都要好于人工。比如肿瘤领域的研究论文,2009年到2013年,全球共产生了16万份肿瘤相关的研究,平均每年3.2万份。而到了2015年,这个数字已经达到了4.4万份,平均每天就有超过120篇新的研究发表。显然,这已经远远超出人类认知能力的范围。


综合这些因素,人工智能在医疗领域的应用,不仅有可能解决医疗资源短缺、成本支出增加的困境,而且还有可能带来医疗能力、医疗体验上的提升。从这两个方面的需求来看,人工智能在医疗领域确实拥有相当广阔的成长空间。



Part.2 医疗人工智能的五十年现实


从现在面向未来,库兹韦尔曾做出过预测,人工智能的水平超过人类智力的水平将在2045年出现。20多年后,奇点就将来临的猜想让很多人觉得过于疯狂。实际上,人类对人工智能的想象,至少已经有80年。1936,阿兰.图灵就提供了机器模拟人类数学运算的构想。二十年后,达特茅斯会议将人工智能确定成为一门科学。人类由此开始有计划、有目标的朝人工智能的目标努力。


2.1 早期医疗人工智能的尝试


从1956年之后的二十年里,人类雄心勃勃。后来AlphaGo算法核心内容的雏形就在这个时期出现,即贝尔曼公式。而最早的一波在医疗领域进行人工智能探索的尝试,也在这个时期出现。1972年,由利兹大学研发的AAPHelp是资料记载当中,医疗领域最早出现的人工智能系统。这个系统基于贝叶斯理论开发,主要是用于腹部剧痛的辅助诊断以及手术的相关需求。


在随后的整个七十年代当中,又产生了不少新的成果。INTERNIST I 于1974年由匹兹堡大学研发问世,主要用于内科复杂疾病的辅助诊断。这套系统在当时被认为极具价值,并于80年代在其基础了开发了CADUCEUS和QMR系统,开始了商业化尝试。MYCIN于1976年有斯坦福大学研发,主要用于血液感染疾病的辅助诊断。


此外,还有罗格斯大学开发的CASNET/Glaucoma,MIT开发的PIP、ABEL,斯坦福大学开发的ONCOCIN等。而且上世纪80年代,已经有一些商业化应用系统的出现,比如前面提到的QMR(Quick Medical Reference),还有哈佛医学院开发的DXplain,主要是依据临床表现提供诊断方案。DXplain的知识库中,已经收录了2200种疾病,和5000多种症状。








2.2 早期医疗人工智能尝试的局限性


事情并没有预期的那么顺利。在随后很长的一段时间里,人工智能在医疗领域当中的应用并没有取得特别明显的突破。人们所期待的机器替代人看病的场景并没有出现,反而越来越多的看到人工智能在医疗领域当中应用时的局限性。


在医疗服务当中,临床诊断是最为关键的环节。而对于临床医生来讲,只有当计算机能够达到“专家”的水平时,也许才会应用。但诊断的过程过于复杂,存在着大量的“变量”。即便是专家本人的诊断,亦有相当多的不确定因素。这样的话,对于人工智能的开发则需要理解专家从症状到做出诊断整个过程的逻辑,同时还需要将这种能力“教会”计算机。


再有,现在人们越来越多的认识到,要让医生愿意采用人工智能的系统,必须能够有效的将新系统合适地整合到医生原有的工作流当中。而且其实特别重要的一点是,需要让医生们相信,人工智能可以帮助他们改善临床效果、提升工作效率。但目前有关这一点,似乎并不是那么确定。


德国夏里特医院的学者曾经对辅助诊断系统在五年应用当中,针对抗生素滥用的效果进行了研究。结果显示,辅助诊断系统对抗生素滥用和临床诊疗的改善起到了不错的效果。


但也有不少研究的结论,则并不让人那么乐观。比如米兰大学在2014年的研究得出结论称,辅助诊断系统并没有明显对死亡率产生影响;而伦敦帝国学院的在2011年对过去13年数据的研究则显示,计算机在医疗领域的应用现实与理想状况差距很大,并且迄今为止,没有坚实的证据能够表明辅助诊断系统能够降低医疗成本并改善患者的治疗效果。


总的来说,医疗人工智能方面过往的大多数探索都并不成功。不过,这样的现状只能说明医疗的高度复杂性,并没有阻止人类在医疗领域探索人工智能的尝试。实际上,IBM研发的Watson机器人医生就在一路高歌猛进。除了技术本身的进步之外,Watson的实践本身还有怎样更重要的意义?



Part.3 Watson的意义


IBM在人工智能上的突破也不过是在最近十年当中取得的。1997年,“深蓝”战胜象棋大师卡斯帕罗夫之后的很长时间里,人工智能在辅助工作方面取得了很大的进展,比如处理繁琐的公司文件。但距离真正意义上的人工智能,相去甚远。以至于当挑战“Jeopardy!”的提议第一次出现在IBM的时候,甚至引来嘘声一片。


《纽约时报》记载过一个故事,2006年,IBM测试自己的最先进系统在“Jeopardy!”当中的表现。结果人类冠军答题的正确率是85-95%,而IBM系统的正确率却仅有15%,显得愚钝不堪(slow and dumb)。语言识别是当时人机对话的主要困难。然而仅5年之后,以IBM创始人托马斯.沃森命名的Watson机器人就在“Jeopardy!”当中击败了人类冠军。


这可以算是Watson“医生”的前传。很快,IBM就将Watson应用的重点转移到了医疗领域。








3.1 Watson成长史


在这次突破之后,吸取了深蓝教训的IBM开始了将Watson推向商业化应用的尝试,而健康成为了他们确定的重点方向之一。那么IBM“训练”Watson的教学方法是怎样的?2014年1月份,Watson“自立门户”,并推出Watsonfoundation将认知计算技术与大数据分析技术结合起来,奠定了整个Watson运作的基本逻辑。而Watson在健康领域的推进则是从2014年底开始的。


首先是Watson先后与苹果、强生和美敦力三巨头建立的合作。Watson和苹果的合作包括两个层面,一个是基于Healthkit面向普通用户的数据采集和储存,另一个是基于Researchkit面向研究人员的数据分析;与强生的合作主要是在关节、脊柱术前和术后的患者护理,以及慢病管理;与美敦力的合作,主要是通过美敦力的医疗器械采集糖尿病患者的数据,并为他们提供个性化的管理方案。


第一步还只是合作,很快IBM就掏出了真金白银。2015年,IBM一举并购了两家医疗大数据公司Phytel和Explorys。Phytel公司主要是应用云工具,帮助临床医生为患者提供质量更好的医疗服务。而Explorys最初则是由克利夫兰诊所发起成立的公司,主要为医疗服务机构提供数据管理,服务全美360家医院,拥有超过5000万个患者的医疗记录。






完成了这两家公司的并购后,IBM Watson Health正式成立。不过IBM的并购却并没有就此结束,2015年8月,IBM斥资10亿美元收购医疗影像数据公司Merge Healthcare;2016年2月,IBM又花了26亿美元收购了健康大数据公司Truven Health Analytics。


Merge是美国的一家老牌医疗影像公司,用户包括7500多家医院、科研机构、药企等。并购完成之后,Watson还将应用Merge的技术分析已经储存的超过三千亿个医疗影像数据。Truven Health Analytics服务超过8500个用户,拥有超过2亿名患者的诊断和医疗支出的数据。


到这时为止,IBM在不到一年的时间里在并购上投入了40亿美元,给Watson补充不同类型的数据和分析技术。投入之大,足见Watson的“饥渴”。








3.2 Watson商业化


现在Watson已经相当强大,能够读懂非结构化数据,而且能够在15秒内阅读完成4千万份文件。Watson需要商业化,只掏钱肯定是不行的,要赚钱就要尽可能扩大应用的范围。而从IBM的应用推广来看,除了在他们的北美大本营之外,Watson在亚洲的应用推广进展非常好,在中国和印度两个人口大国都有所斩获。


2014年10月,IBM宣布与东南亚地区最大的私立医院康民国际医院达成合作,Watson将为康民医院位于曼谷的医疗中心和其他16个国家的转诊办公室提供服务。


2015年5月,在Watson Health成立后不久,IBM就宣布,14家美国和加拿大的肿瘤医院将引进Watson,通过患者的基因测序数据来提供适当的治疗方案。


2015年12月,IBM宣布与印度的第三大医院Manipal Hospitals达成合作,Watson将帮助肿瘤医生为患者提供诊断和治疗。每年,有超过20万肿瘤患者在Manipal Hospitals医院接受治疗。


2016年8月,Watson落地中国,与中山大学附属肿瘤防治中心、中国医科大学附属第四医院、浙江省中医院、复旦大学附属肿瘤医院等21家医院达成合作。杭州认知网络是Watson在中国的本地服务商。


此外,Watson在医疗领域还与Talkspace、Welltok、hc1等新兴的移动医疗公司建立了合作。Watson将基于这些应用的数据采集,来为他们的用户提供相应的医疗服务。








3.3 “学以致用”的Watson


总结起来,IBM Watson的整个发展历程可以概括为“学以致用”。


在Watson发展早期,IBM豪掷亿金接连并购4家拥有医疗大数据的公司。而在此之前,Watson的“早教”阶段,IBM也是一直抱着梅奥诊所、MD安德森、纪念斯隆—凯特林癌症研究中心、纽约基因组研究中心等美国几家王牌医疗机构的大腿。


这个思路也被Google的DeepMind延续了下来。今年六月的信息,DeepMind与NHS达成了合作,能够获取超过160万患者的医疗健康数据。而很快就有类似MedConfidential这样的组织质疑Google获取患者数据的正当性。


相比于学,用的部分同样重要。尤其是让医生相信人工智能的作用并在实践当中应用,这个过程仍然需要大量的市场教育。而从IBM的策略中也可以看出,选择肿瘤这种刚需又优质医生短缺的领域是其重点方向。Manipal Hospitals的CEO Dr. Ajay Bakshi谈到,在印度平均每位肿瘤医生要服务1600名肿瘤患者,而且随着肿瘤发生率的上升,这种短缺还将加剧。另外,在中国市场,IBM也很明智的选择了本土的运营商来做市场开拓。


但Watson也并非没有问题。Watson主要解决的是肿瘤领域的疾病,尤其是肺癌、乳腺癌、结肠癌等。这几种癌症虽然日渐高发,但究竟Watson会有多大的用武之地是存在疑问的。除非Watson能够成为诊疗路径的一部分,但这恐怕又是难上加难。



Part.4 82家美国公司和63家中国公司


尽管Watson和DeepMind有IBM和Google这样的强大靠山,但他们在医疗领域也仅仅是入门级。众多医疗创业公司还有巨大的成长空间。本节,我们对中美两国在人工智能领域的创业公司做了一个基本梳理。其中,包括美国的82家公司,中国的63家公司。美国公司的数据主要参考了CBinsights的整理,而中国公司的数据则主要来自公开报道。


对这些公司的梳理首先遵循了我们最初设置的定义,即广义人工智能。从数据监测、采集、分析、应用、辅助诊断到电脑医生,各个类型的公司都在其中。



4.1 82家美国公司


首先来看美国公司。整体上,82家美国公司分成了7大类,分别是医疗影像类、健康管理类、医疗服务类、机构信息化、药企研发类、医疗大数据以及基因检测。当然这是个很粗的分类,每种公司的类型和归属并不是那么清晰。分类只是帮助我们认识,有哪些角度可以成为人工智能探索的切入点。以下来逐一分析:






医学影像类:美国公司在影像领域主要也是基于人工智能、深度学习的技术,帮助医生更快更准确的读取病人的影像数据,以更好的做出诊断。CBInsights的判断,这个领域的创业公司正越来越多。2015年以来,已经有17家公司完成首轮融资。这至少说明,影像分析这个事儿是被美国投资者认可的。


健康管理类:这里主要把对个人的健康管理和以个人用户为主的可穿戴设备,都归入其中。这类公司主要是根据用户个人的健康数据来预测疾病风险、提供健康管理方案。总体看,这类公司在美国也并没有出现什么新的花样。不过,这倒是在医疗人工智能领域少有的直接to C的服务。


医疗服务类:这在医疗服务方面应用人工智能的尝试是最多的。这类公司包括两类,一类是由医生提供在线的咨询服务或机器版的手机医生;另一类就是通常所理解的临床诊断辅助系统,包括早期筛查、诊断、康复,手术风险监测,用药安全等,而且会分不同领域,比如血液、睡眠、神经、心理等。


机构信息化:这类公司主要是通过数据监测和分析的方式,帮助医疗机构提升运营效率和诊疗效果,降低支出成本。美国的医疗机构市场化占主导,而且商业保险公司发育比较充分,这些因素也促使医疗机构更加注重效率和成本的,为机构信息化类的创业公司提供了市场空间。


药企研发类:新药研发的需求特别明确,就是解决成本高、周期长的问题。有研究显示,一种新药研发的成本已经接近26亿美元,平均需要10-15年的时间。瞄准这个痛点的创业公司,就是希望通过应用大数据和人工智能的技术,来帮助药企缩短研发周期、减低成本。






医疗大数据:这个分类相对比较模糊,因为实际上其他几个类型都离不开医疗大数据。不过,这类公司相比而言更加注重数据本身的研究和分析。比如鼎鼎大名的Flatiron,就是搭建肿瘤大数据平台、累计肿瘤患者数据,并通过对数据的研发和分析服务临床、科研、新药以及患者治疗。


基因测序:基因测序公司这里列举的比较少。这类公司有点“跨界”的性质。基因测序实际上是人体本身的数据化,并通过对这些数据的分析提供精准治疗。但基因测序的数据由于与通常的医疗大数据含义不一样。但也可以理解,未来人工智能和精准医疗在基因测序这个环节上,也许是连通的。


总体来看,美国创业公司主要面向药企、医疗机构等B端提供服务。而且,这些服务仍然主要是在辅助诊断系统、大数据挖掘等方面,可见美国整体上在人工智能上的探索进展也比较有限。



4.2 63家中国公司


与美国公司类似,中国公司的大体分类也包括医疗大数据、机构信息化、医疗医保类、医学影响类、医药研发类、健康管理类和基因测序了。这61家公司仅是统计到的部分创业公司,也欢迎各相关领域的创业公司主动与我们联系寻求报道(liuyong@36kr.com)。






同美国公司相比,中国公司大体上呈现了这么几个特点:智能化程度不够高,不少医疗类的项目主要还是在线咨询服务;to C类产品仍然占据大多数,B端服务开发不足;医疗机构信息化领域比较活跃,主要是解决机构信息互联互通的问题。


对比美国的公司,中国在医疗人工智能上还有哪些成长的空间:


首先是辅助诊断系统,应用人工智能为医生诊断提供帮助,提高效率和准确性。中国公司目前与医疗机构打交道更多仍然是获取医疗资源,提供简单的在线咨询服务。但这种对互联网的应用方式,已经显得普及化、大众化,渐渐失去了商业价值。


第二是服务医药器械企业,降低药品和器械的研发成本、缩短研发周期。实际上,中国公司不缺乏服务药企的的项目,但大多数仅仅是应用互联网做药品营销。虽然这也是一个赚钱的业务,但相比直接服务新药研发,仍然显得技术含量不足。


第三是医学影像,这里包括普通的影像,也包括病理、放疗涉及到“读片”的大影像概念。IBM收购Merge表明,读懂影像类数据对人工智能的发展是有价值的。而且美国过去一年的投资记录也可以看到,美国投资人对影像类人工智能的应用也比较看好。


总体上,中国公司在医疗人工智能方面的探索仍然逊色于美国。但这也许是多种因素作用的结果。而中国因为人口庞大而在医疗大数据上的巨大优势,还没有充分发挥出来。或许,在瓶颈突破之后,赶超美国公司只是时间问题。



Part.5 医疗人工智能的条件具备了吗?


前面我们说到,人工智能现在的火爆有点像当年的O2O。但如果细想这个问题,O2O可以一哄而上,人工智能也能一哄而上吗?恐怕很难,尤其是在医疗领域。人工智能的门槛显然比O2O高多了。不过,真正让很多人们对医疗人工智能望而却步的,却并不是技术问题这么简单,而是“坑”太多。



5.1 坑One:训练机器人的医疗数据从哪里来?或者更准确的说,是怎么来?


无论故事怎么讲,最庞大的医疗数据储存地必然是医疗机构。但这种涉及到患者隐私的高度敏感的问题,也必然是政策高度管制的地带。政府政策的态度就显得至关重要。


美国政府的态度还是很明确,对于医疗信息的商业化应用必须严格符合HIPAA和HITECH两个法案的规定。所以,很多医疗信息化的创业公司都会在自己的介绍中加上这么一个词儿“HIPAA-Compliant”。要想成为“HIPAA-Compliant”企业,就必须在physical和technical上符合HIPAA的要求。说白了,就是未经授权,无论是物理手段还是技术手段,都不能接触医疗信息。






到中国是什么情况?2016年6月,国务院办公厅公布了《关于促进和规范健康医疗大数据应用发展的指导意见》。这份写了一年半的指导意见,也成为我国医疗大数据应用纲领性文件。


文件发布后,国家卫计委的官方媒体《健康报》组织专家做了解读并专文刊登。其中一段话特别有趣:专家表示,健康医疗大数据既不能简单说是谁的,也不能简单说不是谁的,首先要客观理性看待我们的基础。目前,我国的公民隐私保护、个人信息保护、数据保护还没有法律支持。定位它是国家重要的基础性战略资源,回避了未来要做权属分割的问题,重点放在规范和应用上,有利于行业的发展和创新。


这段话的背景是,医疗信息的归属问题一直是我国行业内热议的问题。国务院的指导意见第一句话就指出:健康医疗大数据是国家重要的基础性战略资源。如果按照“专家们”的意思,国家这个表态就是说,归属问题不要再争了,关键是好好想想怎么用。


但不管怎么用,医疗数据都存在医疗机构里面。医疗机构对医疗信息的态度就变得非常重要。然而,刚刚颁行不久《深圳经济特区医疗条例》第五十条规定了,医疗机构向患者开放全部病历。如果未来能够在更大范围推广,将极有可能改变当年医疗信息应用的格局。



5.2 坑Two:医疗问题太过复杂!


总体上来讲,医疗是个有限集合。因为基本上普通病、常见病的种类、症状以及检测的指标等,数量和范围都是比较明确的。理想状况下,可以像AlphaGo一样算清所有变化。但问题是,医疗因为是发生在人身上的事情,就让这个问题复杂了许多。


直观上讲,同种疾病会有不同症状,同种症状会对应不同疾病,在疾病的症状与结果之间没有确定的对应关系,不同疾病之间也没有清晰的边界,而且还会存在同时发病的情况。这种情况,就让很多依靠知识库建立在“if-then”逻辑上的智能问诊应用面临很大问题,起码可应用的范围就会大大缩小。


进一步分析,疾病的治疗过程是不可逆的,这就是它与AlphaGo下棋完全不是一回事;究竟是哪些因素导致的疾病,并不是所有的信息都是清楚的;正因为病因上不够清楚,以及医学本身的有限性,造成了疾病的治疗结果不稳定性。


正是因为医疗如此复杂,造成了过去五十年对这个问题的研究迟迟没有突破。而这些问题还是在第一环节诊断上,到后面的治疗环节就会遇到当前互联网医疗在商业化方面的各种问题,比如与医院、医生、药店建立怎样的商业生态。当然还有一个最重要的问题是,就算你的应用真的很牛逼,如何让你的用户用起来,以及如何获得用户都是相当艰巨的问题。



5.3 坑three:工作量巨大无比


IBM在连花了40亿美金之后,骄傲的宣布自己已经拥有1亿份患者病历,3000万份影像数据以及2亿份保险记录,数据总量超过60万TB,覆盖人数约3亿。Google抱上了NHS的大腿,获得了160万患者的健康数据。但这些,在中国每年80亿就诊人次面前,简直是沧海一粟。






医疗人工智能的核心就是医疗数据,从这个角度出发,中国公司简直是幸福得“鼻涕冒泡”。但因为医疗数据基本都是以自然语言形态存在的,所以其实真正重要的环节是数据的结构化。这一步的工作量就将巨大无比。


但工作还远没有结束。就像不同专科的医生,拥有不同的知识结构一样,不同疾病的数据也需要不同的算法模型。这也就是为什么,我们看到的绝大多数在人工智能领域探索的医疗创业公司,包括Watson在内,都只能选择少数几个单病种。即使是机器,也没法一口就吃成胖子。


巨大的工作量起码意味着两件事情:人力和时间。对于创业公司来讲,完成前期的工作需要投入人力;而且完成每一个病种机器的训练都需要比较多的时间。这都意味着大量资金的投入。虽然我们都相信机器取代人类将是必然趋势,但这件事究竟在多久以后发生没人知道。也就是说,究竟有多少人愿意在这里面烧钱就很成问题。




Part.6 总结和讨论



6.1 一些总结


首先,由于医疗资源的短缺以及成本支出的快速增加,对医疗人工智能存在着切实的需求。但至少美国在医疗人工智能领域将近五十年的探索后,尚没有取得明显突破。所谓人工智能,大多数主要是临床辅助决策系统。而且,临床辅助决策系统究竟能够改善医疗效果,还存在争议。


IBM持续在Watson上烧钱,推动了它的明显进步,并在亚洲地区的中国、印度、东南亚等地应用推广上取得了不小的进展。但包括IBM、Google这些巨头也都仅仅是医疗人工智能的入门级水平,大量创业公司仍然存在巨大的商业机会。


但从中国的创业现状来看,智能水平普遍比较低,而且在面向机构的服务方面也比较欠缺,未来这些领域都会有比较大的成长空间。不过,在医疗人工智能领域,医疗数据的获取和结构化、医疗问题本身的巨大复杂性以及医疗人工智能在人力物力财力方面的巨大投入,都将成为这个领域的巨大挑战。



6.2 一些讨论


本文相对侧重于医疗人工智能实践路径的讨论,而对于之后的商业模式探寻不多。实际上,这两者应该是密不可分的。只有当医疗人工智能每个阶段的产品都有合适的应用时,这个领域才能够产生持续投入、持续产出的良性循环。


而从应用的角度看,究竟是从to B的角度切入,还是从to C的角度切入也有所不同。美国to B的应用比较多,而中国未来除了发展to B的应用外,能否在to C的应用上也有所突破?


另外还有一些相对比较宏观的问题,比如当下究竟是不是人工智能创业的最佳时机?虽然大家都在讨论,但这并不一定意味着时机合适。比如现在人工智能的成本是否一定低于人力成本,如果不够低,显然无法推开。比如在中国,当前医疗信息的互联互通还存在问题的情况下,医疗人工智能是否还为时太早?这些都是未来需要进一步探讨的问题。
 
 
 
 
文章来源于 36氪智造家平台提供 查看全部
6.0_.jpg

由于医疗资源的短缺以及成本支出的快速增加,医疗人工智能存在着切实的需求。但美国在医疗人工智能领域将近五十年的探索后,尚没有取得明显突破。

从中国的创业现状来看,智能水平普遍比较低,而且在面向机构的服务方面也比较欠缺,未来这些领域都会有比较大的成长空间。

但医疗数据的获取、医疗本身的复杂性和人力物力财力等方面的巨大投入,都将成为这个领域的巨大挑战。
 
医疗领域人工智能的应用,激发了人们对未来的许多想象。计算机的运算速度快、储存量大、质量稳定且不知疲倦,如果能够在医疗领域应用,必将能够大大提高医疗质量和供给量,并最终降低医疗成本。加上商业前景的光环,医疗人工智能的探索真可以说是“引无数英雄竞折腰”。


但梦想照进现实,总需要一条切实可行的路径。有人认为路径很清晰,用“医疗大数据+算法”来训练机器人,就可以实现人工智能,无非是积累和获取数据的问题。但有人认为路上的坑很多,因为医疗太复杂,未知太多,尤其还事关人命。


讨论和思考都在继续,行动也在全球范围内轰轰烈烈的开展起来。我在这份报告里梳理了145家中国和美国在人工智能大方向上的创业公司,他们中的很多已经受到投资人的热捧。不仅如此,IBM和Google这样的巨头也都涉足医疗人工智能。尤其是IBM的Watson,更是已经在全球范围内的医疗机构当中付诸应用。


真正的重点是,这些先行者的实践究竟具有哪些更普世的价值。他们已经探索和尚未探索的领域中,究竟还埋藏着哪些机会。尤其是,那些若隐若现的坑究竟又在哪里,克服困境的方法已经找到了么?毕竟,在过去五十年有关医疗人工智能的探索都收效甚微的背景下,今天的创业者究竟可能面对怎样的未来?


于是,我在这篇文章里对医疗人工智能做了一个系统的分析,重点希望解决这样几个问题:
 
  • 现实医疗真的需要人工智能吗?又有多需要?
  • 关于医疗人工智能,已经做过什么,又做成了什么?
  • 在医疗人工智能当中,有多少不同类型的尝试?
  • 究竟人们口中的那些坑是什么?



医疗的创业创新正经历一个瓶颈。与其他领域的资本寒冬不同,医疗创业面临瓶颈的原因是这个领域本身门槛很高又太过复杂。在一个行业困境时唱衰它,只不过是哗众取宠、秀智商下限的行为。改变不是不可能,只是需要时间。所以,我一直保持着积极的心态,与这个行业里最坚持的创新者、投资人交流,期待能够在他们的思考中找到任何一个改变的可能。这也是我写本系列文章的由来。以下我们进入正题。

6.1_.PNG




Part.1 序章


1.1 关于医疗人工智能的讨论范围

人工智能火得烫手。前些天一个同事说他下午刚报道了一个人工智能方面的项目,当天吃晚饭的空里就有二十家投资机构上门要联系方式。这种火法让人依稀看到了曾经O2O的影子,但愿历史不要重演。同样,医疗领域在这股浪潮中也到了一种神魂颠倒的地步,“智能”二字几乎已经是每家公司产品的标配。可是,当我们在讨论人工智能的时候,我们究竟在讨论什么?


首先,我们来对医疗领域人工智能的应用做一个基本的设定:

①关于人工智能在医疗当中应用的终极想象,当然是电脑能够替代人来为患者诊断、治疗。这个理想并不是刚刚出现,至少可以追随到上世纪六七十年代。只不过实现起来,理想与现实的差距太大。

②比直接用电脑替代人来看病的难度略低一些的是临床决策辅助系统(Clinical decision support system,简称CDSS),这是目前尝试比较多、发展也相对比较快的领域。

③在实现人工智能的道路上,一个必备的条件是积累医疗大数据。所以,在人工智能创业领域的一个“近亲”,就是医疗大数据积累、挖掘和应用。也可以将其看做是实现人工智能的一个中间环节。

④向前再推进一步,就是获取数据的问题。从医疗机构获取数据是一个路径,而且无捷径可循;另外一个就是从患者端获取数据,特别是通过可穿戴硬件来获取患者的健康数据来实施健康管理。


从目前已经观察到的情况,有关人工智能在医疗领域探索大体有这么四种类型。如果单独讨论某一种类型,恐怕都不能完整的反应医疗领域人工智能的进展。所以,本文在讨论人工智能的过程中将采取最广义的概念,包含前述的四种类型。



1.2 医疗人工智能的现实需求


人工智能的火究竟是虚火而昙花一现,还是方兴未艾、志存高远。况且,医疗是否真的需要人工智能,还仅仅是跟风?有关这些问题,可以从以下几个方面来分析:


首先,医疗领域最突出的问题就是优质医疗资源不足。这个问题不止中国存在。美国这几年就经常爆出医生短缺的消息,最近还有预测说美国未来十年会短缺6到9万名内科医生。老龄化比较严重的日本也面临这个问题的困扰,每千人口中仅两人从医。就连每千人拥有4名医生的瑞士,近年也开始重视医生数量不足的问题。而医疗资源不足的问题,在我国还会因为分布不均而加剧。

6.2_.jpg


6.3_.jpg


再加上人口老龄化的加剧,未来对医生的需求量很有可能是有增无减。解决医生资源不足的问题,在增加供给量方面,培养医生需要周期;而调整结构则需要配套政策。或者简单的说,靠人来解决这个问题需要很长的时间,而且供给量也不是无限增加的。于是,人们开始寄希望于机器。因为一旦能够实现机器看病,供给量将会是无限增加。


解决医疗资源不足,恐怕是对人工智能的最根本需求和发展动力所在。而医疗领域面对的另外一个问题就是费用支出持续增加,财政支出和社会负担的压力越来越大。医疗负担上升是多种因素共同促成的结果,包括人口老龄化、慢性疾病增长、新技术的采用等。

6.4_.jpg



人工智能在解决成本压力方面被寄予厚望有几个方面的原因:一是通过人工智能提高患者自查自诊自我管理的比例,降低医疗支出;二是通过人工智能手段实现更早期发现、更好管理,减少后续的医疗费用支出;三是通过人工智能手段提高医疗机构、医生的工作效率,降低医疗成本;再有就是通过人工智能制定科学合理的健康医疗方案,减少不合理的医疗支出。


此外,还有一些虽然不是急性且刚性的需求,也提高了人们对人工智能的期待。比如机器的运算速度、准确程度、更新速度、稳定性都要好于人工。比如肿瘤领域的研究论文,2009年到2013年,全球共产生了16万份肿瘤相关的研究,平均每年3.2万份。而到了2015年,这个数字已经达到了4.4万份,平均每天就有超过120篇新的研究发表。显然,这已经远远超出人类认知能力的范围。


综合这些因素,人工智能在医疗领域的应用,不仅有可能解决医疗资源短缺、成本支出增加的困境,而且还有可能带来医疗能力、医疗体验上的提升。从这两个方面的需求来看,人工智能在医疗领域确实拥有相当广阔的成长空间。



Part.2 医疗人工智能的五十年现实


从现在面向未来,库兹韦尔曾做出过预测,人工智能的水平超过人类智力的水平将在2045年出现。20多年后,奇点就将来临的猜想让很多人觉得过于疯狂。实际上,人类对人工智能的想象,至少已经有80年。1936,阿兰.图灵就提供了机器模拟人类数学运算的构想。二十年后,达特茅斯会议将人工智能确定成为一门科学。人类由此开始有计划、有目标的朝人工智能的目标努力。


2.1 早期医疗人工智能的尝试


从1956年之后的二十年里,人类雄心勃勃。后来AlphaGo算法核心内容的雏形就在这个时期出现,即贝尔曼公式。而最早的一波在医疗领域进行人工智能探索的尝试,也在这个时期出现。1972年,由利兹大学研发的AAPHelp是资料记载当中,医疗领域最早出现的人工智能系统。这个系统基于贝叶斯理论开发,主要是用于腹部剧痛的辅助诊断以及手术的相关需求。


在随后的整个七十年代当中,又产生了不少新的成果。INTERNIST I 于1974年由匹兹堡大学研发问世,主要用于内科复杂疾病的辅助诊断。这套系统在当时被认为极具价值,并于80年代在其基础了开发了CADUCEUS和QMR系统,开始了商业化尝试。MYCIN于1976年有斯坦福大学研发,主要用于血液感染疾病的辅助诊断。


此外,还有罗格斯大学开发的CASNET/Glaucoma,MIT开发的PIP、ABEL,斯坦福大学开发的ONCOCIN等。而且上世纪80年代,已经有一些商业化应用系统的出现,比如前面提到的QMR(Quick Medical Reference),还有哈佛医学院开发的DXplain,主要是依据临床表现提供诊断方案。DXplain的知识库中,已经收录了2200种疾病,和5000多种症状。

6.5_.JPG




2.2 早期医疗人工智能尝试的局限性


事情并没有预期的那么顺利。在随后很长的一段时间里,人工智能在医疗领域当中的应用并没有取得特别明显的突破。人们所期待的机器替代人看病的场景并没有出现,反而越来越多的看到人工智能在医疗领域当中应用时的局限性。


在医疗服务当中,临床诊断是最为关键的环节。而对于临床医生来讲,只有当计算机能够达到“专家”的水平时,也许才会应用。但诊断的过程过于复杂,存在着大量的“变量”。即便是专家本人的诊断,亦有相当多的不确定因素。这样的话,对于人工智能的开发则需要理解专家从症状到做出诊断整个过程的逻辑,同时还需要将这种能力“教会”计算机。


再有,现在人们越来越多的认识到,要让医生愿意采用人工智能的系统,必须能够有效的将新系统合适地整合到医生原有的工作流当中。而且其实特别重要的一点是,需要让医生们相信,人工智能可以帮助他们改善临床效果、提升工作效率。但目前有关这一点,似乎并不是那么确定。


德国夏里特医院的学者曾经对辅助诊断系统在五年应用当中,针对抗生素滥用的效果进行了研究。结果显示,辅助诊断系统对抗生素滥用和临床诊疗的改善起到了不错的效果。


但也有不少研究的结论,则并不让人那么乐观。比如米兰大学在2014年的研究得出结论称,辅助诊断系统并没有明显对死亡率产生影响;而伦敦帝国学院的在2011年对过去13年数据的研究则显示,计算机在医疗领域的应用现实与理想状况差距很大,并且迄今为止,没有坚实的证据能够表明辅助诊断系统能够降低医疗成本并改善患者的治疗效果。


总的来说,医疗人工智能方面过往的大多数探索都并不成功。不过,这样的现状只能说明医疗的高度复杂性,并没有阻止人类在医疗领域探索人工智能的尝试。实际上,IBM研发的Watson机器人医生就在一路高歌猛进。除了技术本身的进步之外,Watson的实践本身还有怎样更重要的意义?



Part.3 Watson的意义


IBM在人工智能上的突破也不过是在最近十年当中取得的。1997年,“深蓝”战胜象棋大师卡斯帕罗夫之后的很长时间里,人工智能在辅助工作方面取得了很大的进展,比如处理繁琐的公司文件。但距离真正意义上的人工智能,相去甚远。以至于当挑战“Jeopardy!”的提议第一次出现在IBM的时候,甚至引来嘘声一片。


《纽约时报》记载过一个故事,2006年,IBM测试自己的最先进系统在“Jeopardy!”当中的表现。结果人类冠军答题的正确率是85-95%,而IBM系统的正确率却仅有15%,显得愚钝不堪(slow and dumb)。语言识别是当时人机对话的主要困难。然而仅5年之后,以IBM创始人托马斯.沃森命名的Watson机器人就在“Jeopardy!”当中击败了人类冠军。


这可以算是Watson“医生”的前传。很快,IBM就将Watson应用的重点转移到了医疗领域。

6.6_.jpg




3.1 Watson成长史


在这次突破之后,吸取了深蓝教训的IBM开始了将Watson推向商业化应用的尝试,而健康成为了他们确定的重点方向之一。那么IBM“训练”Watson的教学方法是怎样的?2014年1月份,Watson“自立门户”,并推出Watsonfoundation将认知计算技术与大数据分析技术结合起来,奠定了整个Watson运作的基本逻辑。而Watson在健康领域的推进则是从2014年底开始的。


首先是Watson先后与苹果、强生和美敦力三巨头建立的合作。Watson和苹果的合作包括两个层面,一个是基于Healthkit面向普通用户的数据采集和储存,另一个是基于Researchkit面向研究人员的数据分析;与强生的合作主要是在关节、脊柱术前和术后的患者护理,以及慢病管理;与美敦力的合作,主要是通过美敦力的医疗器械采集糖尿病患者的数据,并为他们提供个性化的管理方案。


第一步还只是合作,很快IBM就掏出了真金白银。2015年,IBM一举并购了两家医疗大数据公司Phytel和Explorys。Phytel公司主要是应用云工具,帮助临床医生为患者提供质量更好的医疗服务。而Explorys最初则是由克利夫兰诊所发起成立的公司,主要为医疗服务机构提供数据管理,服务全美360家医院,拥有超过5000万个患者的医疗记录。

6.7_.jpg


完成了这两家公司的并购后,IBM Watson Health正式成立。不过IBM的并购却并没有就此结束,2015年8月,IBM斥资10亿美元收购医疗影像数据公司Merge Healthcare;2016年2月,IBM又花了26亿美元收购了健康大数据公司Truven Health Analytics。


Merge是美国的一家老牌医疗影像公司,用户包括7500多家医院、科研机构、药企等。并购完成之后,Watson还将应用Merge的技术分析已经储存的超过三千亿个医疗影像数据。Truven Health Analytics服务超过8500个用户,拥有超过2亿名患者的诊断和医疗支出的数据。


到这时为止,IBM在不到一年的时间里在并购上投入了40亿美元,给Watson补充不同类型的数据和分析技术。投入之大,足见Watson的“饥渴”。

6.8_.JPG




3.2 Watson商业化


现在Watson已经相当强大,能够读懂非结构化数据,而且能够在15秒内阅读完成4千万份文件。Watson需要商业化,只掏钱肯定是不行的,要赚钱就要尽可能扩大应用的范围。而从IBM的应用推广来看,除了在他们的北美大本营之外,Watson在亚洲的应用推广进展非常好,在中国和印度两个人口大国都有所斩获。


2014年10月,IBM宣布与东南亚地区最大的私立医院康民国际医院达成合作,Watson将为康民医院位于曼谷的医疗中心和其他16个国家的转诊办公室提供服务。


2015年5月,在Watson Health成立后不久,IBM就宣布,14家美国和加拿大的肿瘤医院将引进Watson,通过患者的基因测序数据来提供适当的治疗方案。


2015年12月,IBM宣布与印度的第三大医院Manipal Hospitals达成合作,Watson将帮助肿瘤医生为患者提供诊断和治疗。每年,有超过20万肿瘤患者在Manipal Hospitals医院接受治疗。


2016年8月,Watson落地中国,与中山大学附属肿瘤防治中心、中国医科大学附属第四医院、浙江省中医院、复旦大学附属肿瘤医院等21家医院达成合作。杭州认知网络是Watson在中国的本地服务商。


此外,Watson在医疗领域还与Talkspace、Welltok、hc1等新兴的移动医疗公司建立了合作。Watson将基于这些应用的数据采集,来为他们的用户提供相应的医疗服务。

6.9_.jpg




3.3 “学以致用”的Watson


总结起来,IBM Watson的整个发展历程可以概括为“学以致用”。


在Watson发展早期,IBM豪掷亿金接连并购4家拥有医疗大数据的公司。而在此之前,Watson的“早教”阶段,IBM也是一直抱着梅奥诊所、MD安德森、纪念斯隆—凯特林癌症研究中心、纽约基因组研究中心等美国几家王牌医疗机构的大腿。


这个思路也被Google的DeepMind延续了下来。今年六月的信息,DeepMind与NHS达成了合作,能够获取超过160万患者的医疗健康数据。而很快就有类似MedConfidential这样的组织质疑Google获取患者数据的正当性。


相比于学,用的部分同样重要。尤其是让医生相信人工智能的作用并在实践当中应用,这个过程仍然需要大量的市场教育。而从IBM的策略中也可以看出,选择肿瘤这种刚需又优质医生短缺的领域是其重点方向。Manipal Hospitals的CEO Dr. Ajay Bakshi谈到,在印度平均每位肿瘤医生要服务1600名肿瘤患者,而且随着肿瘤发生率的上升,这种短缺还将加剧。另外,在中国市场,IBM也很明智的选择了本土的运营商来做市场开拓。


但Watson也并非没有问题。Watson主要解决的是肿瘤领域的疾病,尤其是肺癌、乳腺癌、结肠癌等。这几种癌症虽然日渐高发,但究竟Watson会有多大的用武之地是存在疑问的。除非Watson能够成为诊疗路径的一部分,但这恐怕又是难上加难。



Part.4 82家美国公司和63家中国公司


尽管Watson和DeepMind有IBM和Google这样的强大靠山,但他们在医疗领域也仅仅是入门级。众多医疗创业公司还有巨大的成长空间。本节,我们对中美两国在人工智能领域的创业公司做了一个基本梳理。其中,包括美国的82家公司,中国的63家公司。美国公司的数据主要参考了CBinsights的整理,而中国公司的数据则主要来自公开报道。


对这些公司的梳理首先遵循了我们最初设置的定义,即广义人工智能。从数据监测、采集、分析、应用、辅助诊断到电脑医生,各个类型的公司都在其中。



4.1 82家美国公司


首先来看美国公司。整体上,82家美国公司分成了7大类,分别是医疗影像类、健康管理类、医疗服务类、机构信息化、药企研发类、医疗大数据以及基因检测。当然这是个很粗的分类,每种公司的类型和归属并不是那么清晰。分类只是帮助我们认识,有哪些角度可以成为人工智能探索的切入点。以下来逐一分析:

6.10_.jpg


医学影像类:美国公司在影像领域主要也是基于人工智能、深度学习的技术,帮助医生更快更准确的读取病人的影像数据,以更好的做出诊断。CBInsights的判断,这个领域的创业公司正越来越多。2015年以来,已经有17家公司完成首轮融资。这至少说明,影像分析这个事儿是被美国投资者认可的。


健康管理类:这里主要把对个人的健康管理和以个人用户为主的可穿戴设备,都归入其中。这类公司主要是根据用户个人的健康数据来预测疾病风险、提供健康管理方案。总体看,这类公司在美国也并没有出现什么新的花样。不过,这倒是在医疗人工智能领域少有的直接to C的服务。


医疗服务类:这在医疗服务方面应用人工智能的尝试是最多的。这类公司包括两类,一类是由医生提供在线的咨询服务或机器版的手机医生;另一类就是通常所理解的临床诊断辅助系统,包括早期筛查、诊断、康复,手术风险监测,用药安全等,而且会分不同领域,比如血液、睡眠、神经、心理等。


机构信息化:这类公司主要是通过数据监测和分析的方式,帮助医疗机构提升运营效率和诊疗效果,降低支出成本。美国的医疗机构市场化占主导,而且商业保险公司发育比较充分,这些因素也促使医疗机构更加注重效率和成本的,为机构信息化类的创业公司提供了市场空间。


药企研发类:新药研发的需求特别明确,就是解决成本高、周期长的问题。有研究显示,一种新药研发的成本已经接近26亿美元,平均需要10-15年的时间。瞄准这个痛点的创业公司,就是希望通过应用大数据和人工智能的技术,来帮助药企缩短研发周期、减低成本。

6.15_.jpg


医疗大数据:这个分类相对比较模糊,因为实际上其他几个类型都离不开医疗大数据。不过,这类公司相比而言更加注重数据本身的研究和分析。比如鼎鼎大名的Flatiron,就是搭建肿瘤大数据平台、累计肿瘤患者数据,并通过对数据的研发和分析服务临床、科研、新药以及患者治疗。


基因测序:基因测序公司这里列举的比较少。这类公司有点“跨界”的性质。基因测序实际上是人体本身的数据化,并通过对这些数据的分析提供精准治疗。但基因测序的数据由于与通常的医疗大数据含义不一样。但也可以理解,未来人工智能和精准医疗在基因测序这个环节上,也许是连通的。


总体来看,美国创业公司主要面向药企、医疗机构等B端提供服务。而且,这些服务仍然主要是在辅助诊断系统、大数据挖掘等方面,可见美国整体上在人工智能上的探索进展也比较有限。



4.2 63家中国公司


与美国公司类似,中国公司的大体分类也包括医疗大数据、机构信息化、医疗医保类、医学影响类、医药研发类、健康管理类和基因测序了。这61家公司仅是统计到的部分创业公司,也欢迎各相关领域的创业公司主动与我们联系寻求报道(liuyong@36kr.com)。

6.11_.jpg


同美国公司相比,中国公司大体上呈现了这么几个特点:智能化程度不够高,不少医疗类的项目主要还是在线咨询服务;to C类产品仍然占据大多数,B端服务开发不足;医疗机构信息化领域比较活跃,主要是解决机构信息互联互通的问题。


对比美国的公司,中国在医疗人工智能上还有哪些成长的空间:


首先是辅助诊断系统,应用人工智能为医生诊断提供帮助,提高效率和准确性。中国公司目前与医疗机构打交道更多仍然是获取医疗资源,提供简单的在线咨询服务。但这种对互联网的应用方式,已经显得普及化、大众化,渐渐失去了商业价值。


第二是服务医药器械企业,降低药品和器械的研发成本、缩短研发周期。实际上,中国公司不缺乏服务药企的的项目,但大多数仅仅是应用互联网做药品营销。虽然这也是一个赚钱的业务,但相比直接服务新药研发,仍然显得技术含量不足。


第三是医学影像,这里包括普通的影像,也包括病理、放疗涉及到“读片”的大影像概念。IBM收购Merge表明,读懂影像类数据对人工智能的发展是有价值的。而且美国过去一年的投资记录也可以看到,美国投资人对影像类人工智能的应用也比较看好。


总体上,中国公司在医疗人工智能方面的探索仍然逊色于美国。但这也许是多种因素作用的结果。而中国因为人口庞大而在医疗大数据上的巨大优势,还没有充分发挥出来。或许,在瓶颈突破之后,赶超美国公司只是时间问题。



Part.5 医疗人工智能的条件具备了吗?


前面我们说到,人工智能现在的火爆有点像当年的O2O。但如果细想这个问题,O2O可以一哄而上,人工智能也能一哄而上吗?恐怕很难,尤其是在医疗领域。人工智能的门槛显然比O2O高多了。不过,真正让很多人们对医疗人工智能望而却步的,却并不是技术问题这么简单,而是“坑”太多。



5.1 坑One:训练机器人的医疗数据从哪里来?或者更准确的说,是怎么来?


无论故事怎么讲,最庞大的医疗数据储存地必然是医疗机构。但这种涉及到患者隐私的高度敏感的问题,也必然是政策高度管制的地带。政府政策的态度就显得至关重要。


美国政府的态度还是很明确,对于医疗信息的商业化应用必须严格符合HIPAA和HITECH两个法案的规定。所以,很多医疗信息化的创业公司都会在自己的介绍中加上这么一个词儿“HIPAA-Compliant”。要想成为“HIPAA-Compliant”企业,就必须在physical和technical上符合HIPAA的要求。说白了,就是未经授权,无论是物理手段还是技术手段,都不能接触医疗信息。

6.12_.JPG


到中国是什么情况?2016年6月,国务院办公厅公布了《关于促进和规范健康医疗大数据应用发展的指导意见》。这份写了一年半的指导意见,也成为我国医疗大数据应用纲领性文件。


文件发布后,国家卫计委的官方媒体《健康报》组织专家做了解读并专文刊登。其中一段话特别有趣:专家表示,健康医疗大数据既不能简单说是谁的,也不能简单说不是谁的,首先要客观理性看待我们的基础。目前,我国的公民隐私保护、个人信息保护、数据保护还没有法律支持。定位它是国家重要的基础性战略资源,回避了未来要做权属分割的问题,重点放在规范和应用上,有利于行业的发展和创新。


这段话的背景是,医疗信息的归属问题一直是我国行业内热议的问题。国务院的指导意见第一句话就指出:健康医疗大数据是国家重要的基础性战略资源。如果按照“专家们”的意思,国家这个表态就是说,归属问题不要再争了,关键是好好想想怎么用。


但不管怎么用,医疗数据都存在医疗机构里面。医疗机构对医疗信息的态度就变得非常重要。然而,刚刚颁行不久《深圳经济特区医疗条例》第五十条规定了,医疗机构向患者开放全部病历。如果未来能够在更大范围推广,将极有可能改变当年医疗信息应用的格局。



5.2 坑Two:医疗问题太过复杂!


总体上来讲,医疗是个有限集合。因为基本上普通病、常见病的种类、症状以及检测的指标等,数量和范围都是比较明确的。理想状况下,可以像AlphaGo一样算清所有变化。但问题是,医疗因为是发生在人身上的事情,就让这个问题复杂了许多。


直观上讲,同种疾病会有不同症状,同种症状会对应不同疾病,在疾病的症状与结果之间没有确定的对应关系,不同疾病之间也没有清晰的边界,而且还会存在同时发病的情况。这种情况,就让很多依靠知识库建立在“if-then”逻辑上的智能问诊应用面临很大问题,起码可应用的范围就会大大缩小。


进一步分析,疾病的治疗过程是不可逆的,这就是它与AlphaGo下棋完全不是一回事;究竟是哪些因素导致的疾病,并不是所有的信息都是清楚的;正因为病因上不够清楚,以及医学本身的有限性,造成了疾病的治疗结果不稳定性。


正是因为医疗如此复杂,造成了过去五十年对这个问题的研究迟迟没有突破。而这些问题还是在第一环节诊断上,到后面的治疗环节就会遇到当前互联网医疗在商业化方面的各种问题,比如与医院、医生、药店建立怎样的商业生态。当然还有一个最重要的问题是,就算你的应用真的很牛逼,如何让你的用户用起来,以及如何获得用户都是相当艰巨的问题。



5.3 坑three:工作量巨大无比


IBM在连花了40亿美金之后,骄傲的宣布自己已经拥有1亿份患者病历,3000万份影像数据以及2亿份保险记录,数据总量超过60万TB,覆盖人数约3亿。Google抱上了NHS的大腿,获得了160万患者的健康数据。但这些,在中国每年80亿就诊人次面前,简直是沧海一粟。

6.13_.jpg


医疗人工智能的核心就是医疗数据,从这个角度出发,中国公司简直是幸福得“鼻涕冒泡”。但因为医疗数据基本都是以自然语言形态存在的,所以其实真正重要的环节是数据的结构化。这一步的工作量就将巨大无比。


但工作还远没有结束。就像不同专科的医生,拥有不同的知识结构一样,不同疾病的数据也需要不同的算法模型。这也就是为什么,我们看到的绝大多数在人工智能领域探索的医疗创业公司,包括Watson在内,都只能选择少数几个单病种。即使是机器,也没法一口就吃成胖子。


巨大的工作量起码意味着两件事情:人力和时间。对于创业公司来讲,完成前期的工作需要投入人力;而且完成每一个病种机器的训练都需要比较多的时间。这都意味着大量资金的投入。虽然我们都相信机器取代人类将是必然趋势,但这件事究竟在多久以后发生没人知道。也就是说,究竟有多少人愿意在这里面烧钱就很成问题。




Part.6 总结和讨论



6.1 一些总结


首先,由于医疗资源的短缺以及成本支出的快速增加,对医疗人工智能存在着切实的需求。但至少美国在医疗人工智能领域将近五十年的探索后,尚没有取得明显突破。所谓人工智能,大多数主要是临床辅助决策系统。而且,临床辅助决策系统究竟能够改善医疗效果,还存在争议。


IBM持续在Watson上烧钱,推动了它的明显进步,并在亚洲地区的中国、印度、东南亚等地应用推广上取得了不小的进展。但包括IBM、Google这些巨头也都仅仅是医疗人工智能的入门级水平,大量创业公司仍然存在巨大的商业机会。


但从中国的创业现状来看,智能水平普遍比较低,而且在面向机构的服务方面也比较欠缺,未来这些领域都会有比较大的成长空间。不过,在医疗人工智能领域,医疗数据的获取和结构化、医疗问题本身的巨大复杂性以及医疗人工智能在人力物力财力方面的巨大投入,都将成为这个领域的巨大挑战。



6.2 一些讨论


本文相对侧重于医疗人工智能实践路径的讨论,而对于之后的商业模式探寻不多。实际上,这两者应该是密不可分的。只有当医疗人工智能每个阶段的产品都有合适的应用时,这个领域才能够产生持续投入、持续产出的良性循环。


而从应用的角度看,究竟是从to B的角度切入,还是从to C的角度切入也有所不同。美国to B的应用比较多,而中国未来除了发展to B的应用外,能否在to C的应用上也有所突破?


另外还有一些相对比较宏观的问题,比如当下究竟是不是人工智能创业的最佳时机?虽然大家都在讨论,但这并不一定意味着时机合适。比如现在人工智能的成本是否一定低于人力成本,如果不够低,显然无法推开。比如在中国,当前医疗信息的互联互通还存在问题的情况下,医疗人工智能是否还为时太早?这些都是未来需要进一步探讨的问题。
 
 
 
 
  • 文章来源于 36氪
  • 智造家平台提供