中国或成医疗AI最大市场，谁能成就医学界ImageNet？

2017-04-01 10:39　出处：互联网　人气：　评论（）

给据邮件跟踪查询系统完美国际残云岛任务万里归乡奇闻录万维一体穿透力万象破解王万宇豪个人资料王牌兽魂师王文沧简历王者琦琦王紫潼整容网通传奇yeqm 网文快捕背影家园

主页（http://www.cnwulian.net）：中国或成医疗AI最大市场，谁能成就医学界ImageNet？

【编者按】人工智能技术的发展，给垂直产业带来巨大变革，以医疗、无人车、安防、金融等垂直行业的变化最受到关注，多位知名投资人都强调现在真正能落地的就是AI在垂直行业的应用，可谓“不垂直，不快乐”。但是AI虽火，人的价值中存在批判性思维：医疗AI最有前途的技术是否是深度学习？是什么样的技术要诊断22542个ICD10疾病？谁能成就医学界的ImageNet？

本文转自“新智元”，作者：零星；经亿欧编辑，供业内人士阅读。

本文综合了会场演讲、论坛和新智元对斯坦福医疗AI专家邢磊的专访内容，让我们破除迷信，跟随AI技术大牛和医疗行业大拿一起揭开中国医疗AI之现状。

强化深度学习：医疗AI最有前途的技术？

自从2012年深度学习技术被引入到图像识别数据集ImageNet(做为测试标准)，其识别率近年屡创新高，并且在某些领域如图像分类等方面达到人类水平。深度学习技术加上医疗影像领域累积多年的数据，给这一领域带来了令人惊喜的突破。

新智元曾经报道过斯坦福的研究人员发布在Nature上的研究，CNN做皮肤癌诊断，与21位皮肤科医生对比测试，结果系统的精确度与人类医生相当（“至少”91%）。还有JAMA上发布的利用CNN对糖尿病视网膜病变的诊断，结果表明，其算法的性能与眼科医生的性能一致。

CNN在医学上的应用可谓在顶级刊物上连放大招，那么深度学习技术是医学影像领域效果最好的技术吗？

斯坦福大学邢磊教授告诉新智元：深度学习及强化深度学习，代表目前新潮的技术，它们能解决很多以前不能解决的问题，把医疗AI推向新的高潮。

强化深度学习在2016年初AlphaGo对战李世乭中大放异彩。AlphaGo学习棋谱到了一定程度，就可在和对手及自己对弈的大量棋局中，使用强化学习来进一步改善它，这可以说是它不断超越自己，最终战胜人类冠军的关键所在。作为一种有效的机器学习方法，强化学习主要研究在特定情境或环境下的操作方式，使得奖励信号最大化。同样在医疗AI的决策过程中，一个程序操作会常会影响其接收到的数据，不同的操作中程序会接受到不同的输入信息。强化学习可找出决策或操作的最优方案，以获得最大的奖励。

邢磊博士介绍，其实在深度学习之前，大约在90年代，就已有很多人做计算机辅助诊断（CAD）。之前神经网络做不深，现在有了新型计算机和深度学习之后，可以实现很深的网络。但是就以皮肤癌的诊断为例，目前在临床上还没有真正意义上的大规模的应用。基于深度学习的诊断尚处于研发阶段。但以现在的研发速度来看，这些新技术离临床应用已经并不十分遥远了。

另外，深度学习并不是在所有场景下都需要。这跟具体遇到的问题有关，有时候一般的机器学习技术已经够用。新的算法可以说是层出不穷，日新月异。把不同的算法结合起来也是AI的领域常用的方法。

动态不确定因果图：诊断各种疾病

人工智能不止是深度学习，也不止是大数据，张勤教授深以为然。他通过多年研究，提出了一套动态不确定因果图DUCG（DynamicUncertain Causality Graph）理论，用于因果知识的图形表达和推理。DUCG克服了贝叶斯网络的简洁表达和推理模型只适用于单赋值情况，不适用于多赋值和逻辑循环等情况的问题。

张勤教授创立动态不确定因果图的本意是为了解决核电站的在线故障诊断，因为核电故障数据极少，诊断要求高（要诊断从未出现过的故障），必须充分利用领域专家知识才行。核电站有数千甚至数万个实时动态信号，故障发展迅速，要求DUCG能够在秒级对众多信号（其中可能存在虚假信号）进行动态推理，高效准确地诊断故障，为提升核电站的安全性和经济效益提供智能技术支持。他的团队迄今已取得上百起故障诊断实验100%的成功率，无一失手。现已用于核电站和卫星系统的故障监测和诊断。

那么DUCG能否用于医疗诊断呢？

张勤团队首先与医学专家合作，针对各类疾病建立DUCG医学知识库（并不是机器从数据里面自动学出知识，而是医生用图形语言在机器中表达自己的知识，并由机器自动合成知识库。）张勤认为，宏观世界（微米以上尺度）万物皆因果，例如上呼吸道感染可能导致咳嗽、头痛等，这就是具有不确定性的因果知识。他们用103张因果子图合成一个知识库，包含各种风险因素、病史、症状、体征、影像学检查和实验室检查、以及各种逻辑组合和无条件或有条件因果关系及不确定性参数，与DUCG推理机相结合，进行疾病诊断。

他们这套系统跟某医院合作诊断某类疾病，样本集中有近4000个病例，涉及27种病，按照每种病不超过10个病例随机抽出203个病例进行测试，最后结果正确率99.01%，只有两个病例因记录不完整而不正确。张勤的团队还做过眩晕疾病的DUCG诊断，也达到了远高于国际同行的正确率。目前正在开展晕厥和胸痛疾病的智能诊断知识库开发。

张勤团队正在进一步开发这套系统使之不仅能帮助医生诊断，而且能启发医生知道下一步做什么检查最有价值，而不是盲目检查，增加医保和病人的负担。这套系统还可用于医院分诊，也就是根据病人自述和分诊师了解到的信息计算并排序选择优先就诊的科室或可能需要的会诊科室。

张勤还表示，重要的是智能诊断系统不仅能告诉病人或医生是什么病，还要告诉为什么是这个病，因为做决策并承担责任的是医生，不是智能系统，至少在目前的情况下是如此。最后他认为，医疗数据并不是只要多就好，数据质量高才行。

下一个挑战：谁能成就医学界的ImageNet？

医疗AI的技术远不止深度学习、机器学习、动态不确定图等，此外医疗AI中也面临着很多挑战。

全维度数据：基因+蛋白+病理+影像+临床+随访

对于普通的图像研究者，ImageNet提供了1000万张意义上的图片供训练。但是医学数据非常大，对于医学影像诊断的模型，目前并没有一个权威的公开数据集。根据斯坦福邢磊博士所说，数据库也是有一些，但是并不全，并不足够大。比如乳腺癌有数据集算比较多的，但是没有大到几十万个病例。研究人员有时候需要自己采集数据，很多时候可能就只有用几百个数据来训练模型。

邢磊博士也提出，很难确定多大的数据是大数据，毕竟数据量并不是越大越好，有时候可能有限的病人数据就足够了，这与具体情况和问题及数据的质量有关。

分享给小伙伴们：

本文标签：

物联网资讯

智慧城市

智能建筑

智能家居

智能医疗

智能交通

智能电网

智能物流

中国或成医疗AI最大市场，谁能成就医学界ImageNet？

更多文章

相关文章