主页(http://www.cnwulian.net):北京启动医疗AI评测,筑牢安全底线
为规范医疗人工智能应用发展,筑牢安全底线,北京市卫生健康委员会于近日正式启动医疗领域人工智能应用评测服务。根据11月7日发布的《关于开展医疗领域人工智能应用评测工作的通知》,北京市卫健委将依托新设立的医疗人工智能应用评测中心,为相关企业和研究机构提供专业评测,这标志着北京市在推动医疗AI规范应用与安全发展方面迈出关键一步。
近年来,人工智能技术在医疗领域的应用日益广泛,正逐步承担起辅助医生、优化诊疗流程的角色。然而,技术的快速迭代也带来了如何确保其规范性、安全性与有效性的现实挑战。坚持科技为民、科技向善,已成为公众与行业的共同关切。在此背景下,北京市卫健委在国家人工智能应用中试基地的建设框架下,专门成立了医疗人工智能应用评测中心,旨在系统性构建医疗AI的评测制度与标准体系。
据悉,此次启动的评测服务是该国家基地首次对外提供专项评测,当前阶段将主要聚焦于胸外科诊疗领域。评测中心的核心任务在于验证医疗AI产品的临床辅助决策能力与实际效果,以期在坚守安全底线的前提下,助力产品持续迭代优化。
为确保评测的全面性与科学性,评测中心构建了一套涵盖六个核心维度的综合评测指标体系。这六大维度包括医学合规伦理、医学循证与知识、通用辅助能力、专科诊疗质控管理、诊疗流程适配性以及诊疗决策准确性。整个体系下设70多项具体评测任务,从多个关键角度对医疗AI进行严格“体检”:一是审视“安全”,核查是否存在数据隐私泄露风险,是否遵循医学伦理准则;二是检验“专业”,测评其知识库是否基于最新的医学教材与诊疗指南;三是评估“适用”,考察其逻辑是否符合医生的临床思维与工作习惯;四是考核“准确”,评判其诊断结论与治疗建议的合理性。
在支撑评测的数据基础方面,评测中心联合了首都多家重点医院、科研机构及权威专家团队,共同构建了高质量的专业评测数据集。该数据集融合了真实的临床案例、国内外权威医学教材以及最新的临床诊疗指南,确保了基础知识的扎实性与临床实践的同步性。值得一提的是,所有评测“考题”均由国内顶级专科的高年资医师团队深度参与编撰与审核,从源头上保障了评测内容的科学性与权威性。
在评测方法与流程上,中心设定了用户申请、系统评测、专家复核三个严谨环节。系统将根据应用类型自动匹配评测任务并生成初步报告,随后由临床专家进行最终复核。计分机制则兼具国际标准与创新特色,除采用通用基础评测指标外,还创新性地引入了一个“裁判模型”进行智能化判卷。该模型并非仅关注诊断结果的正确与否,而是能对AI的诊疗思路、推理逻辑及最终答案进行综合量化分析。例如,当两款AI应用均得出正确诊断时,系统会对其中推理过程更严谨、依据更充分的一方给予更高评分,从而确保评测结果更为客观、公正与可信。
此次北京率先启动医疗AI专项评测,通过建立高标准、多维度的评价体系,不仅为行业提供了明确的规范指引,也为医疗AI产品的安全准入和性能优化提供了权威依据。此举预期将有效促进人工智能技术在医疗领域的健康、有序应用,最终让前沿科技更好地服务于民,惠及百姓健康。

