全国热线:400 0087 916

english
中文 English

资讯中心

【CMDE】肺炎CT影像辅助分诊与评估软件审评要点发布

2020-03-05 2266

肺炎CT影像辅助分诊与评估软件审评要点(试行)

 

一、适用范围

本审评要点适用于肺炎CT影像辅助分诊与评估软件的产品注册。该类产品基于肺部CT影像,采用深度学习技术进行肺炎影像学异常识别,临床用于新型冠状病毒肺炎疑似患者的分诊提示以及确诊患者的病情评估。

按现行《医疗器械分类目录》,该类产品分类编码为21-04-02,管理类别为三类。

二、基本要求

生产企业应依据《医疗器械软件注册技术审查指导原则》《医疗器械网络安全注册技术审查指导原则》《移动医疗器械注册技术审查指导原则》《深度学习辅助决策医疗器械软件审评要点》等相关指导原则与审评要点,提交相应注册申报资料。

该类产品的软件安全性级别为B级,生产企业应依据《医疗器械软件注册技术审查指导原则》提交相应软件描述文档。其中,核心算法所述深度学习算法应依据《深度学习辅助决策医疗器械软件审评要点》提交相应算法研究资料。

生产企业应依据《医疗器械网络安全注册技术审查指导原则》提交网络安全描述文档。其中,基本信息应围绕数据类型进行描述;风险管理、验证与确认应基于19项网络安全能力进行分析和实施,不适用项详述理由;可追溯性分析报告应追溯网络安全需求、设计、测试、风险管理的相互关系;维护计划应包含网络安全日常维护计划、网络安全事件应急响应预案。

若使用云计算服务、移动计算终端,生产企业应依据《移动医疗器械注册技术审查指导原则》提交相应研究资料。其中,使用云计算服务应明确服务模式、部署模式、核心功能、数据接口、网络安全能力、服务(质量)协议等要求;使用移动计算终端应结合终端的类型、特点、使用风险明确相应性能指标要求。

生产企业应单独出具一份软件版本命名规则真实性声明。明确软件发布版本、软件完整版本,涵盖算法驱动型软件更新和数据驱动型软件更新;区分重大软件更新和轻微软件更新,其中重大软件更新应列举全部典型情况。

三、风险管理

生产企业应基于软件的预期用途、使用场景、核心功能开展风险管理。重点分析假阴性和假阳性风险,特别是假阴性风险,明确相应风险控制措施,确保软件综合剩余风险均可接受。

四、软件研究

生产企业在准备软件研究资料时应重点关注以下方面要求:

(一)软件功能至少包含异常识别、量化分析(如病灶体积占比、CT值分布等)、数据对比(手动、自动均可)、报告输出。其中,异常识别用于疑似患者的分诊提示,量化分析和数据对比用于确诊患者的病情评估。

(二)训练数据原则上不少于2000例新型冠状病毒肺炎确诊患者CT影像;至少来源于3家医疗机构,其中至少包含1家疫情严重地区医疗机构;至少包括早期、进展期的新型冠状病毒肺炎CT影像。

(三)明确CT影像要求,包括CT设备兼容性与扫描参数、CT影像质量等因素,如厂家、排数、层数、层厚、管电压、管电流、加载时间、图像伪影与噪声等要求,并提供相应支持材料。

(四)结合人群特征(如性别、年龄)、影像学分期(早期、进展期、严重期)、数据来源机构、CT设备(如厂家、层厚)等因素,提供新型冠状病毒肺炎CT影像的数据分布情况。

(五)明确数据标注的流程以及质控要求。

(六)提供训练集、调优集、测试集的数据量以及数据分布情况,明确新型冠状病毒肺炎、其他类型肺炎等类似病征的占比,保证测试集阳性样本与阴性样本的比例合理。

(七)明确数据扩增的对象、方法、倍数,分析扩增倍数过大的影响及其风险。

(八)提供算法结构、流程图,明确输入与输出、所用现成深度学习框架。

(九)明确算法训练的评估指标、训练目标及其确定依据,提供训练数据量-评估指标曲线、ROC曲线等证据。

(十)结合CT设备、影像学分期、类似病征等因素,提供算法性能影响因素分析报告。

五、临床研究

该类产品临床评价方式与其必备的软件功能类型有关。用于分诊提示的异常识别功能属于辅助决策类软件功能,需要开展临床试验,可采用回顾性研究。用于病情评估的量化分析等功能属于非辅助决策类软件功能,可根据《医疗器械临床评价技术指导原则》提交相应临床评价资料,也可在临床试验中予以评价。

分诊提示的临床试验要求具体如下:

(一)试验目的

生产企业应根据产品适用范围确定临床试验目的。适用范围考虑因素包括但不限于:目标疾病(肺炎)、临床用途(分诊提示)、禁忌症(如某些类似病征)、预期适用人群(如具有新型冠状病毒肺炎流行病学史、临床表现的患者)、预期使用场所(如定点医院、方舱医院)、预期目标用户(如放射科医师)、预期兼容的CT设备等。

临床试验目的主要对分诊提示的诊断准确度进行确认。

(二)试验设计

可采用单组目标值试验设计,以分诊提示的敏感性、特异性等固有诊断准确度指标作为主要评价指标。

目标值应符合临床应用需求,可来源于权威医学组织、相关标准化组织发布的客观性能标准,也可基于影像科医师诊断目标疾病准确度的临床数据经荟萃分析来构建性能目标。生产企业应明确目标值的确定依据。

(三)受试对象

受试对象应包含一定样本量的阳性病例和阴性病例。按照《新型冠状病毒肺炎诊疗方案(试行第六版)》,阳性病例为具有肺炎影像学特征的新型冠状病毒肺炎疑似病例,阴性病例为未见肺炎影像学特征的病例。在此基础上,病例的选择还需综合考虑以下因素:

1.临床试验纳入病例应独立于产品开发所用病例;

2.临床试验纳入病例需来源于不同地域医疗机构;

3.选择性入组病例可能导致研究人群与预期适用人群存在较大差异,建议连续入组符合入排标准的病例,以消除或减小选择性偏倚;

4.需考虑阳性病例中新型冠状病毒肺炎分型、分期的分布合理性。

(四)评价指标

主要评价指标原则上应考虑将病例水平的敏感性和特异性组成复合终点。

次要评价指标可包括分诊提示时间、软件易用性(可采用主观感受评价,如李克特量表等)和安全性等。若同时观察量化分析等功能的临床安全有效性,可设立相应次要评价指标。

(五)金标准构建

生产企业应详述金标准的选择、构建方法及理由。可供选择的金标准构建方法包括:一是以临床确定结果为金标准,即流行病学史、临床表现(含影像学特征)的综合诊断结果;二是通过专家阅片小组构建金标准。

若选用后者,需明确专家数量、来源科室、专家资质要求(如职称)、专家相关培训要求、培训效果评测(判定一致性)、结果判定标准、结果判定规则(如少数服从多数,双人背靠背评判,高水平医师仲裁)、专家抽取标准(随机抽取或顺序轮转)等。建议由来自影像科、呼吸科等多个科室的医师联合阅片,以减少不完美金标准的偏倚。

(六)样本量

样本量估算需综合考虑临床试验设计、主要评价指标和统计学要求。生产企业需明确计算公式、相应参数及确定理由,以及所用的统计软件。

对于复合终点,样本量估算需考虑满足所有单项指标的假设检验的样本量需求。假设软件的敏感性为95%,临床认可的目标值为90%,则在双侧显著性水平0.05、把握度80%,至少需231例阳性病例。假设软件的特异性为85%,临床认可的目标值为80%,则在双侧显著性水平0.05、把握度80%,至少需466例阴性病例。在此基础上考虑5%-10%脱落率确定最终样本量。

(七)其他

临床试验资料需明确以下信息:

1.病例基线情况统计学描述,包括年龄、性别、流行病学特征、病例数(阳性病例数、阴性病例数)、疾病分型(普通型、重型、危重型)、影像学分期(早期、进展期、严重期)等。

2.CT影像采集情况统计学描述,包括数据来源机构、CT设备厂商及型号规格、CT设备扫描参数(如排数、层数、层厚、管电压、管电流、加载时间)等。

六、说明书

说明书应符合《医疗器械说明书和标签管理规定》相关要求。明确适用范围、禁忌症、使用限制、注意事项、CT设备兼容性与扫描参数要求、CT影像质量要求、算法输入与输出、算法训练总结、算法性能评估总结、软件临床评价总结、软件发布版本、软件运行环境、使用期限等内容。

七、软件更新考量

考虑到疫情防控的紧迫性,结合该类产品所具有的数据驱动、快速迭代等特性,上市后软件更新要求如下:

(一)对于数据驱动型软件更新,生产企业在疫情期间可通过质量管理体系进行软件更新质量控制,无需提交许可事项变更申请,但应确保新版本可回滚至已批准版本;待疫情结束后1个月内,生产企业应针对全部软件更新情况提交许可事项变更申请。

(二)对于算法驱动型软件更新,生产企业应及时提交许可事项变更申请。

(三)对于其他类型的软件更新,若发生重大软件更新,生产企业应及时提交许可事项变更申请;若发生轻微软件更新,生产企业通过质量管理体系进行软件更新质量控制,无需提交许可事项变更申请。

(四)若同时发生多种类型的软件更新,注册申报要求遵循风险从高原则。例如,同时发生数据驱动型和算法驱动型软件更新,按照算法驱动型软件更新处理。

八、其他说明

(一)生产企业应基于产品特性提交注册申报资料,判断本审评要点具体内容的适用性,不适用内容应详述理由。

(二)辅助检测软件、辅助诊断软件风险水平高于辅助分诊软件,原则上应作为不同注册单元分别申报。

(三)产品若有其他非必备软件功能,辅助决策类软件功能注册申报资料要求参照异常识别功能,非辅助决策类软件功能注册申报资料要求参照量化分析功能。

(四)若采用传统机器学习技术,注册申报资料要求详见《深度学习辅助决策医疗器械软件审评要点》相关说明。

(五)对于进口软件,生产企业还应考虑中外差异的影响及其风险,并提供相应支持资料。