(原创 2020-04-09 CMDE 中国器审)
2019年7月,美国食品药品监督管理局(FDA)发布了关于抗病毒药物产品提交二代测序数据的指南。指南为抗病毒药物产品向FDA提交二代核苷酸序列分析程序以及支持耐药性评估数据提供了意见。
一、背景信息
为保护公共卫生、避免出现可能传染他人并导致不能通过已批准药物产品控制疾病暴发的新型耐药和交叉耐药病毒变异体,提供准确的耐药性信息势在必行。
FDA对开发中的抗病毒药物产品相关的耐药性数据进行独立分析,从而确保在新审批的抗病毒药物产品说明书中对产品耐药性进行表征分析和解释。此外,FDA要求将宿主靶向基因的核苷酸序列分析数据用于多态性分析,以此确定基于不同种群的等位基因是否对疗效有影响。
二、二代数据提交要求
FDA要求申请人应当提交详细的方案来描述样本处理和二代测序技术(NGS)分析程序。同时每个研究的数据应提供基于种群测序、适合分析的病毒耐药性数据格式,显示基线和无效序列,并在氨基酸与参考序列相同时使用空白细胞。FDA建议申请人在与FDA协商后,建立耐药性数据集的灵敏度水平,或者提供选择灵敏度水平的理由。提供显示每个研究或研究亚组(例如各基因型、各剂量)的主要替换的高水平汇总的表格。
申请人应当提供:(1)频率表来报告所有频率大于或等于1%的与基线不同的氨基酸替换。(2)以fastq格式提供每次序列运行中的所有原始NGS数据,拼接的序列比对可以选择以“.fas”“.ace”“ .sam”或“.bam”格式提交。(3)适当的参考序列以及用于任何参考比对的信息。(4)基线或参考共有序列并陈述该序列是如何得出的。(5)对于从头拼接,以fastq格式提供所有大于200个核苷酸的重叠群。
三、NGS检测要求
NGS方案中包含以下通用方案设计元素:(1)受试者、研究时间点和待分析的样本矩阵的描述;(2)待使用的NGS平台的描述,包括所有相关的性能特征;(3)待分析的目标基因区域名称和大小;(4)通用分析策略(例如:鉴别相对于原型株的改变,比较同一受试者不同时间点的序列);(5)检测的覆盖水平,对于一些病毒载量较低的样本可能不能在满足要求的覆盖水平下产生拼接,申请人应当鉴别不能达到该覆盖水平的样本;(6)用于鉴别、过滤或处理测序错误的方法描述。
获得可靠测序结果的关键是模板制备,因此待测序的样本代表了正在分析的种群,应对以下信息进行描述:从样本中提取核酸的方法;从污染背景核酸中纯化病毒序列的方法;浓缩病毒核酸的方法,包括每个样本用于逆转录聚合酶链式反应(RT-PCR)(病毒RNA)或PCR(病毒DNA)反应的估算目标拷贝数;变性次级结构的方法;生成双链DNA(dsDNA)的方法(包括引物的描述、纯化dsDNA用于测序的方法);NGS文库制备的方法等。
四、NGS数据分析方法和报告要求
序列数据的提交必须包括对用于分析测序数据集和原始序列信息分析流程的全面描述,这样FDA才能进行独立的数据分析。报告应当包括(1)每个序列运行测序的序列总数,测序序列的质量评分,测序序列的平均长度,为降低平台特异性误差影响而进行的任何误差评估的描述,以及有关采用了何种修饰参数来清除潜在序列误差或者去除未能满足任何质量或长度阈值的测序序列的信息。(2)用于向关注序列中添加条形码序列的方法描述,用于根据条形码将测序序列分类的程序,条形码序列是如何从序列修饰的描述,以及所采取的任何消除潜在交叉条形码污染的预防措施的描述。
NGS数据分析可采用两种方法来支持抗病毒药物产品的开发:(1)短测序序列与参考序列比对。(2)短测序序列从头拼接来组装重叠群。比对测序序列与参考序列并识别变异体。根据序列比对和变异体识别报告结果。
五、NGS文件类型和提交程序
Fastq格式的原始NGS数据和频率表应当按照技术规范文档《采用eCTD传递电子申请规格》中列出的指南,通过安全便携式硬盘发送至FDA。便携式硬盘的内容应注意:(1)硬盘仅可提交原始NGS数据、频率表和目录;(2)所有NGS数据均应当以fastq格式提供,其中包括核苷酸序列和质量信息;(3)各个时间点每例受试者的NGS序列运行,包括基线和接近观察到治疗失败的时间点;(5)申请人提供的fastq文件应当标记有唯一的受试者识别码和时间点;(6)NGS方案、适合分析的耐药性数据集以及任何其他支持信息均应当通过CDER电子文件途径提交。
六、结语
NGS是一种新兴技术,申请人在进行基于序列的耐药性分析时频繁采用该项技术。由于该技术可生成临床样本中所有RNA或DNA的核苷酸序列,故NGS检测在有效区分病原体变异体的同时,也增加了耐药性分析过程的复杂性。与Sanger核苷酸序列分析相比, NGS可提供一个病毒种群中个体病毒的核苷酸序列信息,通常每个样本能提供数以百万计或数以亿计的短序列。由于目前尚无标准化的生物信息分析方法来分析这些大型数据集,数据的复杂性为审评员分析和验证序列信息带来了挑战。目前,器审中心尚未收到该类产品的注册申报,FDA关于抗病毒药物产品提交二代测序数据的要求为器审中心将来对同类检测产品进行技术审评起到借鉴作用。
参考文献:
[1] FDA.Submitting Next GenerationSequencing Data to the Division ofAntiviral Products
2019年7月,美国食品药品监督管理局(FDA)发布了关于抗病毒药物产品提交二代测序数据的指南。指南为抗病毒药物产品向FDA提交二代核苷酸序列分析程序以及支持耐药性评估数据提供了意见。
一、背景信息
为保护公共卫生、避免出现可能传染他人并导致不能通过已批准药物产品控制疾病暴发的新型耐药和交叉耐药病毒变异体,提供准确的耐药性信息势在必行。
FDA对开发中的抗病毒药物产品相关的耐药性数据进行独立分析,从而确保在新审批的抗病毒药物产品说明书中对产品耐药性进行表征分析和解释。此外,FDA要求将宿主靶向基因的核苷酸序列分析数据用于多态性分析,以此确定基于不同种群的等位基因是否对疗效有影响。
二、二代数据提交要求
FDA要求申请人应当提交详细的方案来描述样本处理和二代测序技术(NGS)分析程序。同时每个研究的数据应提供基于种群测序、适合分析的病毒耐药性数据格式,显示基线和无效序列,并在氨基酸与参考序列相同时使用空白细胞。FDA建议申请人在与FDA协商后,建立耐药性数据集的灵敏度水平,或者提供选择灵敏度水平的理由。提供显示每个研究或研究亚组(例如各基因型、各剂量)的主要替换的高水平汇总的表格。
申请人应当提供:(1)频率表来报告所有频率大于或等于1%的与基线不同的氨基酸替换。(2)以fastq格式提供每次序列运行中的所有原始NGS数据,拼接的序列比对可以选择以“.fas”“.ace”“ .sam”或“.bam”格式提交。(3)适当的参考序列以及用于任何参考比对的信息。(4)基线或参考共有序列并陈述该序列是如何得出的。(5)对于从头拼接,以fastq格式提供所有大于200个核苷酸的重叠群。
三、NGS检测要求
NGS方案中包含以下通用方案设计元素:(1)受试者、研究时间点和待分析的样本矩阵的描述;(2)待使用的NGS平台的描述,包括所有相关的性能特征;(3)待分析的目标基因区域名称和大小;(4)通用分析策略(例如:鉴别相对于原型株的改变,比较同一受试者不同时间点的序列);(5)检测的覆盖水平,对于一些病毒载量较低的样本可能不能在满足要求的覆盖水平下产生拼接,申请人应当鉴别不能达到该覆盖水平的样本;(6)用于鉴别、过滤或处理测序错误的方法描述。
获得可靠测序结果的关键是模板制备,因此待测序的样本代表了正在分析的种群,应对以下信息进行描述:从样本中提取核酸的方法;从污染背景核酸中纯化病毒序列的方法;浓缩病毒核酸的方法,包括每个样本用于逆转录聚合酶链式反应(RT-PCR)(病毒RNA)或PCR(病毒DNA)反应的估算目标拷贝数;变性次级结构的方法;生成双链DNA(dsDNA)的方法(包括引物的描述、纯化dsDNA用于测序的方法);NGS文库制备的方法等。
四、NGS数据分析方法和报告要求
序列数据的提交必须包括对用于分析测序数据集和原始序列信息分析流程的全面描述,这样FDA才能进行独立的数据分析。报告应当包括(1)每个序列运行测序的序列总数,测序序列的质量评分,测序序列的平均长度,为降低平台特异性误差影响而进行的任何误差评估的描述,以及有关采用了何种修饰参数来清除潜在序列误差或者去除未能满足任何质量或长度阈值的测序序列的信息。(2)用于向关注序列中添加条形码序列的方法描述,用于根据条形码将测序序列分类的程序,条形码序列是如何从序列修饰的描述,以及所采取的任何消除潜在交叉条形码污染的预防措施的描述。
NGS数据分析可采用两种方法来支持抗病毒药物产品的开发:(1)短测序序列与参考序列比对。(2)短测序序列从头拼接来组装重叠群。比对测序序列与参考序列并识别变异体。根据序列比对和变异体识别报告结果。
五、NGS文件类型和提交程序
Fastq格式的原始NGS数据和频率表应当按照技术规范文档《采用eCTD传递电子申请规格》中列出的指南,通过安全便携式硬盘发送至FDA。便携式硬盘的内容应注意:(1)硬盘仅可提交原始NGS数据、频率表和目录;(2)所有NGS数据均应当以fastq格式提供,其中包括核苷酸序列和质量信息;(3)各个时间点每例受试者的NGS序列运行,包括基线和接近观察到治疗失败的时间点;(5)申请人提供的fastq文件应当标记有唯一的受试者识别码和时间点;(6)NGS方案、适合分析的耐药性数据集以及任何其他支持信息均应当通过CDER电子文件途径提交。
六、结语
NGS是一种新兴技术,申请人在进行基于序列的耐药性分析时频繁采用该项技术。由于该技术可生成临床样本中所有RNA或DNA的核苷酸序列,故NGS检测在有效区分病原体变异体的同时,也增加了耐药性分析过程的复杂性。与Sanger核苷酸序列分析相比, NGS可提供一个病毒种群中个体病毒的核苷酸序列信息,通常每个样本能提供数以百万计或数以亿计的短序列。由于目前尚无标准化的生物信息分析方法来分析这些大型数据集,数据的复杂性为审评员分析和验证序列信息带来了挑战。目前,器审中心尚未收到该类产品的注册申报,FDA关于抗病毒药物产品提交二代测序数据的要求为器审中心将来对同类检测产品进行技术审评起到借鉴作用。
参考文献:
[1] FDA.Submitting Next GenerationSequencing Data to the Division ofAntiviral Products
审评六部 吴传松 供稿
来源:CMDE
关注我们的微信公众号
获得更多资讯