浸润性肺腺癌分级系统:来自IASLC病理学委员会的建议

免疫组化抗体神器

好评必备! 免费下载

  译者按:大多数组织器官的恶性肿瘤根据肿瘤的组织结构和细胞形态而进行分级,但肺癌WHO分类(2015)则是以腺癌的主要结构进行分类,而没有给予明确的腺癌分级。国际肺癌病理研究协会(IASLC)组织了全球范围的肺癌病理学专家对肺腺癌进行了研究并提出了一个浸润性肺腺癌的分级系统。为了让病理医生能够及时掌握该分级系统,我们组织了人员进行了全文翻译,以飨读者。由于翻译水平有限,不当之处恳请批评指正。
  摘要
  肺腺癌的分级系统尚未建立。IASLC病理学小组评估了一套与预后相关的组织学标准,旨在建立浸润性肺腺癌的分级系统。设计一项涉及多个浸润性肺腺癌队列的多中心研究。一组284例I期肺腺癌作为一个训练集,以确定与患者预后(无复发生存率[RFS]和总生存率[OS])相关的组织学特征。采用ROC曲线分析法选择最佳模型,在独立队列中进行验证(n=212)和测试(n=300,包括I-III阶段)。使用kappa统计方法评估模型的可重复性。  结果最佳模型(RFS的AUC=0.749,OS的AUC=0.787)是一个主要结构加高级别组织学结构的组合,后者的截断值为20%。该模型包括:1级:贴壁为主的肿瘤;2级:腺泡或乳头为主的肿瘤,无或少于20%的高级别结构;3级:任何大于等于20%的高级别结构(实体、微乳头状和/或复杂腺体)的肿瘤。在验证队列(RFS的AUC=0.732,OS的AUC=0.787)和测试队列(RFS的AUC为0.690,OS的AUC为0.743)中也看到了类似的结果,证实了模型的预测价值。观察者间的可重复性表现出良好的一致性(k=0.617)。结论  一个基于主要和高级别结构的分级系统对于浸润性肺腺癌是实用的,且具有预后价值。
  引言
  在许多器官系统中,肿瘤分级一直是病理评估的传统组成部分,并为治疗和患者处理提供指导。然而,对于浸润性肺腺癌来说,还没有共识的分级系统。2015版肺腺癌世界卫生组织(WHO)分类中,基于主要的组织学结构,一直被发现与预后相关,并将腺癌分为三个预后组,即低级别(贴壁为主);中级别(腺泡或乳头为主)和高级别(实性或微乳头状为主)组。也有研究提示根据主要结构进行分类和分层可以预测辅助化疗的疗效。
  肺腺癌组织学上呈异质性,表现为多种结构和比例的组合。当仅按主要结构分类时,腺泡亚型是最常见的(估计有40-50%的患者),并具有最广泛的预后谱。除了五种主要的组织学结构外,在肺部还发现了其他几种结构, 也存在于其他器官的腺癌中。这些结构包括筛状(定义为具有筛孔的肿瘤细胞巢)和融合腺体(定义为没有中间间质的发育不良的融合腺体,或具有不规则边界和单个细胞的带状结构浸润于促纤维间质中)。肺腺癌的筛状模式在2015年WHO分类中得到认可,但未作为新的亚型,而是将其描述为腺泡亚型高级别结构的一部分。在肺内,这些复杂的腺体结构(高级别腺泡)被发现与高核分裂象、肿瘤坏死和淋巴血管侵犯有关。此外,目前的证据一致认为,这些复杂的腺体结构与高级别组织学类型(实性和微乳头状)相似具有预后不良。然而,由于缺乏对这些结构的认识,可能导致肿瘤分类的不确定性和差的重复性,因为一些研究者可能将这些结构分为中级别(腺泡)或高级别(实体)。因此,识别这些“非传统结构”并将其与传统腺泡结构分开分类是很重要的。
  最近的研究建议将一些额外的病理特征加入主要结构的分类中,如次级组织学结构、核级别、有丝分裂级别、存在气腔扩散(STAS)和坏死,目的是提高分级方案。所有这些额外的组织学特征已经被证明具有预后价值,然而,大多数研究将这些特征作为单一参数来评估,并且没有考虑到肺腺癌的异质性。目前还没有系统的方法来评估并将多个拟议的预后因素纳入到一个分级系统。用分级系统补充肺腺癌的分类将有助于确定预后组,并为肺腺癌患者的预后分层提供一个共同的途径,这些患者可能受益于不断变化的管理和治疗方案。
  因此,IASLC病理学委员会进行了一项系统的研究,以评估一组被认为是预后指标的组织学特征,并建立了切除的浸润性肺腺癌分级系统。
  1  材料和方法
  1.1  研究队列
  我们评估了一项多中心的研究,其中包括多个注解良好的已切除的肺腺癌病例组。所有病例均按第8版AJCC癌症分期手册分期,并至少随访5年。研究中包括四个独立的数据集。每个数据集的收集都得到了各自机构审查委员会(IRB)的批准。美国的数据集是按照HIPPA的规定收集的。
  一个由284个I期病例组成的队列(纽约大学朗贡健康学院,美国纽约)被用作一个训练集,用于评估用于构建分级系统的最佳参数。研究结果在212例 I 期病例队列(麻省总医院,美国马萨诸塞)中进行了验证,并在另一组300例I-III期病例数据集(布列根和妇女医院,美国马萨诸塞和圣文森特医院,澳大利亚墨尔本)中对最终模型进行了测试。所有队列的人口统计信息如表1所示。
  表1:所有队列患者的人口统计信息
  1.2  组织学评价
  提名的病理学家(ALM,MMK)对训练和验证队列中的病例进行了回顾,并对下面描述的组织学参数进行了评估。测试队列中的病例没有专门针对这项研究进行回顾,因为它们代表来自提供者机构(LMS,PAR)的历史集合。
  1.2.1  在所有训练和验证的队列病例中,根据目前WHO肺肿瘤分类的建议,对所有结构使用5%增量的半定量评估进行全面的组织学分型。WHO认可的所有五种结构都包括,以及非传统结构如筛状和融合腺体(复杂腺体结构)等总和为100%。图1举例说明了复杂的腺体结构。原位腺癌、微浸润性腺癌、多灶性腺癌、浸润性粘液腺癌(IMA)和其他腺癌亚型均被排除在本研究之外。
  图1:复杂腺体结构的组织学形态。
  (A) 筛状结构,肿瘤细胞巢呈筛孔状排列;(B) 介于腺泡型和实体型之间的结构不良的腺体;(C) 不规则或相互融合的腺体浸润于纤维间质中;(D-F)腺体结构不良呈条索状排列,边界不规则;小细胞团或单个细胞在纤维间质中浸润性生长。
  1.2.2  核的级别根据以前的描述来确定。1级:圆形、规则的细胞核,染色质均匀分布,核仁无至不明显,大小为淋巴细胞的2-3倍;2级:圆形、轻度不规则、轻度多形性的细胞核,无核仁至不明显,大小为淋巴细胞的2-3倍;3级:多形性核,核仁明显,大小大于淋巴细胞的5倍,(补充图1)。
  1.2.3 核分裂级别根据以前的描述来确定。分为1级:0-1个核分裂像/10高倍视野(hpf);2级:2-4个核分裂像/10 hpf;3级:≥5个核分裂像/10 hpf。
  1.2.4 细胞学分级定义为低级别:细胞多形性程度低,细胞小;高级别:细胞多形性程度高,细胞大(补充图1)。
  1.2.5 热点确定:考虑到肺腺癌的异质性,在“热点区”(最高级别区域)记录细胞核分级、核分裂分级和细胞学分级,并记录热点区相应的组织学结构。
  1.2.6 气腔扩散(STAS)的定义如先前报道,简单地说,肿瘤细胞是在肿瘤主体边缘以外的气腔中呈现微乳头簇,实性细胞巢或单个细胞。STAS被记录为有或无。
  1.2.7 肿瘤内坏死也被记录为有或无。
  1.3  模型构建
  由于主要结构用于腺癌的分类,并显示一致预后组的分层,因此主要结构被用作该模型的基础。此外,就如何最好地代表组织学特征以获得最佳的预后判别,对几种方法进行了评估和比较。组织学结构被评估为:“加权平均”,即所有结构的比例乘以其复发风险比的总和,复发风险比来自于衡量复发时间与主要结构之间关联的cox比例模型系数;“二元模式”,即组织学结构被视为存在或不存在,独立于它们的比例,但根据先前确定的等级(1:贴壁结构;2:腺泡/乳头状;3:实性、微乳头状/复杂腺体)分配一个数字;“数值”指的是该结构被考虑的数值比例。
  不同的研究应用了不同的百分比截断值来定义预测患者不良预后所需的高级别结构的数量。因此,我们试图确定能提供最佳区分性能的高级别结构的百分比。Youden指数用以选择高级别结构最佳的百分比截止值,以得到>=85%的阳性预测值。我们将复发和死亡作为结果,并比较两者的截断值。最后,其他组织学特征(核分级、核分裂分级、细胞学分级、STAS和坏死)的作用也进行了评估。
  1.4  统计学分析
  1. 4.1  模型构建
  描述性统计作为连续变量标准差的平均值和分类变量的频率比例提出。两样本t检验和卡方检验比较两组之间的连续变量和分类变量。复发生存率(RFS)和总生存率(OS)分别计算首次确诊至首次复发或死亡的时间。最后一次的随访时间用于病人。Cox比例风险回归用于预测训练队列的复发情况。候选的预测因子是组织学特征和临床特征,包括年龄、性别和病理分期。通过评估每个预测因子的显著性和最小化Akaike信息标准来选择模型。用回归系数加权的选择的模型预测因子的线性组合被定义为风险评分,并应用于队列研究。我们通过识别受试者工作特征(ROC)曲线(AUC)下面积来评估复发和死亡的预后鉴别能力。此外,一致性指数(C指数)与二元结果的AUC相似,分别用来表示预测RFS和OS的鉴别能力。值为0.5表示模型不具有鉴别能力,值为1.0表示模型具有完善的鉴别能力。双侧p值<0.05被认为有统计学意义。所有数据均使用R版本3.5.1进行分析。
  1.4.2 生存分析
  采用Kaplan-Meier曲线绘制生存曲线,并通过对数值检验确定了(IASLC)所提出的分级系统和基于主要结构的分级系统之间OS和RFS的差异。数据使用R版本3.6.1进行分析。P<0.05被认为有统计学意义。
  1.4.3 可重复性评估
  随机选取23例病例,在Aperio扫描仪(徕卡生物系统)上对所有含肿瘤的H&E染色片进行扫描。全切片图像(WSI)由5名观察者通过远程病理学进行回顾。每个病例的WSI数量在1-5张切片之间。用Fleiss κ 统计量来衡量观察者之间一致性的可靠性。评分一致性被认为完全一致或大多数同意。完全一致定义为所有观察者之间三个级别的分级一致。多数一致定义为5个观察者中至少有3个观察者的评分一致。关联强度(一致性)分为:1.00:完全一致;0.80-0.99:几乎完全一致;0.60-0.79:高度一致;0.40-0.59:中等一致;0.20-0.39:一般的一致性;0.0-0.19:极低的一致性;<0:无一致性。
  2 结果
  2.1  组织学评价和临床特征-训练集
  主要的组织学结构的分布如表1所示。肿瘤的组织学特征(细胞核分级、细胞学分级、核分裂分级和STAS)与热点区域的组织学结构有很强的相关性。高级别核、核分裂象高和STAS的存在与高级别组织学结构显著相关,而低级别和中级别组织学结构主要表现为低或中等的核分裂象和细胞核分级(p<0.001)(补充图2)。不含高级别结构成分的肿瘤中没有发现STAS。26例出现坏死,均为高级别结构为主的肿瘤。
  低级别细胞学特征的病例主要出现在贴壁型、腺泡型、乳头状和微乳头状组织学结构中(85%的病例),而只有15%病例为实体和复杂腺体结构中。同样,高级别细胞学特征主要见于实体和复杂腺体结构(85%的病例),只有14%为腺泡型、乳头状和微乳头状结构,1%出现在贴壁为主型的病例。
  2.2 分级模型的建立-组织学结构的作用
  训练队列中组织学特征与复发率的关系如补充表1所示。仅考虑患者临床特征(年龄、性别和临床分期)的模型的预后鉴别能力,复发AUC为0.685,死亡AUC为0.673。为了提高AUC曲线,增加了组织学特征,包括只增加主要结构、两个最主要结构的组合、主要结构加最高结构的组合,以及将所有结构作为模型变量进行加权平均、二元模式或数字组合。结果见表2。仅将主要结构引入临床特征提高了模型的预后分层,复发的AUC为0.719,死亡的AUC为0.729,但曲线的最大增量来自于两个最主要结构的组合(RFS的AUC=0.765;OS的AUC =0.760)和主要结构加最高结构的组合(RFS的AUC=0.749,OS的AUC=0.741)。
  表2:训练集中组织学模式变量的选择
  基线模型代表仅仅为临床特征。*模式1至3显示肿瘤主要生长模式的三级分类:模式1:贴壁型生长;模式2:腺泡型或乳头状生长;模式3:微乳头状、实性或复杂腺体结构(筛状和融合腺体)。所有7种模式表明肿瘤中的所有模式都是单独计数的。二元表示没有模式,但如上所述分配了一个数字(1-3)。数值表示已考虑该模式的数值比例。
  与两个最主要的或主要的加最高级模型的组合相比,将所有结构作为加权平均或二元模式添加到模型中,具有同样的预测性。由于两个表现最好的模型(两个最主要和最主要加上最高级)的AUC差异在统计学上没有差异,因此决定将重点放在后者上,因为这对于倾向于根据最差分化结构进行分级的病理学家更为实际。所有其他可能的组合没有进一步评估。
  接下来,我们评估了影响模型性能所需的高级别结构(实体、微乳头状和/或复杂腺体)的最小百分比。低于10%的截断值是无效的(敏感性1,特异性0),10%的截断值其敏感性为0.47,特异性为0.76。当高级别结构的截断值为20%时,曲线的灵敏度和特异性的组合最佳(分别为0.64和0.68),该模型中复发的AUC为0.749,死亡的AUC为0.787。
  随后我们又探索了其他组织学特征是否能提高模型。各种组织学特征的影响,无论是单独的还是组合的,都测试了其对AUC的影响。结果发现,所有组织学特征均未显著提高新参考模型的AUC(表3)。
  表3:主要结构加最高级结构模型中组织学特征的选择(高级别结构的临界值为20%或更高)
  训练集:*将组织学特征添加到基线+主要结构+最高级结构中(后向选择,每次删除最不显著的变量);加上其他组织学特征(细胞核分级、核分裂分级、STAS等)并没有显著改善模型。
  根据上述结果,我们提议了一个新的评分系统(IASLC评分系统,表4):
  1级:高分化腺癌=贴壁型为主的肿瘤,无或少于20%的高级别结构(实体型、微乳头型和/或复杂的腺体结构)。
  2级:中分化腺癌=腺泡或乳头状为主的肿瘤,无或少于20%的高级别结构。
  3级:低分化腺癌=高级别结构占20%或以上的肿瘤。
  表4.浸润性腺癌的分级方案
  该模型基于主要的组织学和高级别结构,后者包括实性、微乳头状和复杂的腺体结构。
  2.3  验证集
  在验证队列中也进行了类似的分析,其中复发的中位时间为1407(778-1984)天,死亡时间为1995(1772-2225)天。所有的组织学参数均与复发相关:主要组织学类型(p=0.05)、细胞核分级(p=0.01)和细胞学分级(p=0.0002)、核分裂像分级(p=0.004)和STAS的存在(p=0.03)(补充表2)。
  与训练队列相似,最主要加上最高级的组合(AUC=0.732)是复发的最佳指标。添加任何其他组织学特征,无论是组合还是作为单一特征,均未显示出模型的改进(补充表3)。
  2.4  测试集
  该模型在300例I-III期肺腺癌队列中进行了测试。在这个队列中,复发的中位时间是570天(306到1200天),死亡的中位时间是1195天(660到1998天)。该模型在测试队列中具有相似的表现,复发的AUC为0.690(范围0.629-0.751),C指数为0.704,死亡的AUC为0.743(范围0.688-0.797),C指数为0.729(补充表4)。
  IASLC最终模型(表4)的预测性能与测试队列中主要结构的分级系统的性能进行了比较。无论是在整个队列(I-III期)还是仅在I期队列中,高级别结构与两种分级系统的RFS降低都具有相关性;但是,在IASLC分级系统中,3个等级之间的生存分层比基于主要结构的分级系统更明显(整个队列:p<0.0001 vs. p=0.00013,I 期队列:p=0.0093和p=0.044)(图2)。OS也有类似的表现,在整个队列和I期队列中,高级别结构与两种分级系统的OS降低相关(整个队列:p=0.00011 vs. p<0.0001;I 期队列:p=0.0053 vs .p=0.011)。
  图2:根据IASLC分级系统(A:整个队列和C:I 期队列)和基于主要结构模式的分级系统(B:整个队列和D:I 期队列)分层的试验队列无复发生存率(RFS)的Kaplan-Meier曲线。对于后者,1级为贴壁为主型的肿瘤;2级为腺泡型或乳头状为主的肿瘤,3级为实体型、微乳头状和复杂腺体结构为主的肿瘤。
  2.5 可重复性评估
  五名观察者回顾了23个病例的所有代表性病理切片的WSI。52%病例(12/23)完全一致,47%(11/23)观察者的k值为0.617(SE=0.0478;95%CI=0.5238-0.7095)。大多数不一致性出现在在1级和2级之间(6/23,26%),主要是部分病例有人认为是贴壁型腺癌,而另一些人则认为是乳头型。2级和3级不一致的为(5/23,22%),主要是由于观察者对高级别结构评估比例的差异。综上所述,通过Fleiss κ检验结果存在一致性,两组观察者之间几乎完全一致(补充表5)。
  3  讨论
  我们的研究结果表明,基于组织学结构的分级系统是浸润性肺腺癌的一个强有力的预后分类标准。这个分级系统直接从当前的分类系统构建而来,可以很容易地在实践中重复应用。我们提出的IASLC分级系统考虑了肿瘤内部结构模式的异质性和相对比例,从而为肺腺癌的疗效和预后研究奠定了基础。
  根据我们提出的分级系统,任何具有20%或更多的高级别结构的肿瘤都应被归类为低分化,因为这些肿瘤的行为方式与那些以高级别结构为主的肿瘤一样,都具有更强的侵袭性。我们所提出的分级系统比单独以主要结构为标准的模式提供了一个更好的预后分组。
  这项研究的优势在于使用了来自不同机构的几个独立数据集,从而减少了机构和病理学家的偏见。该模型是使用一个带有良好注解的数据集创建的,其中测试了几个可能的替代方案,然后在另一个注解良好的数据集中进行了验证,在该数据集中,对训练集中评估的相同参数进行了测试和确认。最后的最终模型在第三个数据集上进行了测试,后者不同于其他数据集,并不是为本研究来专门设置,而是来自于研究机构的历史病例。事实上,所有数据集的稳健性都得到了类似的支持。
  值得注意的是,肿瘤组织学特征作为预后预测工具的能力是有限的。在我们的研究中,在所有被评估的数据集中,最佳AUC略高于0.7。在其他文章中也发现了类似的观察结果。例如,Sica等人提出了一种基于生长模式的评分系统,使用一致性概率估计代替AUC,最佳估计值为0.65(95%置信区间为0.57-0.73)。同样,Liu DH等人提出了一个整合T分期、组织学模式和坏死的模型,其AUC也为0.717。这表明,肿瘤的其他非组织学特征可能会增加复发的预测性。一些研究者已经提出了一种基于细胞周期基因表达的分子分级系统来预测I-II期肿瘤的复发,然而这些研究没有组织学评估的参考。希望未来的研究能够将IASLC分级系统纳入到他们的研究中,以期找到其他可以提高疾病复发或死亡预测的生物标志物。
  另外,其他在预测 I 期腺癌复发方面具有预后意义的组织学特征并没有为本文提出的模型提升价值。我们的结果显示,大多数的组织学特征,如细胞核分级和细胞学分级、STATS和核分裂分级等,无论是在主要结构还是非主要结构中,都与组织学结构有关。虽然在这项研究中没有评估淋巴结转移情况,但据报道它与高级别生长模式有关。需要注意的是,我们所提出的分级系统尚未在腺癌的亚型(比如浸润性粘液腺癌)中得到验证,需要进一步的研究来评估该模型在这些特殊肿瘤中的适用性及其性能。
  这项研究的另一个重要意义是确定了高级别结构的截断值,因为文献中的许多报告提供的作为复发决定因素的高级别结构的百分比相互矛盾。在这项研究中,20%的截断值为AUC提供了最好的敏感性和特异性。有趣的是Sica等人也表明,与其他组织学类型相比,具有20%实体或微乳头状结构的肿瘤具有显著的转移潜能。
  在多个病理学家之间组织学结构评估的可重复性是一个挑战。在我们的研究中,两个观察组(总共10个病理学家)评估23个病例的分级几乎完全一致的kappa值在0.79到0.89之间(平均kappa值:0.84+0.04)。不过大多数不一致的等级归因于贴壁型和乳头状结构的区别(1级和2级),其次是高级别结构的比例差异。因此,对贴壁型和浸润性结构的定义的细化可能会提高可重复性。
  总之,本研究提出了一种新的浸润性肺腺癌分级系统。这个分级是基于组织结构的实用性模型,这使得它可以在常规病理实践中快速实施,因为它不需要病理学家学习其他技术。该模型为肺腺癌提供了一个新的预后分组,可在不同机构的多个数据集中重复验证。希望这个分级系统能提供一种共同的标准,让病理学家在临床实践中使用和研究人员在评估腺癌的预后和/或预测标志物中使用,并且这个分级系统可以对组织学异质性的肿瘤进行更全面的比较。最后,这个分级系统并不是要取代目前肺腺癌的分类,而是作为一种新的补充。
  原文出处:Moreira AL, Ocampo PSS, Xia Y, et al. A grading system for invasive pulmonary adenocarciioma: A proposal from the International Association for the Study of Lung Cancer Pathology Committee. J Thorac Oncol, 2020,S1556-0864(20)30468-8
责任编辑: 奶糖
0 0 0

扫一扫下载91360客户端