这玩意,一个看你是检查什么病,一个是怎么说这个结果。
像 Trisomy 这样的,比如唐氏综合症这样的,第一型和第二型错误都可以到 0.1% 以下。
什么是第一型和第二型错误?套维基上的说明:
以利用驗孕棒驗孕為例,此時未懷孕為零假設。若用驗孕棒為一位未懷孕的女士驗孕,結果是已懷孕,這是第一型錯誤。若用驗孕棒為一位孕婦驗孕,結果是未懷孕,這是第二型錯誤。
把怀孕换成唐氏综合症,就是这个意思。如果说怀孕为阳性,未怀孕为阴性,一型错误也就常被称为是假阴性(False negative error),二型是假阳性(False positive error)。
准确率高是因为分类器简单。
学过模式识别的人都知道,设计分类器,有两个重要的部分,一个是正确的特征(feature),一个是对应的分类器。如果有正确的特征,很普通的分类器,也能做出很高质量的预测,根本不需要什么深度学习那种的。
唐氏综合症就是这样的例子,因为它的特征很明白:21 染色体多了一个。所以,如果有了染色体的信息,取一个阈值就完了。所以,特征提取这个困挠人的大难题,不存在了。(相比一下,我有朋友是做孕妇败血症的,大海捞针,那个就完全不一个量级的难度)
难点呢,在于信号的质量很差,噪音很高。因为,你想知道的,是婴儿的染色体信息,但是在母血里,是和大量母亲的染色体混杂的。所以,这差别给冲淡了。
但是,像唐氏综合症这样的,靶子很大,不是只有一个特征,整条染色体所有位点全是特征,所以,就可以用空间采样密度来换取高信噪比,把整个染色体上上下下采个遍。如果是测序,就是整条染色体全测过,分成很多段来算,最后取平均。
另一个难点呢,其实是在如何归一化样本,让产妇样本之间的可比性增加,就能保证分类器的普适性。
这一点上,做产前检查的优势,就在有大量的样本。每年孕妇多少人?相关公司收集个几万样本不是难事,从此可以得到比较可靠的原始数据归一化方法。
这样下来,像普通的唐氏综合症这样的,第一型和第二型的准确率,都比较高的。这里是做此类检查的 Sequenom 公司的广告(见 MaterniT21® PLUS NIPT),其中 sensitivity(灵敏度)是真阳性,就是 1 – 假阴性,specificity(特异度) 是真阴性,是 1 – 假阳性:
但是对有些病,就难了。比如只是染色体局部出现倍增或缺失的,这样你就只有一小段染色体来获取特征。这个就是此类筛查的分辨率的问题。像唐氏这样整条染色体的倍增,需要的分辨率很低,成功率自然就高。印像中,现在孕期筛查的分辨率做到几百万个碱基对这样的,问题不大。再降到基因一级,就是几十万到几万,是当下的目标。
再一个问题,就是这准确率怎么呈现。
比如吧,假设灵敏度和特异度都高达 99.9%。有一万个孕妇待查。我们知道对于 35 岁的孕妇,唐氏,就是 21 染色体倍增的比例,是 1/185。就是说平均有 54 名孕妇有这个问题,99.9% 的准确率是说这些孕妇都能被查出来,同时,一万孕妇里,有 10 个人也会被误诊。就是说,总共会有 64 名被查出可能有唐氏的孕妇,其中真正有唐氏的机率(学名叫 positive predictive value)是 54/64 = 84%。你要接着做有更大流产风险的穿刺检查么?
相比之下,18 染色体倍增机率是 1/470。这样算下来,真正有病变的机率就降到了 68%。如果是 13 染色体倍增,机率是 1/1500,就降到 40%。
(上面这几个病的数据来自 GenomeWeb 文章:Clinical Sequencing News)
所以任何检查,都会有免责声明:No test is perfect.
大致如此。
来源:知乎 www.zhihu.com
作者:talich
【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。
点击下载
此问题还有 3 个回答,查看全部。