为什么Craig Venter的方法在破译科学界攻击的人类遗传密码?
如果被“攻击”你的意思是预测他们会失败,或者抱怨它经常被描绘,这就是故事。
人类基因组计划的目标是对人类基因组进行绘图和测序,该项目由公共资助并作为国际合作执行。
预计映射会产生三种类型的地图。首先,密集的遗传图谱使遗传学家将最终序列与人类特征的遗传联系起来。第二,细胞遗传学图谱,使染色体上的条带模式可以与最终序列相关联。第三,物理图谱 - 在基因组中具有已知位置的实际克隆DNA组。物理图谱将具有多种分辨率,最终的图谱是一个序列就绪的图谱 - 将被测序的实际DNA。由于测序机器只能读取短片段,因此序列就绪图谱中的每个克隆都将由许多随机片段组装而成。
因为之前没有人对如此大的基因组进行测序,并且已知人类基因组具有看起来彼此相似的大区域 - 重复 - 制作了几个不同的物理图谱。一些团体认为应该有很多层次的物理地图,我(当时是一个湿透的研究生)称之为“映射到地面”的方法。其他人想要一种更简约的方法。最后,三个主要的映射层推动了该项目。
在底部 - 序列就绪组 - 是BAC(细菌人工染色体),大小为几百千碱基。发现了大量的BAC,它们的末端排序,并且构建了一个地图,选择了一个最小化重叠的集合 - 但保留了足够的空间以使它们之间没有间隙。
YAC(酵母人工染色体)的水平上升了数百千碱基。最初YAC旨在成为序列就绪的地图,但一个丑陋的发现是YAC经常重新排列,因此不是基因组的忠实拷贝。足够好用于另一级别的地图,但不值得信赖。
对于最长的范围是几种版本的辐射杂化(RH)图。这些允许在许多兆碱基范围内的步骤,但不是实际的独立克隆。(最后看我的链接;至少有一个解释了RH地图)。
人类项目具有非常先进的映射和大量试验项目,以展示测序技术。这种规模的排序确实意味着建立工厂,技术人员团队在科学装配线上工作。自动测序仪器非常棒,但需要制作大量纯化的DNA然后进行处理,以便机器可以读取它。
克雷格·文特尔(Craig Venter)大步走进并表示他将免除所有的测绘工作并进行测序。他不是一次重新组装100个千碱基,而是简单地粉碎整个基因组并重建它。这是他用来对第一个细菌基因组进行测序的方法,但这些方法大约是人类基因组大小的1/1000,而且重复次数要少得多。因此,一些思考序列装配问题的非常聪明的科学家宣称,在那个尺度上它可能在计算上难以处理。
Venter擅长的一件事是招募聪明人,而对于Celera Genomics,他以Gene Meyers的形式抓住了一个严肃的天才。迈耶领导的团队确实成功解决了算法挑战。通过测序两种不同大小的片段 - 一个大约30kb和一个大约15kb - 以及一大堆单个读数,他们成功地组装了一个人类基因组。
这经常被描绘出来 - 这就是令人讨厌的事实 - 强硬的Celera开箱即用,并且在拙劣的,臃肿的公共努力之前飙升。这对公众的努力是非常不公平的。
首先,Celera可以通过使用已完成的公共序列区域作为测试的真实性来了解他们的策略。其次,他们还可以使用所有的映射数据 - 这是为公众生成的最终序列增加了大量的效用。第三,公众的努力为Celera的测序工厂创造了整个技术基础。
与现在相比,测序之所以如此便宜的一个主要原因是人们不再需要工厂了。在他们的厨房里只有1万美元设备的单身人士现在可以对人类基因组进行测序,但更典型的是,这是由一个小团队和大约100万美元的设备完成的(后者整体上更便宜,因为它可以产生更多的基因组分摊设备成本)。
我在2016年开始探索人类基因组计划的替代方案,以及它们如何影响Celera。阅读它们以获取血腥细节和推测。
HGP Counterfactuals,第2部分:被遗忘的地图
HGP Counterfactuals,第4部分:测序技术景观大约1992年



















