古基因组学(Paleogenomics)是由瑞典学家斯万特·帕珀(Svante Pääbo)关于灭绝人类基因组和人类进化的研究催生而出的一门全新的科学学科。该学科通过某些保存完好或已化石化的生物材料中发现的脱氧核糖核酸片段以研究过去古代种群迁移和相互关系,灭绝植物,动物和人类物种的进化历史,以及对跨地理区域的表型特征进行鉴定。斯万特·帕博也因此开创性研究获得了2022年诺贝尔生理学或医学奖。古基因组学的出现将有可能让人类基因组与关系更密切的群体基因组进行比较,进一步推动人类进化研究的进展。

古基因组学研究探究人群遗传结构及其形成机制,是追溯人类起源和演化史最重要的研究手段。古基因组学技术实现了古DNA信息的直接提取和解析, 使人类演化历史的细节得以复原, 修正了在过去传统技术手段支持下得出的相关理论和假说, 对重构整个人类演化史意义重大。此外,古基因组研究还对追踪人类生理学特征演化和控制疾病风险具有深远影响。

但古基因组学中的生物伦理学涉及由于科学家,政府和土著人口之间的复杂关系而造成的在古代人类遗骸研究中出现的伦理问题。此外,古基因组学研究有可能损害地区或个人的历史和身份信息,并揭示有关其后代的隐私。由于这些原因,这类研究仍然是一个敏感的话题。

学科简介

古基因组学(Paleogenomics)是一门通过某些保存完好或已化石化的生物材料中发现的脱氧核糖核酸片段以研究古代种群迁移和相互关系,灭绝植物,动物和人类物种的进化历史,以及对跨地理区域的表型特征进行鉴定的学科。该学科创立以来不断发展,直至2022年,从事古基因组学工作的瑞典遗传学家 Svante Pääbo 被授予了诺贝尔生理学或医学奖,可见古基因组学的重要性日益提高。

研究背景

在现代人类成功进化的遗传基础研究过程中,现代人类的基因组成与密切相关物种基因组的比较研究具有一定必要性。但地球上存有的人类近亲黑猩猩在进化上与现代人类距离较远,因此以黑猩猩基因组作为对照进行研究存在些许问题。而古基因组学的出现将有可能让人类基因组与关系更密切的群体基因组进行比较,进一步推动人类进化研究的进展。

发展历程

1984年,伯克利大学艾伦威尔逊研究小组的罗素首次在灭绝动物夸加的皮肤上克隆出古脱氧核糖核酸片段,并成功获得了两个短的线粒体序列,首次证明了古DNA的存在。当时的人们认为,生物死亡后DNA会迅速降解,只有在特殊情况下形成的标本才能保存住DNA片段,因此古DNA被认为是无法被利用的珍惜宝物。直到聚合酶链式反应(PCR)的问世,这种情况发生了巨大的改变。PCR技术可以直接扩增古DNA片段以产生用于序列分析的分子。除此之外,PCR技术还可以针对能够提供标本最有用信息的基因位点进行定点扩增,从而避免后期的筛选。

到1989年底,尽管古基因组学已经有了一些令人瞩目的成果,但当时的人们还是普遍认为只有在相对年轻的标本(如木乃伊)中才能发现古DNA。1990年间,人们对古生物的兴趣急剧上升。首先是因为三个研究小组几乎同时发现,可以从保存的生物硬组织(骨骼与牙齿)提取古DNA并扩增。这种硬组织材料在考古学古生物学中无处不在。其次,当时在一片距今1600万年前的木兰叶片提取到了叶绿体DNA序列,这一发现打破了人们对古DNA保存年龄的假设。尽管该报告存在争议,因为很难将这种古老的DNA的存在与观察到的水溶液中多核苷酸的衰变率相协调,但它具有积极的影响,迫使人们重新评估DNA保存的时间尺度。它还刺激了不同的研究小组在其他类型的百万年以上的材料中寻找古代DNA,比如琥珀样本、恐龙骨头等。

随着下一代测序技术的问世与发展,以及对古DNA提取、基因文库构建和富集方法的进步,对古DNA的研究正式进入古基因组时代。

研究进展

古人类古基因组学

1997年,德国慕尼黑大学动物学教授Matthias Krings等获得了第一个尼安德特人线粒体DNA(mtDNA)序列,将其与人类mtDNA序列比较并进行了系统发育分析,结果表明尼安德特人序列不属于现代人类的变异。2000年,美国哥伦比亚大学教授Igor V. Ovchinnikov等获取了第二组尼安德特人的mtDNA序列,分析表明其mtDNA类型对现代人类mtDNA库没有贡献,与现代人类的比较并没有为现代人类进化的多区域假设提供证据。同年,德国莱比锡马克斯·普朗克研究所Matthias Krings等获得了第三个尼安德特人mtDNA序列,并进行进一步分析发现尼安德特人的序列多样性相较于类人猿来说受到了限制,序列多样性减少。2008年,马克斯·普朗克进化人类学研究所Richard E。 Green等首次通过高通量测序技术确定了完整尼安德特人线粒体基因组序列。2009年,马克斯-普朗克进化人类学研究所Adrian W。 Briggs等获得了另外五个完整的尼安德特人线粒体基因组。到了2010年,学界发表了两份已灭绝的古人类基因组草案,即尼安德特人的基因组草案,以及神秘的丹尼索瓦人基因组草案。通过这些研究提供了大量更客观的数据,人类古基因组学将有可能解决因考古和古生物学记录不完整而产生的长期争论。同时,它可以帮助建立对人类进化复杂性的更现实的看法。

非古人类脊椎动物古基因组学

基于非古人类脊椎动物的古基因组学研究从10万年前的化石中成功提取出了基因组,打破了古基因组学中更新世的时间障碍,并为从早更新世化石中重建基因组带来了希望。尽管这种aDNA的恢复主要来自于永久冻土和⾼纬度地区留存的动物遗骸,但从这些材料中提取一定规模的基因组数据是有一定可行性的。对于非古人类脊椎动物古基因组学研究不断发展,重点研究领域从已灭绝的猛犸象北极熊、狗、马等的古基因组重建与灭绝和驯化相关的遗传变化,转入到对古人类迁徙轨迹的统计与过去物种种间杂交的相关研究。

植物古基因组学

植物的古基因组学旨在研究植物祖先基因组的进化历史,为古基因组学研究提供了大量有价值的序列数据资源。已有研究公布了 180 多种植物的参考基因组数据,其中甜橙(Citrus sinensis)、黄瓜(Cucumis sativus)和大桉(Eucalyptus grandis)等植物基因组组装到染色体水平;海草(Zostera marina)、鸟巢状欧洲云杉(Picea abies)和孟宗竹(Phyllostachys heterocycla)等植物基因组组装到 Scaffold 水平。古基因组学计算依赖于序列测序准确度和组装水平,低质量的序列会影响古基因组学计算的准确度。如何提高基因组测序和组装的准确度和长度一直是植物古基因组学领域所关注的热点。已有大批量植物基因组测序和重测序项目推动了古基因组学的发展,提出的全基因组复制(whole-genome duplication,WGD)(或古多倍化)事件是植物基因产生新功能化的主要进化推动力,为植物适应基因重复提供原始材料,有益于植物适应生理和遗传改变。

病原菌古基因组学

对病原菌古生物组的研究已获得了包括鼠疫杆菌(Yersinia pestis)、麻风分枝杆菌(Mycobacterium leprae)、天花病毒(Variola)等在内的多种传染源的病原微⽣物的高质量古基因组。这些基因组为研究新出现或重新出现的目标病原体起源、系统发育地理学、致病性、进化和适应性提供了宝贵的启示。

方法变革

脱氧核糖核酸研究前沿技术的探索与运用是开展人类演化研究取得重要突破和发现的前提。这些技术发展迅猛, 许多论文中使用的方法在几年内就会过时。 从新型单链文库准备技术, 到灭绝古人类内源核DNA捕获技术、新一代古基因片段提取技术, 再到沉积物古DNA富集获取技术, 发展时间不过十余年, 技术的迭代为古生物学家解锁了更多研究的可能性,大大延展了古基因组学研究所探知人类遗传历史的时间尺度和细粒度。

兴起——基于分子克隆技术

最早的古脱氧核糖核酸提取和分析的尝试是在PCR技术出现之前。如1980 年,中国湖南医科大学首次从马王堆汉墓汉代女尸中提取出了 DNA 分子。1984年,Higuchi等尝试通过细菌克隆从博物馆斑驴(quagga)的皮肤中获取了229bp的DNA。一年之后,古代人类的 DNA 序列首次被报道。Pääbo 等从一个 2400 年前埃及木乃伊的组织中提取了DNA,基于分子克隆技术,一个多拷贝的 3.4 kb Alu 序列被测序等。这些案例为下一阶段基于 PCR 技术的古 脱氧核糖核酸 研究积累了经验,为这个学科的发展奠定了基础。

发展——基于 PCR 技术

分子克隆技术对于 DNA 的数量和质量的要求非常高。古DNA含量极低且损伤严重的特点,导致该方法效率较低。相比之下,PCR 技术能够非常便利地将低含量的目标基因组片段扩增至能用于下游测序的水平,使古 DNA 研究避免了繁琐的重组和克隆实验。1988 年,PCR 首次成功地应用于获取一个保存在泥炭沼泽中的约 7000 年前的人颅脑中的线粒体脱氧核糖核酸。重要的是,PCR 联合新的提取技术,使得钙化遗骸的DNA研究成为可能,这一突破将古DNA研究领域推到了更为广阔的空间。随后的 20 年,PCR 技术成为了古DNA研究最为常用的手段。

基因组时代——基于高通量测序技术

现代人DNA污染问题使得古 DNA 的研究一度被质疑。直到21世纪初,高通量测序技术的出现,这个状况才得以改变,古 DNA 研究从此进入了高速发展的新阶段。高通量测序避免了对古代样本中获取的 脱氧核糖核酸 进行直接 PCR,而是将提取物用于构建可以测序或者杂交捕获的 DNA 文库。其实验方法主要包括文库构建、探针捕获及测序等步骤。文库构建主要是将测序接头序列连接到 DNA 片段两端,进行一定的 PCR 扩增,之后测序。古 DNA 常用的建库方法包括双链建库、单链建库和针对损伤 DNA 的建库。尽管研究者可以在古 DNA 提取和建库上提高古 DNA 的人源内源性占比,但是获取较高深度古 DNA 的全基因组数据依然花费较高。DNA 捕获技术的出现使古 DNA 研究跨上新的台阶。通过定制不同需求的探针,可以专一性地对特定基因、线粒体全序列、部分常染色体甚至全基因组进行捕获富集。这种方法使得古 脱氧核糖核酸 内源性提高、成本降低,也使获取大规模高质量古 DNA 数据成为现实。

世界人群遗传与迁徙史

非洲起源学说

1987 年,Cann等人对世界各地的147个现代人进行mtDNA 的RFLP分析,在进行系统发育树构建时,发现所有样本分成两大支,较为古老的一支都由非洲群体组成,而非洲以外的群体和部分非洲群体则处于另一支。他们认为所有现代人的mtDNA都起源于非洲的一位女性,被称为“夏娃”。利用线粒体突变速率,他们估算出“夏娃”生活在距今19万到14万年前的非洲,并在约18万至9万年前她的一支后代走出非洲,扩散到世界各地,最终演化成各大陆的现代人群体。这一研究有力地支持了现代人非洲起源的学说。之后,通过mtDNA全序测定,Ingman等人的研究工作依旧证实了这一点。另一方面,通过对早期智人如尼安德特人丹尼索瓦人的 mtDNA 进行分析,Green等人和Krause等人发现这些早期智人出现在与现代人截然不同的更为古老的支系上,并非现代人的直系祖先。以上研究也进一步支持并验证了非洲起源学说。

早期现代人类遗传史

截至2021年,已知最古老的具有部分现代人形态特征的化石(年代约为31.5万年前)来自非洲摩洛哥。五个非洲人群在约25~20万年前迅速分离, 他们为非洲的狩猎采集者、农业游牧人群以及非洲以外人群提供了祖源成分. 在约8~6万年前, 东非、西非和非洲外人群的祖源人群之间又发生了一系列的分离事件。研究发现, 在欧亚地区分布的早期现代人群存在多个支系, 但只有一部分支系和现代人群有关。在极寒的末次盛冰期前后,欧洲、东亚北部和北亚的人群遗传成分均发生了变化, 这可能是人群更替或再次扩张的结果。

近万年现代人群遗传与迁徙

近万年来, 在温暖而稳定的气候下, 人群活动变得更为活跃。全球不同地区的人群呈现出不同的规律,有些地区以内部人群互动为主,呈现出长时间的人群连续性, 比如东亚和澳大利亚;有些地区则出现了多次的人群混合和取代,比如欧洲和欧亚草原地区。非洲地区的古脱氧核糖核酸保存情况较差, 对于相关人群遗传历史的了解还较为有限。来自摩洛哥的约15~5ka年前的个体以及来自东非和南非的约3~1ka前的个体显示,早期非洲人群和近东人群存在遗传联系。非洲发生的较大规模的人群活动包括班图语人群和游牧人群的扩散。前者即使在世界范围,也属于大规模的农业人群扩散事件。

欧亚草原人群不仅向西影响了欧洲人群, 也向东扩散至现在的蒙古中部地区。此外,在青铜时期的中亚地区, 巴克特里亚·马尔吉阿纳文明区(Bactria Margiana Archaeological Complex)的遗传成分来自于伊朗和安纳托利亚农业相关人群、西西伯利亚狩猎采集人群和安的曼群岛狩猎采集人群。在南亚, 印度河流域文明(Indus Valley Civilization)相关人群分别与北部草原人群和印度西南部人群融合形成了古北方印度人和古南方印度人, 从而构成了现代印度人南北遗传渐变的遗传结构。东亚和东南亚约万年前人群已经非常多样化。

人类在约5万年前就抵达了澳洲, 但直到过去数千年, 南岛语系人群才沿着大洋洲岛屿迁徙, 与新几内亚岛人相遇。拉皮塔(Lapita)文化人群携带着南岛语系的祖源成分扩散到大洋洲。后来大部分南岛语系的祖源成分被巴布亚新几内亚人群(Papuan)的祖源成分取代。此外, 也有发表的研究提出从菲律宾马里亚纳群岛扩散的路线。在西伯利亚地区, 末次盛冰期后, 这里的人群主要为古西伯利亚人(Ancient Paleo Siberians), 代表性个体包括约9.8ka前位于西伯利亚东部的Kolyma和约1.4万年前位于贝加尔湖周围的UKY个体。古西伯利亚人是在美洲之外与美洲本土人群最相关的人群。而在全新世早中期, 古西伯利亚人被主要遗传成分为东亚人的新西伯利亚州人(Neo Siberians)所替代。美洲原始人群跨过白令海峡由西伯利亚进入美洲,可能在北美冰盖南部地区分化为古代北部美洲人和古代南部美洲人, 并快速向南美迁徙。约5ka前,美洲北极地区主要为古因纽特人(Paleo-Inuit), 该人群在约八百年前被新爱斯基摩人(Neo-Eskimo)所替代。近万年来,这些世界范围内的人群迁徙与互动,以及后续相关历史事件的影响, 逐步形成了全球人群的大致格局。

中国人群演化与迁徙史

在国际古基因组学领域,有关东亚,尤其是中国史前人群的古基因组研究非常匮乏。中国科学院古脊椎动物与古人类研究所付巧妹研究团队首次针对中国南北方史前人群展开时间跨度最大、规模性、系统性的古基因组研究,通过前沿实验方法成功获取中国南北方11个遗址25个9500-4200年前的个体和1个300年前个体的基因组,揭示了中国人群9500年以来的南北分化格局、主体连续性与迁徙融合史。

该研究发现中国南北方主体人群在9500年前已分化,且显示出远比现今人群有更大的遗传差异性。至少从9500前起,沿着黄河流域直到西伯利亚地区东部草原的人群里,就都携有一种以新石器时代山东省人群为代表的“古北方人群成分”;而在中国大陆东南沿海及毗邻岛屿的人群里,至少从 8400 年前起,就都携有一种以新石器时代福建省人群为代表的“古南方人群成分”,这两种遗传成分截然不同。此后随着时间的推移,这两种遗传成分在南北方人群之间开始发生流动与变化,至少从8300年前起,南北两地人群的分化程度和遗传差异性开始逐渐缩小。古基因组数据显示,在距今8300-7700年的山东人群里已发现有“古南方人群成分”;而在距今8300年的亮岛人群里发现少量的“古北方人群成分”,距今4800-4200年的福建和毗邻岛屿人群较之更早的亮岛人群,具有更多的“古北方人群成分”,由此显示出古北方人群与古南方人群在遗传基因上有着双向影响。这些变化暗示,自新石器时代以来,中国南北方人群之间已有了频繁的互动。

应用

古基因组结合了人类遗传学、群体遗传学和进化研究。这些技术为考古学古人类学中的重大问题提供了答案,比如古人类的进化与扩张、尼安德特人等已灭绝人类种群的基因交流以及动物驯化和野生物种进化对应气候变化的新机制。除此之外,古基因组学也能为现代医学研究提供启示,通过分析古代生物材料样本,追踪在古人类身上发生的疾病、身体健康的某些特征。

人类进化

古基因组学在探究人类遗传结构及其形成机制,追溯人类起源和演化史中是一个重要的研究手段,通过将古脱氧核糖核酸信息提取与解析,进一步发掘人类演化历史细节,修正过去传统技术手段支持下得出的相关理论或假说,对重构人类演化史有着重要的意义。例如通过对来自已灭绝人种尼安德特人丹尼索瓦人的古基因组进行对比分析,发现灭绝古人类与现代人类之间曾多次发生基因融合与交流,而且相当频繁。2022年,学者通过整合不同数据库中现代人类与古代人类的基因组数据,构建了详细的人类遗传图谱,揭示了世界各地的个体之间如何关联。

通过对古生物的基因组进行分析,能够掌握人类疾病风险和适应一些特定环境的遗传因素,明确现代人类疾病和生理功能进化的发展脉络。如新冠病毒易感性相关基因来自于尼安德特人,中国藏族的高海拔适应能力来自丹尼索瓦人以及部分拉丁美洲土著居民携带的II型糖尿病患病风险基因可能来自尼安德特人。

动植物驯化

动物和植物的驯化是人类文化进化的重要一步,是现代农业社会的基础,这一过程被称为“农业革命”,而对驯化动物和植物的遗骸进行基因组学分析可以丰富人类对新石器时代人类文明的理解。例如牛等蹄类驯化物种中发现的差异以及对野生物种的考古记录,通过研究牛等通过对驯化生物遗传多样性的分析,也可以深入了解人类的行为对外在环境的影响。

科学意义

古基因组学探究人群遗传结构及其形成机制,是追溯人类起源和演化史最重要的研究手段。分子生物学在考古上的应用——古脱氧核糖核酸技术,在21世纪前20年间极大地推动了人类起源、动物演化等研究领域的发展。古基因组学技术实现了古DNA信息的直接提取和解析, 使人类演化历史的细节得以复原, 修正了在过去传统技术手段支持下得出的相关理论和假说, 对重构整个人类演化史意义重大。古老型人类(ancient humans)和现代人(modern humans)的遗传交流、早期现代人群遗传史以及近万年现代人群遗传史都逐渐清晰了起来。

此外,古基因学研究辐射影响大, 除基因组学本身外, 还对追踪人类生理学特征演化和控制疾病风险具有深远的影响。 了解人类古基因组有助于生理学家和遗传学家更深刻地认识和发掘现代人的生理功能, 比如功能性基因的溯源, 以及通过对古动物、古病原菌等基因组的分析来掌握人类疾病风险和适应一些特定环境的遗传因素, 厘清现代人疾病和生理功能进化的发展脉络。

生物伦理学

古基因组学中的生物伦理学涉及由于科学家,政府和土著人口之间的复杂关系而造成的在古代人类遗骸研究中出现的伦理问题。此外,古基因组学研究有可能损害地区或个人的历史和身份信息,并揭示有关其后代的隐私。由于这些原因,这类研究仍然是一个敏感的话题。 古基因组学研究可能会产生负面影响,主要是因为伦理原则和实践的表述之间存在差异。事实上,祖先的遗骸在法律和科学上通常被视为“人工制品”,而不是“人类主体”。因此,祖先遗骸的测试用于争端、条约索赔、遣返或其他法律案件时, 对这一主题的重要性和敏感性的承认正在趋于根据不同实际情况进行道德规范及约束,来维护人们祖先遗骸的尊严并避免产生道德伦理问题。最后,另一个令人感兴趣的开创性领域是所谓的“去灭绝”项目,该项目旨在复活灭绝物种,如猛象、恐龙等。由于CRISPR/Cas9技术的兴起,让该项目的实现变得具有一定可能性,但其却与许多伦理问题密切相关。

参考资料

The Nobel Prize in Physiology or Medicine 2022.nobelprize.2023-09-15

..2023-09-20

..2023-09-15

..2023-09-15

..2023-09-15

..2023-09-15

..2023-09-15

..2023-09-15

..2023-09-15

..2023-09-15

..2023-09-15

..2023-09-15

..2023-09-15

..2023-09-20

..2023-09-15

..2023-09-15

..2023-09-15