田韦韦

田韦韦

硕士/中级

收藏

了解NGS前言动态,阅读最新文献,对基因组、群体遗传、转录组、表观组和代谢组等都有一定的认识,希望在这个行业继续前行。

遗骸里的秘密
  近日,发表在Current Biology上的“The Iceman’s Last Meal Consisted of Fat, Wild Meat, and Cereals”,研究者利用显微技术和多组学方法,还原了5000多年前冰人Ötzi的...

  近日,发表在Current Biology上的“The Icemans Last Meal Consisted of Fat, Wild Meat, and Cereals”,研究者利用显微技术和多组学方法,还原了5000多年前冰人Ötzi的最后一餐,发现他的饮食中脂肪含量相当高,胃里填充着野山羊、赤鹿、小麦和欧洲蕨等食物。

  5000多年前古人死前吃了什么都能检查出来,还有什么是我们做不到的?或许某一天,我们真如《侏罗纪公园》一样,利用古DNA技术复活了恐龙?霸王龙、三角龙、剑龙、棘龙、翼龙...

  随着古DNA技术的发展,我们已经获得了大量生物的古DNA信息,甚至还重建了某些已经灭绝的物种基因组,这不仅有利于我们了解物种的起源和进化,更能够帮助我们找出物种灭绝的真正原因,进而更好地对现存物种实施保护。

  人类从未停止过对古人类的探索,对尼安德特人、丹尼索瓦人等开展的古DNA研究已经逐渐厘清这些人群与现代人类之间的遗传联系,在北京房山田园洞发现的男性遗骸,揭开了我国古人类DNA研究的序幕。

图片1.png

1 田园洞遗址图

  研究发现田园洞人是古东亚人,但他并不是现代东亚人的直接祖先,而是现代东亚人的直接祖先的亲戚。田园洞人和来自比利时的古欧洲人具有遗传上的联系,然而这种联系并未在其他古欧洲人中发现,推测田园洞人和来自比利时的古欧洲人都与一个未知人群存在联系,这个未知人群与他们的祖先发生过基因交流。田园洞人与南美洲的土著人群比其他地方的美洲土著人有着更近的遗传联系。最后,作者勾勒出一幅3.5万年前欧亚大陆早期现代人分布图,包括至少4个人群,对当代欧洲人有遗传贡献的Kostenki14,对当代东亚人有遗传贡献的田园洞人,目前没有观察到对任何当代人群有明显遗传贡献的Ust-IshimOase1,以及假设出来的对当代欧洲人和古代近东人群都有遗传贡献的未知人群(basal Eurasian[1]

图片2.png

2 田园洞人与其他人群关系示意图

  狗作为人类最好的朋友,人类也从未停止过对它的探索。狗被驯化了很长时间,与狼、不同品种的狗之间进行了多次杂交,导致现代狗基因组中很多基因有着完全不同的来源,因而,利用古DNA技术对古代狗进行研究,有助于我们了解狗的起源。

 

图片3.png

3 美洲狗

  研究者对来自北美和西伯利亚古代狗的71个线粒体和7个核基因组进行测序,并结合已发表的145个现代和古代犬科动物线粒体数据和45个现代犬科动物全基因组数据进行研究,结果表明美洲狗并非起源于北美狼,而是形成了单系血统,可能起源于西伯利亚,与人们一起到达美洲,在欧洲人到来之后,美洲本土狗几乎完全消失,在现代狗群中留下了极少的遗传遗产,与美洲狗关系最为密切的是犬传染性性病瘤(CTVT),来源于一个8000年前的狗[2]

图片4.png

4 美洲狗与其他狗关系示意图

  起源和进化一直是进化生物学研究的重点。“我是谁?我来自何方?我去向那里?”,随着现代技术的发展,我们不再仅仅依赖于化石研究物种起源,而是借助于更加可靠的线粒体DNA和核基因组技术弄清物种的起源,如何由简单到复杂、低级到高级,怎样应对残酷的自然选择...

  猛犸象被认为是生活在更新世中后期的种群数量最丰富的巨型动物,然而在由更新世向全新世转变时期(约11000年前),猛犸象在地球上几乎消失,只有一个非常小的群体迁徙到弗兰格尔岛上存活下来,最后一批猛犸象被认为是距今4000年前生活在弗兰格尔岛的猛犸象。

图片5.png

5 猛犸象

  研究者对两头猛犸象(距今约4300年的弗兰格尔岛的猛犸象臼齿,距今约44,800年的西伯利亚的猛犸象软组织)的基因组进行分析,发现两头猛犸象经历了相似的种群变迁轨迹,在更新世的早期或中期(189,000-1,646,000年前),猛犸象经历了一次种群瓶颈效应,而后在更新世向全新世转变期间(8,000-71,000年),弗兰格尔岛的猛犸象种群又经历了一次严重的种群消减。对两头猛犸象基因组进行比较,弗兰格尔岛猛犸象基因组纯合子区域升高了2,800%,杂合率降低了20%,文章认为,弗兰格尔岛的猛犸象,作为地球上最后的猛犸象群体,在种群灭绝之前经历了遗传多样性的降低[3]

图片6.png

6 猛犸象全基因纯合度和杂合度估计

  旅鸽,又称北美旅鸽,它还有一个很悲伤的名字-漂泊鸠,也许正因为这样一个悲伤的名字,注定了它在短暂的时间内灭绝的悲惨命运。191491日,最后一只旅鸽玛莎终老于美国辛辛那提动物园,旅鸽这一物种从此灭绝了。

图片7.png

7 最后的旅鸽

  研究者利用41只旅鸽的线粒体基因组推断了旅鸽种群的历史数量,发现在过去两万年内,旅鸽有效群体大小估计值为1300万。进一步对4只旅鸽基因组(2只旅鸽数据由最新测序获得,2只旅鸽数据从数据库中获得)和2只斑尾鸽基因组进行比较,研究发现:在选择的作用下,旅鸽的遗传多样性低(染色体两端较高的遗传多样性与鸟类染色体两端的重组较高有关),除去染色体两端的部分,大多数区域遗传多样性甚至比斑尾鸽还低,遗传多样性的降低导致旅鸽无法适应环境的变化,最终灭绝[4]

图片8.png

8 旅鸽和斑尾鸽的分布及遗传多样性比较

  猛犸象和旅鸽的灭绝都与遗传多样性的降低有关。过去对于濒危物种的保护主要停留在宏观层面,如就地保护、迁地保护等,缺少对其内在机理的研究,如遗传多样性、基因交流等。随着高通量测序技术的发展,可以对这些物种进行全基因组测序,通过群体结构、遗传多样性、基因流等信息,探讨物种的演化机制,为它们的保护提供理论依据。

  2017年第19届国际植物学大会期间,深圳华大生命科学研究院联合多位植物学领域的权威专家共同发起了万种植物基因组计划,该计划引起了全社会的关注,并获得了Nature Plants[5]的高度评价,希望这一行动能够推进生物多样性、进化和生态保护的研究,共建和谐、多样的生物圈。

图片9.png

9 Nature Plants 发文关注万种植物基因组计划

 

参考文献:

1.Yang M A., Gao X, Theunert C, et al. 40,000-Year-Old Individual from Asia Provides Insight into Early Population Structure in Eurasia. Current Biology, 2017

2.Leathlobhair M N, Perri A R., Irving-Pease E K., et al. The evolutionary history of dogs in the Americas. Science, 2018

3.Palkopoulou E, Mallick S, Skoglund P, et al. CompleteGenomesRevealSignaturesofDemographic

and Genetic Declines in the Woolly Mammoth. Current Biology, 2015

4.Murray G G. R., Soares A E. R., Novak Ben J., et al. Natural selection shaped the rise and

fall of passenger pigeon genomic diversity. Science, 2017

5. Twyford A D.. The road to 10,000 plant genomes. Nature Plants, 2018


古基因组
1035浏览
1点赞
0条评论
收藏
收起
登录后才能评论哦
Nature Ecology & Evolution--加利福尼亚虎斑猛水蚤基因组及群体进化
  真核生物中,核基因编码的多数蛋白质和线粒体基因编码的少数蛋白质共同作用确保其功能实现(如氧化磷酸化和能量途径等),通常认为线粒体-核等位基因处于强烈的选择压力之下,与线粒体基因相互作用的核基因必须与线粒体基因共同进化,以补偿线粒体基因中积累的有...

  真核生物中,核基因编码的多数蛋白质和线粒体基因编码的少数蛋白质共同作用确保其功能实现(如氧化磷酸化和能量途径等),通常认为线粒体-核等位基因处于强烈的选择压力之下,与线粒体基因相互作用的核基因必须与线粒体基因共同进化,以补偿线粒体基因中积累的有害突变,当线粒体-核基因不相容时,可能会导致内在的生殖隔离,这种现象已经在多种生物中有过报道,包括动物、真菌和酵母等。

图片1.png

1  线粒体-核基因不相容[1]

  桡足类,在分类学上隶属于节肢动物门、甲壳纲、桡足亚纲,在海洋、淡水或半咸水中广泛分布。桡足类是地球上器官最为丰富的物种,其基因组具有巨大的价值,目前,只有少数桡足类物种基因组组装并发表,包括T. japonicus[2]574 Mb)和T. kingsejongensis [3]295 Mb)。T. californicus(加利福尼亚虎斑猛水蚤)基因组尤其重要,因为该物种表现出强烈的线粒体-核基因不相容,是研究杂种衰退的重要模型。

  本研究利用 PacBio+Illumina+ Chicago+ Hi-C组装出一个高质量的桡足类参考基因组,大小在181-191.15 Mb,并将99%的基因组序列挂载至12条染色体。利用MAKER对组装的参考基因组进行功能注释,共预测了15,646个基因,14,23391%)个基因得到转录组数据的支持。

  利用节肢动物的直系同源基因对黑腹果蝇、蜜蜂、淡水枝角水蚤和加利福尼亚虎斑猛水蚤进行分析,发现这四种动物共有的基因家族为4,803,淡水枝角水蚤和加利福尼亚虎斑猛水蚤共有的基因家族为5,767,加利福尼亚虎斑猛水蚤特有的基因家族为661,其中涉及离子转运和受体活性的基因数目明显扩张,如FMRFamide受体基因在大多数节肢动物中都是单拷贝,但在加利福尼亚虎斑猛水蚤中至少检测到60个拷贝。

图片2.png

2  加利福尼亚虎斑猛水蚤基因家族及扩张分析

  除此之外,作者还对另外7个加利福尼亚虎斑猛水蚤种群进行重测序,发现种群间存在极端的线粒体DNA分歧,在37个线粒体基因组中,13个蛋白编码基因核苷酸分歧度最高,22tRNA基因核苷酸分歧度差异较大,0-30%。作者进一步通过dN/dS(非同义替换率与同义替换率的比值)和DoS(选择方向)研究进化动力造成的差异,发现线粒体基因组dN/dS比值为0.326,远低于1,表明纯化选择促使了线粒体的进化,加利福尼亚虎斑猛水蚤线粒体dN/dS比值是动物(比较了1,855个动物)中最高的,核苷酸多态性分析也证实了纯化选择的广泛模式。

  编码不同呼吸链复合物的基因在群体内和群体间都经历了不同的选择压力,与其他呼吸链复合物相比,编码复合物I的基因的dN/dSDoS值更高,受到了强烈的正选择(ω= 4.39),尽管编码复合物IV的基因的dN/dS值较低,但也受到了正选择(ω= 1.36)。

图片3.png

3  线粒体DNA分歧和进化

  利用dN/dS估计8个加利福尼亚虎斑猛水蚤种群核基因(13,538)编码序列的进化速率,共分为四组进行比较:①mt-RPs(线粒体核糖体蛋白)VS cyt-RPs(细胞质核糖体蛋白),②mt-ARSs(线粒体氨酰-tRNA合成酶)VS cyt-ARSs(细胞质氨酰-tRNA合成酶),③氧化磷酸化复合物I, III, IVV VS氧化磷酸化复合物II,④与线粒体DNA编码产物相互作用的基因VS与线粒体DNA编码产物几乎没有任何作用的基因。

  研究结果显示氨基酸替换率在与线粒体DNA编码产物存在相互作用的蛋白中较高,cyt-RPs中多达15个基因的氨基酸替换率(dN/dS=0)不存在变化,与先前的研究结果一致[4]dN/dS的差异可能受蛋白质功能差异的制约,而非补偿性进化,基因表达水平被认为影响蛋白质的这种制约并与dN/dS呈反比关系。cyt-RPs基因的表达水平显著高于mt-RPs基因,而mt-RPs的进化速率却显著高于cyt-RPs,在ARSs(氨酰-tRNA合成酶)中观察到类似的情况,与线粒体DNA编码的tRNAs有相互作用的ARSs具有更高的dN/dS比值。

  在氧化磷酸化途径中,复合物II是唯一不含线粒体DNA编码亚基的复合物,该研究结果与补偿进化模式一致,复合物I, III, IVdN/dS高于复合物II,虽然复合物IIV与复合物II差异并不显著。

  最后,对核编码的MTPs(线粒体靶向蛋白)进行注释,根据核基因与线粒体基因是否具有相互作用,将细胞器内的蛋白质分为两大类,核基因编码蛋白参与mtDNA编码产物的通路,核基因编码蛋白不参与这些通路,发现与mtDNA具有相互作用的核基因编码蛋白具有更高的进化速率。

图片4.png

4  线粒体和核基因中的 dN/dS 比较

  利用CODEML模型对4,863 个直系同源基因进行分析,结果显示T. kingsejongensis中有34个基因受到正选择,T. japonicus中有52个基因受到正选择,而加利福尼亚虎斑猛水蚤在与T. japonicus分化后,有591个基因受到正选择,主要富集在DNA代谢通路,如复制、重组和修复等,此外,还有28个核基因编码的MTPs受到正选择(7个与mtDNA具有相互作用)。结果表明,加利福尼亚虎斑猛水蚤在与T. japonicus分化后,其基因组普遍经历了适应性进化,包括线粒体转录和翻译途径,在mt-RPs和氧化磷酸化基因中检测到强烈地适应性进化的证据。

图片5.png

5  4种已测序虎斑猛水蚤的系统发育关系

  动物线粒体核苷酸替代率通常比核基因组中的核苷酸替代率高10倍以上,许多核基因编码的蛋白质首先被导入线粒体,再与线粒体DNA或其编码的蛋白质、RNA相互作用,因此,线粒体基因组的快速进化可促使核基因的进化。

  本研究报道了加利福尼亚虎斑猛水蚤群体中mtDNA极高的分化水平,并揭示了这种分化对相关核基因的潜在影响,前人的相关研究仅包含氧化磷酸化途径相关组分,本研究还在tRNA(翻译期间),rRNA(核糖体组装期间)和mtDNA(复制和转录期间)中发现了类似机制,本研究结果支持这样的假设:快速线粒体进化驱动孤立种群内的补偿性核进化,从而提供了引起内在生殖隔离的潜在重要机制。

 

参考文献:

1.Hui J H. L..Copepod incompatibilities. Nature Ecology & Evolution, 2018.

2.Lee J, Rhee J, Kim R, et al. The copepod Tigriopus japonicus genomic DNA information (574 Mb) and molecular anatomy. Marine Environmental Research, 2009.

3.Kang S, Ahn D, Lee J, et al. The genome of the Antarctic-endemic copepod,Tigriopus kingsejongensis. GigaScience, 2017.

4.Barreto F S., Burton R S.. Evidence for Compensatory Evolution of Ribosomal Proteins in Response to Rapid Divergence of Mitochondrial rRNA. Molecular Biology and Evolution, 2012.

5.Barreto F S., Watson E T., Lima T G., et al. Genomic signatures of mitonuclear coevolution across populations of Tigriopus californicus. Nature Ecology & Evolution, 2018.

 




文献解读
1983浏览
1点赞
0条评论
收藏
收起
登录后才能评论哦
牛,你真的很牛
  又到点外卖的时间了,中午吃什么呢?牛肉面?咦,牛,对哦,我可以写一篇有关牛的文章,正愁不知道写啥的我突然眼前一亮,想想看过的牛的文献的确不少,Science、Nature Genetics、Nature Ecology & Evolut...

  又到点外卖的时间了,中午吃什么呢?牛肉面?咦,牛,对哦,我可以写一篇有关牛的文章,正愁不知道写啥的我突然眼前一亮,想想看过的牛的文献的确不少,ScienceNature GeneticsNature Ecology & EvolutionNature Communications...

  参考基因组是物种功能研究的基础。早在2009[1]牛的参考基因组就已经公布,研究人员利用全基因组鸟枪法和BAC文库对雌性海福特牛进行全基因组测序,组装出基因组大小2.87 Gbcontig N50 48.7 kbscaffold N50 1.9 Mb,并将90%的基因组序列定位到29条常染色体和X染色体上,共注释出22,000多个蛋白质编码基因,其中,14,345个直系同源基因在人、狗、老鼠等其他哺乳动物中中具有对应的基因,还鉴定了1217个胎盘哺乳动物特有的直系同源基因,在牛的进化和驯养过程中,基因数量和构成的变化影响了牛的生物学系统并对它们的繁殖、免疫能力、乳汁分泌和消化造成最为显著的影响。

图片1.png

Fig 1  Protein orthology comparison among genomes of cattle, dog, human,

mouse, rat , opossum and platypusscience, 2009

  牦牛与牛具有紧密的关系,都属于牛科牛属,但牦牛与牛却又不同,牦牛主要生活在青藏高原等极端海拔地区,而牛则广泛分布在世界各地。2012年刘建全等[2]破译了雌性牦牛基因组,利用65XIllumina HiSeq 2000数据,组装出基因组大小2,657 Mbcontig N50 20.4 kbscaffold N50 1.4 Mb,牦牛基因组中共预测了22,282个蛋白质编码基因,利用13,810个直系同源基因对牦牛、牛、人和狗进行比较基因组分析,发现362个基因是牦牛与牛共有的,100个基因是牦牛特有的,进一步研究发现牦牛中出现大量扩增的基因家族,主要参与嗅觉、味觉和能量代谢等途径,可能与牦牛适应极端海拔相关,牦牛基因组的破译为高海拔动物适应性研究提供了参考。

图片2.png

Fig2  Adaptive evolution in the yak genomenature genetics, 2012

  进化一直是牛、狗等动物的重点研究内容,上述两篇牛的基因组文章也都包含了进化,牛和牦牛基因组的公布有助人们更深入地了解其驯化过程。西门塔尔牛原产于瑞士西门塔尔,资料记载西门塔尔牛是由德国大型牛和瑞士本地牛杂交而来,是世界上分布最广、数量最多的乳肉役兼用品种之一。Qanbari S[3]43头西门塔尔牛进行重测序,通过iHSCLR确定了106个受选择区域,主要与毛色、感官知觉等相关,通过GWAS关联分析确定了与毛色相关的区域,发现与受选择区域重叠,研究结果表明在西门塔尔牛的驯化过程中与毛色、感官知觉等相关的基因受到了选择。

图片3.png

Fig3  Classic Selective Sweeps Revealed by Massive Sequencing in Cattleplos genetics, 2014

  自从人类定居青藏高原,藏族人民就开始将野牦牛驯化成家牦牛,经过几千年的人工选择以及与黄牛的杂交,家牦牛发生了一系列的变化。此前的研究和考古证据显示,青藏高原牦牛驯化时间约在4500年前,而刘建全等[4]研究结果表明野牦牛的驯化比此前认为的更早,通过重建牦牛驯化的群体动态和群体分化历史,发现牦牛驯化开始于7300年前,并检测到驯化牦牛数量在3600年前增长了6倍,牦牛驯化及其驯化种群的大规模增长时间恰好与青藏高原史前人群两次大规模增长相吻合,另外,通过π、Tajimas D等确定了182个受选择区域,这些基因主要与温顺行为和经济性状等相关。

图片4.png

Fig4  Demographic history of yaknature communications, 2014

  牛是非洲经济发展和社会活动的重心,不仅可以作为食物,还可以作为劳动力,在非洲社会活动中具有重要的作用,现今非洲大陆分布有150种牛,主要品种有3种:黄牛,瘤牛和二者的杂交种(著名的非洲桑格牛)。Kim J[5]48头非洲土著牛进行重测序,并与已经公布的53头商业品种牛进行联合分析,研究发现欧洲黄牛与桑格牛之间存在基因交流,通过XP-EHHXP-CLR研究发现非洲牛与高温胁迫、病原微生物相关的基因受到正选择,说明非洲牛在进化过程中适应了非洲炎热、干旱和多病害的环境。

图片5.png

Fig5  Signatures of selective sweep at the NDama HCRTR1, SLC40A1, EPB42, and STOM gene regionsGenome Biology , 2017

  现代驯养的牛可以分为两大地理类群:黄牛和瘤牛,两种牛大约在25W年前分离。黄牛最早在8000-10000年前开始在新月地区驯化,瘤牛6000-8000年前在印度河谷被驯化。为了确定中国黄牛的遗传特征,Zan L[6]6个不同地理来源的中国黄牛(46头)、安格斯红牛RAN18头)、JBC11)进行重测序,结合下载的瘤牛数据进行分析,通过系统发育树将黄牛和瘤牛分为两组,而秦川牛位于这两个分支中间,含有两个祖先组成部分,利用PSMC模型推算出黄牛和瘤牛在大约160万年前开始分化,在此期间,喜马拉雅山的活动建立了地理隔离,中国牛品种和其他牛的分化大概在50W年前,恰好与帕米尔高原隆起有关,进一步通过选择清除分析发现与毛皮颜色、乳品性状、肉产量和肉质量等相关的基因受到了选择。

图片6.png

Fig6  Population genetic analysisMolecular Biology and Evolution , 2017

  牛是东亚重要的驯养动物资源,中国约有53个土著牛种,现代牛来自其野生祖先的多次驯化,发生在距今约1万年前,近东和印度河流域是牛的两个主要驯化中心,分别驯化了普通黄牛和驼峰牛。Chen N[7]22个地方品种的黄牛(111头)和古代黄牛样品(8头)进行重测序,结合下载的国外27个牛种(149头)全基因组数据进行分析,结果表明全世界家牛至少可以分为五个明显不同的类群,即为欧洲普通牛、欧亚普通牛、东亚普通牛、中国南方瘤牛和印度瘤牛,中国黄牛地方品种来源于其中的三个血统,进一步发现中国南方瘤牛和青藏高原的普通牛平均每个个体分别被导入了其近缘物种爪哇野牛的2.9%和牦牛的1.2%的血统,从而使得迁徙到中国南方和青藏高原的黄牛各自提高了对所在环境的适应性。该研究为牛的进化及其适应东亚新环境提供了新的见解。

 

图片7.png

Fig7  Autosomal and Y-chromosome evidence for the origin of

modern cattlenature communications , 2018

  牛属现存物种,包括普通牛、瘤牛、大额牛、印度野牛、爪哇野牛、牦牛、欧洲野牛和美洲野牛等,野牛、美洲野牛和欧洲野牛被认为是仅存的未被驯化的牛。Zhang Y[8]对大额牛、印度野牛、爪哇野牛、欧洲野牛和美洲野牛进行了重测序,结合另外98个个体数据,确定了牛属之间的系统发育关系,系统发育树显示大额牛是一个独立的物种或亚种。进一步研究发现牛属之间存在广泛的基因交流,在家牛中受到选择的基因(如MITF)被导入到了牦牛基因组中,部分藏黄牛基因组中的低氧诱导通路基因(如EGLN1EGLN2HIF3a)从牦牛中获得,研究结果表明基因交流是物种适应环境的重要方式之一,同时也是野生物种驯化的重要手段。

 

图片8.png

Fig8  Phylogenetic tree and genetic introgression of species in

the Bos genusNature Ecology & Evolution , 2018

  牛的驯化对人类文明产生了重大影响,在驯化过程中,与毛皮颜色、乳品性状、温顺行为和产量性状等相关的基因受到了强烈的选择,也正是由于牛的驯化,人类的餐桌上多了许多美食,生活质量得以提升。

参考文献

[1]Elsik C G., Tellam R L., Worley K C.. The Genome Sequence of Taurine Cattle: A Window to Ruminant Biology and Evolution. Science, 2009.

[2]Qiu Q, Zhang G, Ma T, et al. The yak genome and adaptation to life at high altitude. Nature genetics, 2012.

[3]Qanbari S, Pausch H, Jansen S, et al. Classic Selective Sweeps Revealed by Massive Sequencing in Cattle. PLOS Genetics, 2014.

[4]Qiu Q, Wang L, Wang K, et al. Yak whole-genome resequencing reveals domestication signatures and prehistoric population expansions. Nature communications, 2012.

[5]Kim J, Hanotte O, Mwai O A, et al. The genome landscape of indigenous African cattle. Genome Biology, 2017.

[6]Mei C, Wang H, Liao Q, et al. Genetic Architecture and Selection of Chinese Cattle Revealed

by Whole Genome Resequencing. Molecular Biology and Evolution, 2017.

[7]Chen N, Cai Y, Chen Q, et al. Whole-genome resequencing reveals world-wide ancestry and adaptive introgression events of domesticated cattle in East Asia. Nature communications, 2018.

[8]Wu D, Ding X, Wang S, et al. Pervasive introgression facilitated domestication and adaptation in the Bos species complex. Nature Ecology & Evolution, 2018.


牛进化文章
1350浏览
0点赞
0条评论
收藏
收起
登录后才能评论哦
“澳洲熊猫”--考拉高质量基因组
  澳大利亚是一个神奇的国度,这里生活着大多数有袋动物,包括袋鼠、负鼠、考拉等等,就连澳大利亚的国徽上都刻有有袋动物,可见这些动物在澳大利亚的地位完全不亚于大熊猫在我国的地位,因为我国国徽上可没有大熊猫的图案~Fig 1 澳大利亚国徽  ...

  澳大利亚是一个神奇的国度,这里生活着大多数有袋动物,包括袋鼠、负鼠、考拉等等,就连澳大利亚的国徽上都刻有有袋动物,可见这些动物在澳大利亚的地位完全不亚于大熊猫在我国的地位,因为我国国徽上可没有大熊猫的图案~

图片1.png

Fig 1 澳大利亚国徽

  所谓有袋动物,指的就是长着育儿袋的哺乳动物(后兽亚纲)。有袋动物的胎儿在母体内发育时间很短,以早产儿的形式出生,在雌性有袋动物腹部的育儿袋中吮收母乳继续发育。有袋动物中,我最爱的莫过于考拉了,它们体型肥胖,毛又软又厚,圆滚滚的大脑袋,再加上光秃秃的大鼻子,活脱脱的“树林萌主”。由于栖息地丧失和疾病的广泛传播,考拉是树袋熊科唯一现存物种,如果不对其进行保护,如此可爱的萌物有一天可能也会消失,我们的子孙后代只能通过影片才能看到,就像现在的我们看侏罗纪公园一样,这是一个多么忧伤的故事...

图片2.png

Fig 2 考拉

  据估计,澳大利亚目前的考拉数量仅为329,000144,000-605,000),且还在持续锐减,其原因是由于栖息地的丧失和衣原体的感染,为了更好的保护考拉这一珍惜动物,澳大利亚博物馆、墨尔本大学和悉尼大学等机构对考拉进行了基因组测序,相关成果于20180702日发表在Nature Genetics

图片3.png

Fig 3 考拉基因组发表在Nature Genetics

  研究者对自新南威尔士州东北部麦夸里港的雌性"Pacifc Chocolate"进行基因组测序,利用57.3XPacbio数据进行考拉基因组组装,通过30XIllumina数据进行polish,再利用BioNano生成scaffold,最终组装出3.42 Gb考拉基因组,Contig N50 11.6 Mb,最长的Contig40.6 Mb,结合染色质免疫共沉淀和着丝粒蛋白的测序结果,组装出一个完整且连续的有袋动物参考基因组(跨越了着丝粒重复区域)。作者进一步利用哺乳动物共有的4,104个单拷贝直系同源基因进行完整性评估,发现考拉基因组完整性达95.1%,与人参考基因组相当(GRCh38,完整性94.1%)。

图片4.png

Fig 4  考拉基因组和已发表的有袋类动物和单孔类动物基因组的比较

  考拉几乎完全以桉树叶片为食,这种饮食习惯对大多数哺乳动物来说是致命的,因为桉树叶片含有丰富的次生代谢物(如萜类和萜烯类化合物)。通过对人、老鼠和狗等哺乳动物进行比较基因组研究,发现与解毒相关的细胞色素P450亚家族(CYP2Cs)在考拉基因组中出现了两段大规模的扩增,且这个区域经历了串联重复和纯化选择,结合两只考拉不同组织部位的转录组数据,发现CYP2C基因在肝脏中高表达,推测其可能参与了次生代谢物的解毒。

图片5.png

Fig 5  细胞色素P450亚家族(CYP2Cs)分析

  虽然大多数食草动物都需要通过解毒一种或多种化合物来避免植物的化学防御反应,但桉树复杂的次生代谢物及丰富的萜烯类,以至考拉需要更加专业的检测能力和对次生代谢物的解毒能力。通过对考拉的嗅觉和味觉相关基因家族进行分析,发现多种基因家族发生扩张,这增加了其对食物的选择能力。犁鼻V1R相关的基因发生扩张,在考拉基因组中发现六个拷贝,在袋獾和灰色短尾负鼠中只存在一个拷贝,在塔马尔沙袋鼠、人和老鼠等动物中没有发现。味觉受体基因家族出现扩张,使得考拉能够选择那些营养含量最高、含水量最高的树叶食用。考拉这种“品尝水”的能力可能与水通道蛋白5基因的扩张相关。

  TAS2R基因组在品尝苦味中具有重要作用,能够识别毒素结构(如萜烯,酚类和糖苷类),相比于其他有袋动物,考拉拥有更多的TAS2Rs基因,并且在所有哺乳动物中也是最多的。感知甜味和鲜味的TAS1R基因曾在专一食性的动物中有过报道(如大熊猫),然而在考拉基因组中,AS1R基因的功能还有待确定。

图片6.png

Fig 6  考拉和其他哺乳动物的嗅觉和味觉受体研究

  刚出生的考拉大约是菜豆大小,体重小于0.5克,它爬进母亲的后开口袋吮吸乳汁,并在那里度过6-7个月。结合基因组、乳腺转录组和乳汁蛋白组,发现四个晚期分泌蛋白(LLP)基因,允许有袋动物在哺乳阶段微调乳蛋白成分以满足幼崽的需求,还发现一种新的有袋基因MM1,推测其与有袋动物乳汁的抗菌性相关,此外,还检测到另外一个与抗菌相关的基因家族--cathelicidins

图片7.png

Fig7  两个分泌蛋白基因家族示意图和晚期分泌蛋白系统发育树

  考拉曾在澳大利亚东部大陆广泛分布,而如今却只分布在东部沿海地区,一些考拉种群正濒临灭绝,对这些种群实施保护的一个重要挑战就是杜绝衣原体的感染。在昆士兰州和新南威尔士州的野生动物医院每年抵达的1000多只考拉中,有40%患有晚期衣原体疾病,无法康复。对考拉基因组注释发现大量与免疫相关的基因,包括包括组织相容性复合物(MHC)、T细胞受体(TCR),免疫球蛋白(IG)、自然杀伤细胞受体(NK)等。进一步对感染和未感染衣原体的考拉进行转录组测序,发现患病动物中有1,508个基因上调,685个基因下调,这些上调基因主要与一系列免疫途径相关。在参与接种衣原体疫苗的考拉中发现MHCII DMADMB基因和CD8-a基因参与了不同的免疫反应,这有望指导衣原体疫苗的开发。

图片8.png

Fig8 考拉组织相容性复合体(MHC)和T细胞受体(TCR)示意图及衣原体感染的RNA-seq分析

  利用PSMC对三只考拉(雌性"Pacifc Chocolate"、雌性“Bilbo”和雄性“Birke”)进行分析,数据显示现代考拉种群数量在350,000年前出现扩张,随后在30,000-40,000年前数量锐减,这与澳大利亚大多数物种(包括巨型动物的灭绝)的减少一致,考拉也是这个期间受到影响的物种之一,但并未导致其灭绝。

  对来自澳大利亚全国的49只野生考拉进行遗传多样性分析(1,200 SNPs),发现南部种群遗传多样性较低,这可能与布里斯班河、克拉伦斯河和猎人谷造成的生物地理隔离(导致近亲繁殖)有关。北部种群(如新南威尔士和昆士兰洲的考拉种群正经受最严重的威胁,濒临灭绝)显示出较高的遗传多样性水平。通过对北部种群和南部种群的多样性分析发现,不受监管的孤立种群的遗传多样性较低。这些研究表明通过建立栖息地走廊,促进基因交流,是保护考拉的有效手段。

图片9.png

Fig9 全基因组标记揭示考拉种群信息

  考拉基因组是迄今为止最高质量的有袋动物参考基因组,揭示了考拉如何实现对桉树叶片的解毒,对考拉免疫系统的了解有助于找出衣原体易感基因,研发疫苗进而预防衣原体感染,结合考拉种群的多样性,提出了建立栖息地走廊等保护措施。该研究对考拉的保护意义重大,也希望我们人类不要再侵占考拉的栖息地,还它们一片广阔的树林!

参考文献:Johnson R N., OMeally D, Chen Z, et al. Adaptation and conservation insights from the koala genome.Nature genetics, 2018.


考拉基因组
1924浏览
0点赞
0条评论
收藏
收起
登录后才能评论哦
学霸都在用的文献下载神器
1.PubMed   NCBI(美国国家生物技术信息中心)相信大家都不陌生,其功能强大,Pubmed官方系统中储存了大量的文献资料,不仅能够进行文献搜索,还可以免费下载大部分文献,Pubmed涵盖的内容相当全面。   PubMed网址:ht...

1.PubMed

  NCBI(美国国家生物技术信息中心)相信大家都不陌生,其功能强大,Pubmed官方系统中储存了大量的文献资料,不仅能够进行文献搜索,还可以免费下载大部分文献,Pubmed涵盖的内容相当全面。

  PubMed网址:https://www.ncbi.nlm.nih.gov/pubmed

图片1.png

2.百度学术

  “有问题,找度娘”,不知道这是几时养成的习惯,所以搜索文献时,第一反应也是百度,不过百度也还真没让我失望。通过百度学术可以检索到收费和免费的学术论文,涵盖信息全面,不仅可以通过标题、关键字和作者等进行检索,还能将检索结果按照相关性、被引频次和发表时间等分别排序,文献很复杂,百度学术更懂你。

  百度学术网址:http://xueshu.baidu.com/

图片2.png

3.Google学术搜索

  提到百度,大家肯定都会想到全球最大的搜索引擎Google,同百度学术一样,Google学术搜索也可以进行文献搜索,Google学术镜像网址较多,操作方便、检索快速,大家可自行尝试。

  Google学术搜索网址:https://ac.scmor.com/

图片3.png

4.学霸图书馆

  正所谓“舍不得孩子,套不住狼”,“舍不得money,办不了会员”。一般看某一类文献之前,我都会先下载硕博论文看看,对其研究背景、技术方法等有个基本的了解,然后再看CNS文章,这样可以达到事半功倍的效果,可自从毕业之后就再也不能愉快的用CNKI、万方、维普等数据库搜索硕博论文了,机缘巧合下知道了学霸图书馆,我便毫不犹豫地花了99块钱注册了个终身免费会员,如果需要帮忙下载中文文献,可以联系小编哟~

  学霸图书馆网址:http://www.xuebalib.com/

图片4.png

5.SCI-HUB

  说到文献下载,大家应该都知道SCI-HUB,在PubMed数据库中查询到的文献,如果没有文章链接,可以通过SCI-HUB获得。但SCI-HUB域名经常变更,就小编知道的就包括http://sci-hub.tv/http://sci-hub.tw/http://sci-hub.la/http://www.sci-hub.cn/等等,小编对其也是爱恨交加,但却也从未忘记,SCI-HUB对于我来说也算是“旧爱”了吧。小编整理了不用翻墙、不使用VPN均能访问的SCI-HUB网址,希望对大家有所帮助。

  SCI-HUB网址:https://sci-hub.org.cn/http://sci-hub.tw/

图片5.png

6.GeenMedical

  如果SCI-HUB对于我来说是“旧爱”的话,那么GeenMedical便是“新欢”,自从认识GeenMedical,我对它的爱就一发而不可收~

小编前几天一直想下载一篇文献,但通过众多途径都没能下载,于是扫一扫加了根哥的微信,没想到根哥真的就把这篇文献下载发我了,万能的根哥,为你打call~

  GeenMedical网址:http://www.geenmedical.com/

图片6.png

7.Library Genesis

  Library Genesis这个网站知道的人可能不是特别多,我也是偶然间发现的,网站上文献资料十分全面,大多最新的文献都可以免费下载,而且页面体验好,无需注册、没有广告,LibraryGenesis下载不了的文献还可以从网页直接链接到SCI-HUB下载。将DOI码直接复制到搜索框中,选择Scientific articles,再点击search,操作方便,没有用过的小伙伴不妨一试,惊喜等着你哦~

  Library Genesis网址:http://gen.lib.rus.ec/

图片7.png

  上面这几个网址都是小编珍藏已久,几乎可以满足对于文献的需求,也希望小伙伴们多多推荐其他的文献下载网址呀~


文献下载网址推荐
1931浏览
2点赞
0条评论
收藏
收起
登录后才能评论哦
Hi-C:三维基因组学研究利器(二)
  上一节我们详细介绍了Hi-C的发展历史、实验流程、数据处理以及辅助基因组组装,相信大家对Hi-C已经有了一定的了解,这一节我们主要讲Hi-C在染色质空间构象中的应用以及在Hi-C基础上发展起来的一些技术。解析染色质空间构象   人类基...

  上一节我们详细介绍了Hi-C的发展历史、实验流程、数据处理以及辅助基因组组装,相信大家对Hi-C已经有了一定的了解,这一节我们主要讲Hi-C在染色质空间构象中的应用以及在Hi-C基础上发展起来的一些技术。

解析染色质空间构象

  人类基因组全长30亿碱基对,如果呈直线排列长达2米,线性DAN通过与组蛋白结合形成核小体,核小体有序折叠成纤维丝,纤维丝再进一步折叠形成更高级的三维结构,进而将2米长的线性DNA折叠在微米级别的细胞核中。细胞中染色质具有明显的层级结构,包括A/B隔室(A/B compartments)、拓扑关联结构域(Topologically Associated DomainTAD)和染色质环(Chromain Looping)。

图片1.png

1  染色体不同层级三维构象图[1]

A/B compartments

  根据PCA主成分分析可以将高等动植物基因组人为划分为A/B隔室(A/B compartments),其中,A隔室呈松散染色质状态,基因密度高,富含转录因子结合位点和活性组蛋白标记,属于转录活跃区域;而B隔室则呈压缩染色质状态,基因密度低,含有抑制性组蛋白标记,属于转录抑制区域。随着分辨率的增加,A/B隔室至少可以分成5个亚隔室,A1A2亚隔室基本特征与A隔室一致,且都远离核纤层和核仁相关结构域,A1亚隔室在S期早期就完成复制,而A2亚隔室则持续至S期中期。B1B2B3亚隔室基本特征也都与B隔室一致,B1亚隔室与H3K27me3正相关,在S期中期达到复制顶峰,而B2B3亚隔室则缺乏上述所有组蛋白标记,且直到S期结束时才开始复制[2]

图片2.png

2  A/B compartments结构[2,3]

  通过对多个样本的A/B compartments 进行对比,在全基因组水平找出A/B compartments发生转换的区域,结合RNA-SeqChIP-seq等数据,有助于揭示不同样本间染色质构象发生变化的原因。相比乳腺上皮细胞系MCF-10A,乳腺癌细胞系MCF-7中部分A/B compartment发生转换,该转换区域中很多基因与癌症重要通路WNT相关[4]

图片3.png

3  A/B compartments转换区域[4]

TAD

  TAD(拓扑关联结构域)是染色质内部相互作用较为强烈的单元,通过明显的边界与相邻区域分离开来,形成一个独立的调控单元,内部的基因拥有共同的调控元件,存在协同表达特征。随着分辨率的增加,大的TAD可以进一步分成许多连续的小的TAD,例如果蝇中[5]分辨率由20 kb提升至200 bp时,观察到大的TAD2-4个小的TAD构成。

图片4.png

4  TAD结构[5]

  TAD边界富含转录起始位点、组蛋白标记、转录因子、管家基因、绝缘子蛋白复合物CTCF等,该边界结合的蛋白越多,边界就越明显。绝缘子蛋白复合物CTCF被认为在后生动物TAD边界的形成中发挥重要作用,然而,在果蝇[5]中发现其TAD边界不含绝缘子蛋白复合物CTCF,而是富含M1BPBeaf-32蛋白的motif,推测这些蛋白与黑腹果蝇TAD边界的形成相关,同样,植物TAD边界也缺少绝缘子蛋白复合物CTCF(植物中将TAD称为TAD-like),由其他特异性的蛋白介导TAD边界的形成,例如水稻[6]TAD边界富含TCP蛋白的motif,可能与水稻TAD边界的形成相关。

  TAD边界对于维持TAD结构及稳定性具有重要作用,可以正确指导远距离转录调控,边界发生变化会导致基因调控变得紊乱。相比乳腺上皮细胞系MCF-10A,乳腺癌细胞系MCF-7TAD边界富含几种癌蛋白[4]。与正常细胞GM12878相比,多发性骨髓癌细胞U266 TAD边界的几种白细胞介素IL1R1IL1R2IL18R1和细胞因子MAP4K4下调表达[7]

图片5.png

5  TAD边界变化区域[7]

Loop

  随着染色质相互作用矩阵分辨率的提高,我们能看到更为精确的染色质结构。在Hi-C数据分析中,通过寻找一对比线性上相邻的片段在空间上更加接近的一对片段,这样的一对片段的交互频率往往高于线性上相邻的片段,这个高交互的位点称为Peak位点,反映了Loop(染色质环)的存在。Erez Lieberman Aiden [2]等研究表明Loop两端存在CTCF,且其方向是相对的。随后又提出了黏连蛋白挤压模型[8,9],黏连蛋白复合物通过Nipbl-Mau4复合物结合到染色质中,然后黏连蛋白形成的两个环沿着相反方向运动,直到黏连蛋白遇到CTCF 锚定位点。黏连蛋白挤压模型依赖于内源性ATP酶活性来激活黏连蛋白的加载、滑动和Loop的形成,一旦该结构形成,在没有能量输入的情况下,LoopA/B compartment 仍能维持数小时[10]

图片6.png

6  Loop结构及挤压模型[2,10,11]

  增强子作为顺式调控原件,可以在距离靶基因较远的线性位置发挥作用,调控基因的表达,然而在三维空间结构上,增强子却距离靶基因及启动子很近。增强子和启动子通常位于Loop的两侧,在Loop挤压过程中,增强子和启动子距离渐近,互作增强。通过对多个样本Loop进行对比,在全基因组水平找出发生变化的Loop,结合ChIP-seqATAC-seqRNA-Seq等数据,有助于解释不同样本间Loop与转录调控之间的关系。GM12878细胞系中存在一个Loop,这个Loop连接了SELL启动子和一个远端增强子SELP,基因开启转录,表达量增加,而IMR90细胞系中没有这个Loop,基因不表达[2]

图片7.png

7  Loop结构变化区域[2]

Hi-C衍生技术

  Hi-C是三维基因组学研究的的主要方法,但存在实验成本高、数据噪音大、实验过程繁琐等缺点,为解决这些问题,在其基础上发展出了一系列衍生技术,如promoter CHi-C[12]BL-Hi-C[13]DLO Hi-C[14]等。

  哺乳动物基因组含有上百万的调控原件,与启动子作用共同调控基因的表达,然而在较低分辨率下难以鉴定这样的相互作用,Stefan Schoenfelder等人在CHi-C的基础上,进一步研发了promoter CHi-C,实验步骤在in situ Hi-C基础上进行一些修改,用RNA作为诱饵从海量的基因组相互作用片段中钓出含有启动子的片段,最后对生物素标记的片段富集、扩增、测序,该方法可在较低分辨率下对启动子相互作用片段进行捕获测序,有助于解析基因和远距离调控原件之间的相互作用。

图片8.png

8  promoter CHi-C实验步骤[12]

  2017年清华大学张奇伟研究组研究出一种高效、灵敏捕获结构性和调控性染色质相互作用的新方法:BL-Hi-C,在内切酶酶切和连接的时候做出改进,使用内切酶HaeIII酶切(识别GGCC位点),然后与带有生物素标记的20 bp dsDNA进行连接,再通过对生物素标记片段进行富集、扩增、测序等,该方法步骤简单,仅需一步酶切和两步近端连接,还能够显著富集由CTCFRNAPII、转录调控因子等维持的染色质相互作用。

图片9.png

9  BL-Hi-C实验步骤[13]

  2018年华中农业大学曹罡课题组和李国亮课题组开发了一种新的染色体构象捕获技术:DLO Hi-C,采用同时酶切酶连的方式,将两条不同的20 bp DNA接头连接在内切酶切口末端,然后进行邻近酶连,最后用MmeI内切酶酶切,回收固定大小的DNA互作片段,无需进行生物素标记、富集等步骤,该方法大大地降低了背景数据噪音,方便快捷。

图片10.png

10  DLO Hi-C实验步骤[14]

  随着实验及信息分析流程的优化,多种技术的结合,相信后续还会衍生出更多高效、经济、便捷的Hi-C新技术,助力科学研究。

参考文献

[1]Fraser J, Williamson L, Bickmore W A, et al. An Overview of Genome Organization and How We Got There: from FISH to Hi-C. Microbiology and Molecular Biology Reviews, 2015.

[2]Rao S S.P., Huntley M H., Durand N C., et al. A 3D Map of the Human Genome at Kilobase Resolution Reveals Principles of Chromatin Looping. Cell, 2014.

[3]Higgs D R., Vernimmen D, Hughes J, et al.Using Genomics to Study How Chromatin Influences Gene Expression.Annual Review of Genomics and Human Genetics, 2014.

[4]Barutcu A. R, Lajoie B R., McCord R P., et al.Chromatin interaction analysis reveals changes in small chromosome and telomere clustering between epithelial and breast cancer cells.Genome Biology, 2015.

[5]Wang Q, Sun Q, Czajkowsky D M., et al. Sub-kb Hi-C in D. melanogaster reveals conserved characteristics of TADs between insect and mammalian cells. Nature communications, 2018.

[6]Liu C, Cheng Y, Wang J, et al. Prominent topologically associated domains differentiate global chromatin packing in rice from Arabidopsis. Nature plant, 2017.

[7]Wu P, Li T, Li R, et al. 3D genome of multiple myeloma reveals spatial genome disorganization associated with copy number variations. Nature communications, 2018.

[8]Nichols M H., Corces V G.. A CTCF Code for 3D Genome Architecture. Cell, 2015.

[9]Sanborn A L., Rao S S. P., Huang S, et al. Chromatin extrusion explains key features of loop and domain formation in wild-type and engineered genomes. PNAS, 2015.

[10]Vian L, Pe˛ kowska A, Rao S S. P., et al. The Energetics and Physiological Impact of Cohesin Extrusion. Cell, 2018.

[11]Dolgin E. DNA's secret weapon against knots and tangles. Nature, 2017.

[12]Schoenfelder S, Furlan-Magaril M, Mifsud B, et al. The pluripotent regulatory circuitry connecting promoters to their long-range interacting elements. Genome research, 2015.

[13]Liang Z, Li G, Wang Z, et al. BL-Hi-C is an efficient and sensitive approach for capturing structural and regulatory chromatin interactions. Nature communications, 2018.

[14]Lin D, Hong P, Zhang S, et al. Digestion-ligation-only Hi-C is an efficient and cost-effective method for chromosome conformation capture. Nature genetics, 2018.


Hi-C
4187浏览
7点赞
0条评论
收藏
收起
登录后才能评论哦
Hi-C:三维基因组学研究利器(一)
Hi-C发展历史   DNA在染色体上是高度折叠的,DNA与DNA片段之间不可避免的形成了高强度的交互作用,对基因的表达、远端调控等起重要作用。2002年Dekker等[1]提出利用3C技术研究染色体的三维构象,该技术基于PCR原理,针对特定位点设计...

Hi-C发展历史

  DNA在染色体上是高度折叠的,DNADNA片段之间不可避免的形成了高强度的交互作用,对基因的表达、远端调控等起重要作用。2002Dekker[1]提出利用3C技术研究染色体的三维构象,该技术基于PCR原理,针对特定位点设计上下游引物,用于研究单个点和点之间的相互作用;在此基础上发展起来的4C[2]技术,将DNA片段连接成环,然后设计引物进行反向PCR,可以研究一个点和多个点之间的相互作用;5C[3]技术进一步发展,在DNA片段两端加上通用引物,进而实现多个点和多个点之间的相互作用;3C4C5C技术都是基于PCR技术发展而来,不能用于研究全基因组范围内所有点之间的相互作用。2009Lieberman-Aiden[4]等提出的Hi-C技术,在片段两端加上生物素标记,再利用磁珠对其捕获,进而实现全基因组范围内所有点之间的相互作用的研究,Hi-C技术的出现,将三维基因组学的研究向前推进一大步。

图片1.png

1 Hi-C发展历史[5]

Hi-C实验流程

  2009年发表在science[4]Hi-C技术称为第一代Dilution Hi-C,该文章对Hi-C实验流程进行了详细叙述,主要步骤包括甲醛交联、细胞裂解、内切酶酶切、末端修复及生物素标记、片段连接、捕获带生物素标记的片段、双端测序等。2011Chen Lin[6]意识到细胞核的扰动会影响染色质的高级构象,故而将反应体系固定在磁珠上,减小反应体系的扰动,大大提高了信噪比。2014年发表在Cell[7]上的文章进一步对Hi-C实验流程进行改进,将DNA-DNA的连接反应在完整的细胞核中进行,而并非在早期裂解细胞,将该方法定义In situ Hi-C,有效数据较Dilution Hi-C获得较大提升。文库构建是Hi-C技术的重难点,文库质量将直接影响后续的有效Hi-C数据,因此进一步加强对实验流程的优化仍将是后续Hi-C研究的重点。

图片2.png

2 Hi-C实验流程[7]

Hi-C数据处理

  Hi-C文库测序基于二代测序平台,首先,对Raw Data进行过滤,去除接头序列及低质量Reads,获得高质量的Clean Data;其次利用BWA[8]或者HiC-Pro[9](调用bowtie2)将双端Clean Data与组装好的基因组序列进行比对,获得唯一比对到基因组上的Reads;然后使用HiC-Pro或者HiCUP[10]软件分析比对结果,识别 Valid Interaction Pairs Invalid Interaction Pairs,其中,Invalid Interaction Pairs主要主要包含自连类型(Self-circle Ligation),末端悬挂类型(Dangling Ends)、相邻连接类型(Re-ligation)和其他丢弃的类型(Dumped),Valid Interaction Pairs数据在30%以上即认为数据合格,可用于后续研究。

 图片3.png

3 Hi-C数据处理[9]

Hi-C研究内容

  细胞核内的染色体都是高度折叠的,不同物种的折叠方式各不相同,包括RablBouquetRosette结构。染色体长度较长的物种倾向于采用Rabl结构(如大麦[11]),该结构每条染色体向后折叠使长臂和短臂并列,着丝粒和端粒分别聚集在细胞核两级,而染色体长度较短的物种则倾向于采用Rosette结构(如拟南芥[12]),该结构中心是高度折叠的着丝粒区域及大的重复序列,周围是常染色质环结构。我们通过Hi-C对高度折叠的染色体进行研究,用于辅助基因组组装、解析染色质空间构象和构建染色体单倍型图谱等。

 图片4.png

4 细胞内染色体折叠方式[13]

辅助基因组组装

  细胞核内每条染色体都占据着一个独特区域,称为染色体疆域,同一染色体上的交互频率高于不同染色体间的交互频率,从而实现将初步组装的Contigs分配到各染色体群组中,染色体内部DNA片段间的交互频率与线性距离一般近似服从幂次递减定律,因而通过交互频率的高低确定每个染色体群组中的不同Contigs的顺序与方向[14]。但是在大麦中,染色体互作频率却有悖幂次递减定律,在200 Mb的位置有显著的上升,且在染色体内Hi-C作用矩阵中呈现出显著的反对角模式,染色体首尾两端区域互作频率增大,说明大麦染色体折叠为Rabl结构,该结构一般在染色体长度较长的物种中出现。   

 图片5.png

5 Hi-C辅助基因组组装[11,14]

  染色体水平参考基因组是后续功能基因研究的基础,早期的基因组一般都是通过高密度遗传图谱进行染色体挂载,然而构建作图群体耗时较长,再加上有些物种没法构建作图群体,故很多基因组都在Scaffold甚至Contig水平。随着Hi-C技术的发展,越来越多的研究者转而利用Hi-C将基因组挂载至染色体水平。Hi-C不依靠群体,用单个体就能将基因组序列组装到染色体水平,还能够纠正基因组的组装错误,构建物种三维基因组图谱,已成为基因组染色体构建的主流技术。小编细数了已经发表的基因组文章,Hi-C的身影已经很常见,如山羊[15]、大麦[11]、亚洲棉[16]和月季[17]等均借助Hi-C挂载至染色体水平,相信后续将会看到更多“基因组+Hi-C”的文章。

 图片6.png

6 Hi-C辅助基因组组装案例

想要了解 Hi-C其他研究内容吗?敬请期待下一篇文章。

参考文献:

[1]Dekker J, Rippe K, Dekker M, et al. Capturing chromosome conformation. Science, 2002.

[2]Simonis M, Klous P, Splinter E, et al. Nuclear organization of active and inactive chromatin domains uncovered by chromosome conformation capture-on-chip (4C). Nature Genetics, 2006.

[3]Dostie J, Richmond T A., Arnaout R A., et al. Chromosome Conformation Capture Carbon Copy (5C): a massively parallel solution for mapping interactions between genomic elements, Genome Research, 2006.

[4]Lieberman-Aiden E, van Berkum N L., Williams L, et al. Comprehensive Mapping of Long-Range Interactions Reveals Folding Principles of the Human Genome.Science, 2009.

[5]Sotelo-Silveira M, Montes R A. C, Sotelo-Silveira J R., et al. Entering the Next Dimension: Plant Genomes in 3D. Trends in Plant Science, 2018.

[6]Kalhor R, Tjong H, Jayathilaka N, et al. Genome architectures revealed by tethered chromosome conformation capture and population-based modeling. Nature Biotechnology, 2011.

[7]Rao S S.P., Huntley M H., Durand N C., et al. A 3D Map of the Human Genome at Kilobase Resolution Reveals Principles of Chromatin Looping. Cell, 2014.

[8]Li H, Durbin R.Fast and accurate short read alignment with Burrows-Wheeler Transform. Bioinformatics, 2009.

[9]Servant N, Varoquaux N, Lajoie B R, et al. HiC-Pro: an optimized and flexible pipeline for Hi-C data processing. Genome biology, 2015.

[10]Wingett S, Ewels P, Furlan-Magaril M, et al. HiCUP: pipeline for mapping and processing Hi-C data. F1000Research, 2015.

[11] Mascher M, Gundlach H, Himmelbach A, et al. A chromosome conformation capture ordered sequence of the barley genome. Nature, 2017.

[12] Fransz P, de Jong J. H, Lysak M, et al. Interphase chromosomes in Arabidopsis are organized as well defined chromocenters from which euchromatin loops emanate. PNAS, 2002.

[13]Grob S, Grossniklaus U. Chromosome conformation capture-based studies reveal novel features of plant nuclear architecture. Current Opinion in Plant Biology, 2017.

[14] Burton J N, Adey A, Patwardhan R P, et al. chromosome-scale scaffolding of de novo genome assemblies based on chromatin interactions. Nature Biotechnology, 2013.

[15] Bickhart D M, Rosen B D, Koren S, et al. Single-molecule sequencing and chromatin conformation capture enable de novo reference assembly of the domestic goat genome. Nature Genetics, 2017.

[16] Du X, Huang G, He S, et al. Resequencing of 243 diploid cotton accessions based on an updated A genome identifies the genetic basis of key agronomic traits. Nature Genetics, 2018.

[17] Raymond O, Gouzy J, Just J, et al. The Rosa genome provides new insights into the domestication of modern roses. Nature Genetics, 2018.


Hi-C
2887浏览
6点赞
0条评论
收藏
收起
登录后才能评论哦
宫颈癌:你应该知道的这些事
背景介绍   宫颈癌是目前唯一可以确定病因的癌症,研究表明,HPV(人乳头瘤病毒)是导致宫颈癌的主要原因。Harald zur Hausen正是由于发现了宫颈癌和HPV的关系,获得了2008年诺贝尔生理学或医学奖,但该过程也并不顺利。上个世纪70年代...

背景介绍

  宫颈癌是目前唯一可以确定病因的癌症,研究表明,HPV(人乳头瘤病毒)是导致宫颈癌的主要原因。Harald zur Hausen正是由于发现了宫颈癌和HPV的关系,获得了2008年诺贝尔生理学或医学奖,但该过程也并不顺利。上个世纪70年代,单纯胞疹病毒被认为是引起宫颈癌的病毒,并且已有研究者从宫颈癌细胞中分离出单纯胞疹病毒部分基因组,但Hausen却坚持认为宫颈癌是由HPV(当时也被列为宫颈癌候选病毒)引起的,1976年,他提出宫颈癌是由HPV病毒引起的假说,直到1983年,Hausen通过Southern杂交从宫颈癌细胞中分离出HPV 16[1],并发现至少有50%的宫颈癌细胞都含有这种病毒,随后又分离出HPV 18[2],才证实了宫颈癌是由HPV病毒引起的这一假说。

HPV感染机制

  HPV感染通常发生在上皮磨损的部位,并且宫颈的鳞状细胞结特别容易受高危HPV的影响。HPV病毒通过主要衣壳蛋白L1与基底层的硫酸乙酰肝素蛋白多聚糖HSPGs/ 层粘连蛋白5结合,促使衣壳构象发生改变,进一步暴露次要衣壳蛋白L2,弗林蛋白酶切割L2。随后病毒进入基底细胞,在E1、E2、E5、E6和E7的帮助下完成病毒基因组复制,随着E4分解细胞角蛋白细丝,角化细胞残余物从上皮表面脱落,病毒颗粒被释放,进而完成HPV病毒的感染[3]

图片1.png

1  HPV病毒感染机制[3]

人体对HPV病毒的免疫

  人体的免疫系统是一道天然的屏障,可以消灭进入体内的HPV病毒,阻止HPV病毒的持续感染。HPV病毒进入体内之后,抗原呈递细胞(APC)被激活,促炎性细胞因子和趋化因子的释放促使抗原呈递细胞转移至淋巴结(LN),激活的抗原呈递细胞一方面刺激各种病毒抗原特异性CD4 + T细胞,帮助B细胞产生针对衣壳蛋白的nAb,另一方面进入感染的组织,招募CD8+ T细胞,靶向上皮底层中病毒感染的细胞,清除病毒的感染,nAb中和病毒颗粒,后续再有新的HPV病毒感染时,nAb便会将其阻止,因此,提高自身的免疫力可以有效达到预防宫颈癌的目的[3]

 图片2.png

2 人体对HPV病毒的免疫[3]

宫颈癌易感因素

  HPV感染率很高,但大多数感染都是短暂的,只有一小部分感染会发展为宫颈癌,是由病毒和宿主间复杂的相互作用引起的。已有研究表明,宫颈癌具有一定的遗传易感性[4]Ulf Gyllensten[5-6]等在瑞典人中进行了GWAS分析,在6p21.3MHC区域发现了与宫颈癌显著关联的55SNPs,并进一步进行了验证,结果表明,rs2516448rs9272143位点与宫颈癌显著关联。Shi Y[7]等对汉族人进行了GWAS研究,获得了两个新的宫颈癌显著关联位点,分别是位于4q12rs13117307位点和17q12rs8067378位点。Zhang Z[8]等利用基因分型对中国人的rs2294008位点进行了研究,发现携带TT基因型的个体与宫颈癌风险降低显著相关,免疫组织化学实验显示携带TT基因型的个体比CC / CT基因型个体具有更低的PSCA表达。

图片3.png

3 GWAS关联分析[7]

宫颈癌预防措施

  著名歌手梅艳芳因罹患宫颈癌去世,众多歌迷都为之惋惜,因为宫颈癌可以通过注射HPV疫苗和定期筛查避免,可却由于她的疏忽,付出了生命的代价。

  接种HPV疫苗可以激发人体的主动免疫,产生相应的抗体,当HPV病毒再次感染时,身体就会召唤记住HPV病毒的免疫细胞,分泌抗体,消灭病毒。目前,全球上市的HPV疫苗有二价、四价和九价三种,二价疫苗可以预防HPV16HPV18亚型病毒,超过70%的宫颈癌是由这两种病毒引起的,20167月二价疫苗获批进入中国。四价疫苗可以预防HPV16HPV18HPV6HPV11亚型病毒,不仅可以预防超过70%的宫颈癌,还能预防生殖器疣和外阴癌等,四价疫苗也于20176约获批进入中国。九价疫苗可以预防HPV16HPV18HPV6HPV11HPV31HPV33HPV45HPV52HPV58亚型病毒,九价疫苗能预防90%的宫颈癌和生殖器疣等,已与20185月获批进入中国。在经济条件允许的情况下,还是建议广大女性同胞接种HPV疫苗,实在不能接种疫苗,也至少应该做到定期筛查。

  宫颈癌筛查手段主要包括细胞学检查、HPV病毒检查和阴道镜检。

  细胞学检查包括巴氏涂片、薄层液基细胞技术(TCT)、宫颈/阴道膜式薄层细胞学检测(LCT)等手段,通过采集脱落的宫颈细胞,在显微镜下观察宫颈细胞状态,明确宫颈细胞是否发生病变,细胞学检查一般建议每三年一次。

  HPV200多种亚型,分为低危型和高危型,只有高危型HPV的持续感染才有可能引发宫颈癌,高危型HPV主要包括HPV16HPV18HPV31HPV33HPV45HPV52HPV58等。HPV病毒检查主要是观察宫颈细胞是否受到HPV感染以及感染的HPV种类,HPV病毒检查一般推荐每五年一次,最好结合细胞学检查(建议)。

  如果HPV病毒检查发现有高危HPV的感染,且细胞学检查发现宫颈细胞异常,则建议进一步进行阴道镜检,阴道镜检可以清楚地看到宫颈表皮和生殖器表皮上极其微小的病灶细节,是确诊宫颈鳞状上皮内瘤变的最可靠的方法。

宫颈癌治疗手段

  目前临床上治疗宫颈癌主要采用手术、放疗、化疗和免疫疗法等治疗手段,根据不同的临床分期选择对应的治疗方法,整体原则即A以早首选手术为主的综合治疗,不适合手术的病人选择放疗可达到同样的治疗效果,ⅡB以晚首选以放疗为主的综合疗法。近日,美国FDA批准了沙默东将免疫疗法Keytruda用于治疗晚期宫颈癌患者。随着医学的发展,相信后续会有更多的创新治疗方法,更好的治疗方案。

  远离宫颈癌,力争做到早打疫苗、早筛查、早治疗,将宫颈癌扼杀在摇篮里。     

参考文献

[1] DURST M, GISSMANN L, IKENBERG H, et al. A papillomavirus DNA from a cervical carcinoma and its prevalence in cancer biopsy samples from different geographic regions. PNAS, 1983.

[2] Boshartb M, Gissmann L, Ikenberg H, et al. A new type of papillomavirus DNA, its presence in genital cancer biopsies and in cell lines derived from cervical cancer. The EMBO Journal, 1984.

[3] Roden Richard B. S., Stern P L.. Opportunities and challenges for human papillomavirus vaccination in cancer. Nature Reviews, 2018.

[4] MAGNUSSON P K.E., LICHTENSTEIN P, GYLLENSTEN U B.. HERITABILITY OF CERVICAL TUMOURS. Int J Cancer, 2000.

[5] Chen D, Juko-Pecirep I, Hammer J, et al. Genome-wide Association Study of Susceptibility loci for cervical cancer. J Natl Cancer Inst, 2003.

[6] Chen D, Hammer J, Lindquist D, et al. A variant upstream of HLA-DRB1 and multiple variants in MICA influence susceptibility to cervical cancer in a Swedish population. CancerMedicine,2004.

[7] Shi Y, Li L, Hu Z, et al. A genome-wide association study identifies two new cervical cancer susceptibility loci at 4q12 and 17q12. Nature Genetics, 2013.

[8] Wang S, Wu S, Zhu H, et al. PSCA rs2294008 polymorphism contributes to the decreased risk for cervical cancer in a Chinese population. Scientific RepoRts, 2016.

参考文献链接:https://pan.baidu.com/s/189NusUP3QfXjWFW-H94kqQ 密码:utdq

宫颈癌
908浏览
6点赞
0条评论
收藏
收起
登录后才能评论哦
暂未创建相册。
教育经历

2016.06毕业 中国林业科学研究院 / 硕士 专业:生物化学与分子生物学

2013.06毕业 西南大学 / 本科 专业:林学

发表文章

核农学报

论文名称:文心兰体细胞无性系变异的倍性检测和CE-AFLP分析

贡献描述:文心兰组织培养,流式细胞和AFLP都是自己完成。

西北植物学报

论文名称:文心兰浅绿条纹突变体的生理生化及叶绿素荧光特性研究

贡献描述:文心兰组织培养、生理生化实验及叶绿素荧光测定。

工作经历

2016.07——2017.05 北京擎科新业生物技术有限公司

职位名称:技术支持

工作简介:负责分子试剂的技术问题,如酶、载体等

2017.05——2018.05 北京百迈客生物科技有限公司

职位名称:产品经理

工作简介:负责基因组、重测序、Hi-C等项目方案设计,阅读最新文章并做解读,跟客户共同探讨论文大致板块内容等。

2018.05——至今 成都生命基线

职位名称:NGS技术支持

工作简介:负责阅读最新文献并解读等。

荣誉证书

2015.10 中国林科院活动积极分子

2017.02 北京擎科生物技术有限公司优秀员工

2016.10 中国林科院亚林所三等奖学金

田韦韦
让专家为我设计方案 客服在线,来聊聊吧