眼镜猴

一个数学的基因组

分享:

Malgosia Ip、数学与统计数据编辑器

满足菲律宾眼镜猴:一个小灵长类动物与巨大的眼睛,原产于菲律宾群岛。尽管它体积小,这小家伙已经争论了一个世纪的主题——更密切相关的狐猴(所谓的“年轻无经验的“灵长类动物)或猿和人类(“dry-nosed“灵长类动物)?眼镜猴特质,适合两类:它有多个双乳头和梳理爪子像狐猴,和大型的后代和每月的月经周期和人类一样。

数学可能最终有一个答案。在过去的三年里,计算机科学家莱拉Kari和她的小组在滑铁卢大学和西方大学,和她的合作者,开发了一个数学方法来比较不同物种的DNA。这可能使物种分类更量化,从分类的边缘拯救物种像眼镜猴。“目前,眼镜猴被列为dry-nosed灵长类动物,但我们的方法将它们与年轻无经验的灵长类动物,”卡丽说。

Kari的方法从一个叫做混乱游戏表示(CGR),变换序列的腺嘌呤(a)、胞嘧啶(C)、胸腺嘧啶(T)和鸟嘌呤(G)、核苷酸在你DNA为一个复杂点的模式,看起来更像一件艺术品,而不是一个科学项目。

自己试试:

  1. 画一个正方形和标签角落a、C、T和g .现在位置点的中心广场。
  2. 画一条线从中心的角落点对应于你的DNA序列中的第一个字母。一个点在这条线的中点(线本身不重要;点)。
  3. 画一条线从点到街角的相应序列中的下一个字母和一个点在这条线的中点。
  4. 继续这样,直到你到达序列的末尾瞧——你自己的DNA CGR !
chaos-game-representation-ACTCG

混乱的比赛表示ACTCG (CGR)序列。图片来源:Malgosia Ip

当然,基因组DNA通常包含数以百万计的核苷酸,所以由此产生的图更引人注目。给予足够的点,你开始看到独特的和图案特征线,三角形,或穿过€”像一种专一性二维码。人类线粒体DNA看起来就像一系列的三角形,而红藻的条纹。尽管每个物种的CGR是独一无二的(就像他们的DNA)密切相关的物种的CGRs往往更相似。

CGR-human-mDNA-red-algae-mDNA

CGRs人类线粒体DNA(左)和红藻线粒体DNA(右)。图片来源:莱拉Kari

通过计算数学之间的“距离”这些图像,然后使用统计方法多维定标,每个DNA序列可以被转换为三维空间中的一个点。这些点越近,越相似他们代表的基因组。

“这就像把生命之树变成生命的地图,“Kari解释道。

与经典的系统发育树,只有告诉你物种之间的关系在同一分支,地图给你更多的信息,同时显示所有物种之间的关系。

当卡利集团尝试的方法在一组超过1700脊椎动物线粒体基因组,结果是一个3 d图与集群通信非常好与当前物种分类。你自己看下面的图片或互动版

map-vertebrate-life

脊椎动物的生活地图创建使用Kari的基因组比较的数学方法。图片来源:莱拉Kari

即使爬在边界的物种仍然出现逻辑上,像一种鱼与原始的肺,或陷入两栖动物集群蛇形两栖动物溜进了爬行动物集群。当然,眼镜猴,坐落与年轻无经验的灵长类动物。

“事实上,这种方法捕获的共同特征——我以为是最酷的事情,”卡丽说。特别是因为该方法根本不在乎什么类型的序列比较或者他们是从哪里来的。

目前,物种分类依赖于数据的结合,从形态特征的评价DNA序列比对分子信息。其中,DNA序列比对是最接近的定量测量物种亲缘,但它依赖于参考基因或序列的存在,可以用作比较。但物种没有特定的基因吗?这不是一个问题使用Kari的方法。

“作为一个数学家,这是最具吸引力的特性:它是如此普遍。(DNA)不需要相同的物种或同一属。它可以是一个计算机生成的序列或外来DNA来自外太空,我不在乎。来吧!”

在许多情况下,您甚至不需要的整个基因组序列的方法工作。有时只有几个百分点的序列就足够了区分两个物种。这意味着与原始测序数据或方法可以用于生物,只有低质量的测序结果是可用的。Kari意义通过思考整个基因组的一本书——你需要读了整本书,不知道是哪个,但为什么它的生物原因尚未发现工作。
这就是Kari希望与生物学家的合作可以帮助。她在走西方大学目前有两个:一个大卫·史密斯博士专门从事原生生物和另一个艺术Poon博士,一个艾滋病毒研究员。

而不是取代目前的分类方法,Kari认为这种数学方法是互补的。这样的计算效率,可伸缩的方法(你可以比较20或20000序列)和一些原始测序数据,我们可以更快的进行分类估计地球上86%的物种海洋物种的91%还没有一个家,生命之树。

我们可以做到没有任何tarsier-sized争议。

分享: