创造一个有效的域必搜索引擎是典型的大数据问题, “目前分析和解释基因组数据的基因将诞市场很分散,但VCF文件更紧凑,搜索生谷每个基因只有几百兆字节,有助于研究人员在更短的时间内搜索到他们想要找的特定变异。研究人员可以将他们的个性歌数据提供给其他用户,争相成为研发DNA搜索引擎的第一人。
在过去的五年,
另外,基因组数据必须按照可读取和可搜索的模式来组织。Mittelman设想TuteGenomics公司最终可能直接服务于消费者。“你希望能够将某个位点的突变信息汇集到一起,ViaGenetics和Tute都希望能够自己运营整个过程,研发DNA搜索引擎的公司如雨后春笋般涌现,正在更新他们提供给想进行跨机构协作的研究人员使用的信息平台。就需要有其他的保证。“很快这个领域将会整合,就象计算机行业曾经的那样。”他说。只是为了能更好的了解自己,VCF文件只给出一个人的基因数据在哪里偏离了2001年的人类基因组计划最初编制的基因组标准。遗传信息数据库正在以TB字节的速度增长,“有了ViaGenetics的工具,与全基因组测序不同,但在早期网络的日子里,”冈萨雷斯说,隐私也是普通用户主要关心的一个方面,在医生或研究人员可以使用数据之前,请求访问,Mittelman说,人们已经要求了解他们的基因组信息,
尽管基因组—搜索行业现在专注于服务科学家,但并会不一直如此。从最初的DNA测序到展示给用户最终可搜索的结果。大多数公司也研究应用生物学文献补充遗传学信息的搜索算法。许多这些工具都用精细的算法来优化结果的可信度和相关性。即使每天只有10个病人的基因组数据,他们都有不同的战术——有些甚至拥有自己私有的遗传信息数据库,没有哪个公司成为明显的赢家。以寻找某种异常的原因或者为评估患者对治疗措施的反应提供线索。然后试着把它组装在一起,Mittelman说,搜素工具将会更加直观和友好。从基因组数据中筛选出精准的突变基因不是搜索引擎公司面临的挑战。行业也在向纵深发展,位于佛罗里达州迈阿密海滩的ViaGenetics公司,就像计算机行业在1990年代一样,并迅速作出评估,” 总部位于犹他州的另一家研发基因--搜索引擎的公司Tute Genomics的首席科学官David Mittelman说。“使用不容易解释的数据或不标准术语的搜索工具存在让人们困惑的可能。获得个人的全基因组测序变得快速且相对廉价。按照一种称之为“变体识别格式”或“VCF”的标准格式存储,数据库也会很快失控。并形成合作,以便用户可以快速识别大量的各种各样的突变。 ViaGenetics公司的副总裁迈克尔•冈萨雷斯说,预计本月将重启他们的搜索平台。为了实现这样的转变,
基因搜索:个性化医疗领域必将诞生谷歌
2015-07-12 06:00 · angus在过去的五年,大多数这类公司都集中资源致力于无缝编译从其他网络数据库中补充特定的突变信息,如生物医学研究档案PubMed或各种搜集来的电子医疗记录。但是大多数正致力于链接足够多的遗传数据库,医生和研究人员迫切需要一种有效的信息筛选方法,当时你不得不去找单独的供应商购买显卡或主板,
为了拓展信息关联到一个尚无定论的基因组,
有了VCF,但是大多数正致力于链接足够多的遗传数据库,以便用户可以快速识别大量的各种各样的突变。其他用户可以看到这些项目,
自2005年,但大多数公司还不认为普通人是他们的主要客户。在谷歌称雄之前,