转录因子信息系统:用于检测转录因子结合位点的工具

转录因子是在特定位点(转录因子结合位点或TFBSs)与DNA结合并控制基因表达的蛋白质。因此,鉴定DNA中的这些TFBSs对于理解调控基因表达的机制非常重要。为了有效地理解这些机制,需要开发新的计算工具来检测这些TFBSs,具有更高的效率和先进的选项,以便获得详细的更好的结果。

图1所示。

这些工具必须作为web应用程序开发,以便用户可以轻松地在线访问这些功能。这些工具还必须具有用户友好的界面,以便具有生物学背景的人可以轻松理解功能和结果输出。为了使这些鉴定更容易通过计算方法,我们开发了一种新的在线工具,称为转录因子信息系统(TFIS),它是基于位置权重矩阵来检测给定DNA序列中的TFBSs。TFIS使用从JASPAR数据库导出的位置频率矩阵库,通过位置概率矩阵获得位置权重矩阵。该工具提供了更好的机会来扫描各种tf的基因序列。虽然有许多类似的工具可用,但TFIS提供了根据用户需求开发的某些独特和高级功能。TFIS使用最新的PFM库,全局伪计数为0.8。它还采用了一种基于百分比评分的新方法来确定阈值分数,其中截止值是相对于特定TF的最佳匹配对应的最高分数计算的。

图2所示。

图2所示。

高级功能包括从一批序列中常见的TF扫描,特定的TF扫描,NCBI数据库连接,使用用户定义的序列进行手动扫描并将其转换为PWM等。使用我们的工具获得的结果也更加用户友好和信息丰富,例如,TFIS工具除了按顺序突出显示网站外,还指定了位置号,并将tf链接到其他重要的网站和数据库,如UNIPROT和NCBI。TFIS可以同时在两个方向检测到潜在的TFBSs的存在。这个特性提高了它的效率。这种双重检测的结果以不同的颜色呈现,具体到结合位点的方向。TFIS除具有一般检测方法外,还具有直接从NCBI数据库获取信息、检测一批基因序列中常见TF结合位点、从原始序列生成PWM后检测TFBS等先进功能。该工具支持使用JAVA语言作为高级生物信息学编程语言。这个工具可以在http://www.tfis.in公开访问。这个工具无疑是一个先进的工具,因为它能够提供任何其他工具都不存在的解决方案,例如,TFSEARCH工具最多可以输入9999个碱基的基因序列,而TFIS则没有这种限制。由于在结果页面中除了NCBI和UniProt之外,还集成了来自各种相关web服务器的更多信息链接,因此TFIS获得的结果对检测到的tf更加详细和具体。例如Gene Ontology、paazar数据库和Transcription Factor encyclopedia。

要不是Narad
印度北方邦阿姆提大学阿姆提生物技术研究所

出版

转录因子信息系统(TFIS):一个检测转录因子结合位点的工具。
Narad P, Kumar A, Chakraborty A, Patni P, Sengupta A, Wadhwa G, Upadhyaya KC
2016年4月6日

脸谱网 推特 linkedin 邮件 脸谱网 推特 linkedin 邮件

留言回复