microRNA学习笔记(二)——microRNA的生物信息学研究方法

February 19, 2016

最近发现博客的ol标签不起作用,应该是主题的问题,已经反映给作者了。所以文章中先用ul。

microRNA生物信息学分析策略概述

microRNA基因常规生物信息学分析策论:

  • 获得microRNA序列信息,包括成熟和前体microRNA(pre-microRNA)序列、microRNA基因组定位信息、microRNA基因分布特点(即确定目的microRNA属于基因间分布性还是基因内分布性microRNA)。
  • microRNA基因簇分析,即目的microRNA基因与相邻microRNA基因关系的分析。
  • microRNA基因的种系发育分析。
  • 新microRNA基因的预测与生物信息学验证。
  • 目的microRNA基因的序列分析,包括目的microRNA的启动子预测和转录因子结合位点分析。
  • 目的microRNA靶基因预测。

microRNA序列信息获取及相关数据库的建立

microRNA Base

目前最常用的是microRNA信息综合网站——microRNA Base(http://mirbase.org/
它主要有三个功能:

  • Database,microRNA序列数据库查询页面,有各个物种microRNA的具体序列、基因组分布和详细序列注释信息。
  • Registry,提交新发现的microRNA序列到数据库。
  • Targets,链接到microCosm、TargetScan、Pictar,可以查询靶基因预测数据库检索目的microRNA的预测靶基因(现在没有这个功能了)

GenBank

GenBank(http://www.ncbi.nlm.nih.gov/genbank)属于NCBI(美国生物技术信息中心),收录了绝大部分已知的公开的DNA和蛋白质序列,存储了相应参考文献记录和生物学注释。

这个数据库通常作为microRNA Base检索的补充。

microRNA簇的分析策略

microRNA簇的发现与研究现状

microRNA成簇现象(microRNA Clustering):microRNA基因在染色体上分布是紧密的,有的甚至只相隔几十个碱基。

  • 成簇的microRNA基因具有协同作用。
  • 成簇的microRNA序列可以相同也可以不同,通常包含2-3个microRNA成员,但也存在较大的microRNA簇。

microRNA簇的分析方法

  • 编码基因间的microRNA,以3000nt作为相邻microRNA间距离的最大阈值来寻找染色体同一方向的可成簇microRNA。
  • 编码基因内的microRNA,以整个编码基因DNA序列作为成簇分析对象。

在线分析工具ProMiR Ⅱ

ProMiR Ⅱ(http://cbit.snu.ac.kr/~ProMiR2/)可以预测目的microRNA附近新microRNA基因并可搜寻目标序列是否含有成簇microRNA基因。(该网站目前上不去。。)

microRNA种系发育分析

物种间或同一物种内大量高度同源的microRNA及microRNA基因簇的存在提示,microRNA基因的物种进化方式以“复制”为主。

种系发育分析的好处

  • 可以观察microRNA基因在物种进化过程中的序列演化和基因变迁。
  • 可以帮助理解microRNA家族成员间的亲缘关系。
  • 有时甚至可以发现新的microRNA基因。

microRNA基因的种系发育分析流程

  • 目的microRNA基因在多个物种或同一物种内的序列数据采集(通过microRNA Base、Ensemble等网站查询)。
  • 目的microRNA基因在物种间或种内的保守性分析。
  • 绘制目的基因进化树。
  • 对目的microRNA基因进行物种进化史分析。

与蛋白编码基因相比,microRNA基因数量相对较少,而且进行microRNA基因发育分析所需的序列分析工具和资源也较少,尚不能进行大规模的microRNA基因发育分析。

microRNA基因转录调控分析

启动子:控制基因表达(转录)的起始时间和表达的程度。
启动子本身并不控制基因活动,而是通过与称为转录因子(transcription factor)的这种蛋白质(proteins)结合而控制基因活动的。
转录因子就像一面“旗子”,指挥着酶(enzymes)(RNA聚合酶RNA polymerases) 的活动。这种酶指导着RNA合成。

启动子分析

常用下列启动子分析软件对microRNA基因进行RNA聚合酶Ⅱ启动子分析:

Promoter 2.0

Promoter 2.0分析结果较简单,只给出启动子预测区定位及评分。

Promoter Scan

与Promoter 2.0相比,Promoter Scan不但提供了提交序列的详细启动子分布预测及评分,而且还提供了转录因子结合位点预测并包括了正反序列。

Neural NetworkPromoter Prediction(NNPP)

NNPP的分析结果也比较简单,只给出了启动子预测区定位及评分,并不提供转录因子结合位点预测。

作者推荐以Promoter Scan为主,另外两种作为参考。

转录因子结合位点分析

作用:

  • 了解microRNA基因转录调控信息
  • 为目的microRNA的功能研究提供线索

真核生物转录因子结合位点分析通常在BIOBASE生物数据库进行,常用下列软件搜索TANSFAC转录因子数据库以预测目的基因序列的转录因子结合位点:

  • Patch: 能有效分析目的基因序列并提供该序列详细的预测转录因子结合位点。
  • P-MATCH 1.0:与Patch相比提供了更为详细的转录因子结合位点预测分析,预测精确度更高,还可以预测组织特异性转录因子并图形化显示分析结果,是目的microRNA基因转录因子分析的最主要工具
  • AliBaba2:AliBaba2与前两者相比界面简洁直观,能给出较详细的分析数据,且分析结果图形化后可以更直观地搜索相关功能。
  • F-Match
  • Match
  • SIGNAL SCAN

microRNA其他相关的生物信息学分析方法还有新microRNA基因的预测、鉴定、注册以及对于特异microRNA作用机制研究至关重要的靶基因预测等,作者将其放在后续相关的分子生物学方法部分,与相应的分子生物学方法结合阐述,使读者一目了然。


Profile picture

Written by Armin Li , a venture capitalist. [Weibo] [Subscribe]