首先提取总RNA进行表达谱的solexa 实验,并对实验得出来的差异基因进行进一步的分析,如:聚类分析,GO 分类,Pathway 分析,IF 分析,Data-driven Network 分析及Knowledge-driven Network 分析等。
依据不同的分组,筛选出差异基因,然后对所有差异基因首先进行功能注释,对于未知功能的基因进行同源比对。表达值首先经过对数转换,作为层次聚类算法的输入。对三组样品进行层次聚类分析。
对差异表达的所有基因向gene ontology 数据库的各节点映射。计算每个节点的基因数目,并结合整个数据库的基因作为背景分部,对于每个节点,得到一个2x2 的表格,使用超几何分布检验基因在每个GO 节点的富集或贫乏程度。
与GO 分析类似,我们同样将差异基因使用GenMAPP v2.1 向KEGG pathway 和BioCarta 数据库映射。通过统计方案,找到统计上最有意义的pathway。
四、Knowledge-driven Network 分析
通过整合PubMed text mining,同源预测,基因neighbor,蛋白-蛋白相互作用,基因融合等数据,建立一个all differentially expressed genes in a single plot 的调控网络。这是一种已有知识驱动的网络构建。
对差异基因进行Co-expression基因调控网络的构建。采用贝叶斯方法,通过对表达数据进行机器学习,来构建差异基因之间的动态网络。这是一种数据驱动的网络构建,可以发现一些新的调控关系。
利用相关的转录因子(TF)数据库,将差异基因的启动子(基因第一个外显子上游1000bp)提取出来。我们使用HsPD 提供的启动子序列。转录因子数据库使用TRANSFAC 7.0 public。转录因子结合位点预测使用pwmatch 程序,对每个转录因子分析其在上调基因和下调基因的分布情况,利用chi-square test 寻找有差异的转录因子。
鸟枪法solexa数据分析服务内容
适用于将mRNA随机打碎后进行solexa测序的实验。
我们建立Exon-junction序列数据库。利用比对分析,可以鉴定出新的可变剪切现象。
利用单位长度内tag的密度可以准确估计不同转录本的表达量。即:
Reads per KB per million reads (RPKM), using the formula:
R = 109C/NL
通过建立基因间序列数据库,我们可以寻找新的转录本。
我们对新的转录本进行编码区预测,没有显著编码区的基因被认为是非编码RNA,可以对其进行实验验证。
对差异表达的所有基因向gene ontology 数据库的各节点映射。计算每个节点的基因数目,并结合整个数据库的基因作为背景分部,对于每个节点,得到一个2x2 的表格,使用超几何分布检验基因在每个GO 节点的富集或贫乏程度。
与GO 分析类似,我们同样将差异基因使用GenMAPP v2.1 向KEGG pathway 和BioCarta 数据库映射。通过统计方案,找到统计上最有意义的pathway。
bio-equip.com
上海敏芯信息科技有限公司
上海敏芯信息科技有限公司成立于2006年10月,是国内知名的生物信息学服务提供商。随着业务扩展,公司已经发展成为国内第一家专业提供系统生物学服务的高科技企业,提供包括基因组学、转录组学、蛋白质组学、代谢组学相关的实验设计、实验检测、数据分析、结果验证及论文修改的全面解决方案。公司已获得国家及上海市中小企业创新基金、上海市科技创新行动计划、上海市大学生创业基金、上海市专利试点企业、上海市技术成果转化认证、上海市杨浦区人才资助资金等多项国家及省部级奖励。
具体业务包括:
-基因芯片:表达谱芯片、miRNA芯片、SNP芯片、甲基化芯片、Exon芯片、Tilling芯片、lncRNA芯片等实验及数据分析
- 高通量测序:miRNA测序、mRNA测序、基因组重测序、甲基化测序、ChIP-Seq等实验及数据分析
-蛋白质组学:蛋白质芯片(SELDI)、细胞因子芯片、ITRAQ、Shotgun Proteomics、DIGE-2D等
- 代谢组学:液质联用(LC-MS)、气质联用(GC-MS)及核磁共振(NMR)的实验及数据分析
- 文献挖掘:提供基于pubmed数据库的关键词搜索服务
- 生物信息培训:定期举办综合性生物信息培训班,并提供上门培训服务及随到随学班
u 专利代理:提供生命科学领域的专利写作、专利润色及专利申请服务
- 实验服务:引物设计、RT-PCR、3730测序、Western Blot、2D-MS等
目前,公司国内外客户已超过500家,合作发表了50多篇高影响因子的SCI(影响因子累计超过100分),并参与多项国家科研项目的申请与实施。