一、差异基因筛选
首先对原始数据进行预处理和均一化处理。没有重复的数据采用倍数法和 Z 值法相结合的方法来进行差异基因的筛选,挑选出至少在一个样本里表达倍数大于 two fold及 Z 的绝对值大于 2(即 Z>2 或 Z<-2)的基因挑出。对于有重复实验的芯片数据则采用统计方法来进行差异基因的筛选。
二、 聚类分析
针对多芯片结果进行了芯片间及差异表达基因之间的双向聚类,同时对新基因的功能进行预测,目的是对不同的样本进行分类,并对差异基因进行相似性分析。聚类方法包括层次聚类,K-means聚类及SOM等。
三、功能分类
对差异基因进行相应的生物学功能分类,采用GO 数据库中的功能聚类注释结果,并根据统计检验方法(P-value)筛选显著显异的分类。最后针对客户的需求进行结果的输出。
四、pathway分析
建立信号通路和生物功能网络,将差异基因与相关的信号通路进行比较、整合,找出基因之间的相互关系,进行通路动态仿真。并根据统计检验方法(P-value)筛选显著显异的代谢通路,已期对致病基因构建模拟疾病状态的通路网络,对目的基因进行分析,以期发现目的基因与疾病之间在生物学通路或生化途径上的关联。
Pathway中差异基因的统计图
差异基因在代谢途径上的分析情况,红色标记上调基因,绿色标记下调基因
五、转录因子(TF)分析
利用相关的转录因子(TF)数据库,采用pwmatch算法对每个转录因子分析其在差异基因中的分布情况,利用chi-square test等统计方法寻找有差异的转录因子。目的在于找到调控目标生物性状,统计学上有显著差别的转录因子。
六、 Data-driven Network分析
对差异基因进行Co-expression基因调控网络的构建。采用贝叶斯方法,通过对表达数据进行机器学习,来构建差异基因之间的动态网络。这是一种数据驱动的网络构建,可以发现一些新的调控关系。
七、 Knowledge-driven Network分析
通过整合PubMed text mining,同源预测,基因neighbor,蛋白-蛋白相互作用,基因融合等数据,建立一个all differentially expressed genes in a single plot的调控网络。这是一种已有知识驱动的网络构建。目的在于对前人的研究结果和本实验的生物信息进行关联分析,以期找到一些新的基因共表达的线索,发现新的规律。
八、疾病的分型
主要是针对复杂的疾病,利用芯片数据对这些疾病的子类型进行区分,识别传统诊断手段无法辨别,但对预后却有重要意义的亚型。
九、(疾病)预测模型的构建
利用Bayesian network, PAM及SVM等机器学习语言对芯片结果进行预测模型的构建,将部分芯片数据拿来做预测模型,然后部分芯片数据作为测试数据集(独立样本)来验证模型的准确性。目的在于利用实验数据来筛选出一批靶标基因,并以此构建模型,以进行早期诊断、疾病预测和预后分析。
十、基因表达趋势分析
应用模糊聚类等机器学习方法,对差异基因进行基因表达趋势的显著性分析,筛选出随着时间的变化,显著性的基因表达趋势,同时得到相应的目标表达趋势。对随着时间的深入差异表达的基因,进行基因表达趋势分析,筛选出不同处理作用的最重要的基因表达趋势。
* 所有解释权及版权归上海敏芯信息科技有限公司所有,详情请咨询021-31523052
bio-equip.com
上海敏芯信息科技有限公司
上海敏芯信息科技有限公司成立于2006年10月,是国内知名的生物信息学服务提供商。随着业务扩展,公司已经发展成为国内第一家专业提供系统生物学服务的高科技企业,提供包括基因组学、转录组学、蛋白质组学、代谢组学相关的实验设计、实验检测、数据分析、结果验证及论文修改的全面解决方案。公司已获得国家及上海市中小企业创新基金、上海市科技创新行动计划、上海市大学生创业基金、上海市专利试点企业、上海市技术成果转化认证、上海市杨浦区人才资助资金等多项国家及省部级奖励。
具体业务包括:
-基因芯片:表达谱芯片、miRNA芯片、SNP芯片、甲基化芯片、Exon芯片、Tilling芯片、lncRNA芯片等实验及数据分析
- 高通量测序:miRNA测序、mRNA测序、基因组重测序、甲基化测序、ChIP-Seq等实验及数据分析
-蛋白质组学:蛋白质芯片(SELDI)、细胞因子芯片、ITRAQ、Shotgun Proteomics、DIGE-2D等
- 代谢组学:液质联用(LC-MS)、气质联用(GC-MS)及核磁共振(NMR)的实验及数据分析
- 文献挖掘:提供基于pubmed数据库的关键词搜索服务
- 生物信息培训:定期举办综合性生物信息培训班,并提供上门培训服务及随到随学班
u 专利代理:提供生命科学领域的专利写作、专利润色及专利申请服务
- 实验服务:引物设计、RT-PCR、3730测序、Western Blot、2D-MS等
目前,公司国内外客户已超过500家,合作发表了50多篇高影响因子的SCI(影响因子累计超过100分),并参与多项国家科研项目的申请与实施。