English | 中文版 | 手机版 企业登录 | 个人登录 | 邮件订阅
当前位置 > 技术服务 > 生物研发服务> 芯片与生物信息学 > 基因/蛋白文献挖掘服务(NLP)
基因/蛋白文献挖掘服务(NLP)
针对客户提供的关键词,利用NLP方法从PubMed文献摘要数据库中查找到与之相关的所有基因或蛋白、小RNA、SNP、化合物等信息,并进行基因互作及调控网络的构建及分析。
服务类别:芯片与生物信息学总访问:3293
最后更新:2014-4-1半年访问:10
参考报价:询021-31523052
立即询价 电话咨询
[发表评论] [本类其他服务] [本类其他服务商]
服务商: 上海敏芯信息科技有限公司 查看该公司所有服务 >>
  • 服务介绍
  • 公司简介

 

基因/蛋白文本挖掘(NLP)数据分析方案

 
 
 
一、项目目标:
 
      利用NLP(Natural Language Processing)方法从PubMed文献摘要数据库中分析A(某基因、蛋白、microRN或其他)调控网络,并对互作的基因进行GO、pathway分析。
 
用途:
构建基因-基因互作网络、基因-蛋白互作网络、基因-microRNA互作网络、蛋白-蛋白互作网络、microRNA-microRNA互作网络。
 
 
二、项目方案
 
2.1. 基本流程
 
1) 利用关键词进行文档搜索,并将文档整理成XML格式。
2) 将摘要文本分离成单个句子。后续的分析是以句子为基本单位的。
3) 利用B软件进行人类基因的描述的定位,提取基因。
4) 基因符号以NCBI的entrez gene数据库为准。基因互作关系由B软件绘制为网络结构。
5) 建立一个基因互作的verb词典,分离句子中基因互作的verb。
6) 生成A基因同义词字典,分离句子中A基因的描述。
7) 统计分析基因名、互作verb和A基因同时出现(co-occurrence)的句子。整理列表。
8) 基因互作关系由B软件绘制为网络结构。
 
2.2. 分析结果
 
互作基因列表:

基因名
匹配的文章数
与目标基因的关系
文章摘要中出现的句子
HNF4A
75
target
HNF4A is an target gene with A gene
APC
56
associate
…….
EGFR
24
associate
……….
Mir-122
22
Associate
…………
。。。。
。。。。。。。
。。。。。。。。。
 。。。。。。。

 
2.3. 网络构建
 
     将文章篇数进行统计,最终发现与A互作的基因共有n个,其中与A可能形成复合体的(互作关系为associate、bind等)的基因共有m个,这些基因可能形成复合体。
 
2.4基因功能性分析
 
2.4.1. pathway分析
 
    将与A互作的n个基因对应到KEGGpathway数据库中,并计算每个pathway的富集p-value。挑选p-value<0.01的pathway。
 
2.4.2.GO分析
 
    将与A互作的n个基因对应到GO数据库中,并计算每个GO节点的富集p-value。GO有以下三种分类:
    biological process分类
    cellular component分类
    molecular function分类
 
 
 
 
 
 
     所有解释权归上海敏芯信息科技有限公司所有;根据客户的要求可以继续进行其他的深入分析。
 
详询021-31523052
bio-equip.com
售后服务
快速询价登录注册在线询价 (请留下您的联系方式,以便供应商联系您)
* 姓  名:
* 地  区:
* 单  位:
职  位:
* 手机/电话:
* E-mail:
请寄产品资料:
需要 不需要
请报价格:
需要报价 不需要报价
留  言:
验证码:
换一张
发表评论在线评论(0条)
手机版:基因/蛋白文献挖掘服务(NLP)
您最近浏览过的服务
Copyright(C) 1998-2025 生物器材网 电话:021-64166852;13621656896 E-mail:info@bio-equip.com
立即询价