![]() |
利用NLP(Natural Language Processing)方法从PubMed文献摘要数据库中分析A基因调控网络,并对互作的基因进行GO、pathway分析。
|
|||||||||||||||||
[发表评论] [本类其他服务] [本类其他服务商] |
服务商: 上海丰核信息科技有限公司 | 查看该公司所有服务 >> |
一、项目目标:
利用NLP(Natural Language Processing)方法从PubMed文献摘要数据库中分析A基因调控网络,并对互作的基因进行GO、pathway分析。
用途:
基因-基因互作网络、基因-蛋白互作网络、基因-microRNA互作网络、蛋白-蛋白互作网络、microRNA-microRNA互作网络。
二、项目方案
2.1.基本流程
1) 利用关键词进行文档搜索,并将文档整理成XML格式。
2) 将摘要文本分离成单个句子。后续的分析是以句子为基本单位的。
3) 利用B软件进行人类基因的描述的定位,提取基因。
4) 基因符号以NCBI的entrez gene数据库为准。基因互作关系由B软件绘制为网络结构。
5) 建立一个基因互作的verb词典,分离句子中基因互作的verb。
6) 生成A基因同义词字典,分离句子中A基因的描述。
7) 统计分析基因名、互作verb和A基因同时出现(co-occurrence)的句子,整理列表。基因互作关系由某软件绘制为网络结构。
联系我们:
上海总部:
网址:
电子邮箱:market@microsci.com
企业QQ:800068602
电话:4000-331-887
传真:021-61268380转8002
地址:上海市闵行区剑川路951号沧源科技园A楼102室
邮编:200241
淘宝地址:http://shop57095553.taobao.com
----联系时,请注明信息来自“中国生物器材网”----
用手机“扫一扫”,更多学术资讯齐分享!