生物医学知识发现平台
生物医学文献中蕴藏着各种各样的生物医学知识,通过借助不同的数据挖掘/文献挖掘方法,文献挖掘可以选择性的从中提取出特定主题的知识。作为一个完整的文 献挖掘平台,需要完成两类功能:数据处理与文献挖掘。数据处理包括文献数据处理和其他数据处理,如从文献数据库中获取文献数据,验证数据的完整性,提取文 献数据中的特定信息,以及提取其他类型的数据中的指定信息。在数据处理系统提供的规范化数据的基础之上,文献挖掘系统对其进行统计或者NLP方面的分析处 理,进而挖掘出实体名称、实体关联模式和实体关联网络等知识。
根据文献挖掘的处理流程,生物医学知识发现平台包括六个子系统:1)文献获取系统,主要功能包括文献下载、文献校验、数据更新和数据日志分析等;2)数据 预处理系统,主要功能为从原始数据中提取出指定的信息,并按照需求保存为合适的格式;3)NLP系统,加工文本数据,将文本数据转换为可以进行知识推理的 素材,主要功能为分词、实体名称识别、词性标注和实体名称映射等;4)关系挖掘系统,主要功能为计算实体共出现频率,提取实体关联模式,提取关联实 体;5)网络构建系统,主要功能是提供实体关联网络的基本性质以及连通子图、Hub子图和关联子网络的提取;6)网络可视化系统,图形化展示网络分析结 果。系统的部分成果发布在http://lifecenter.sgst.cn/textweb。
技术基础
生物医学知识发现平台是一个JavaEE系统,整合了GeniaTagger、Mallet、ABner和Standford Parser等自然语言处理相关的软件,能够完成常见的文本挖掘任务。由于文本挖掘任务是高计算量的工作,知识发现平台在多线程处理方面进行了大量的优化 工作。
服务方式
依托知识发现平台,我们能够提高如下的服务:
生物医学文献注释与服务:从文献中识别出实体,从而实现文献注释的目的,并能够在传统的文献查询功能基础之上,提高基于实体的查询;
特定疾病相关的文本挖掘:能够提供疾病及其相关疾病的信息,以及疾病相关的基因、蛋白质、小分子等信息;
多个基因/蛋白质的关联网络分析:依托全文献数据库的文本挖掘结果,构建实体关联网络,从而能够从网络中找出指定的基因/蛋白质之间的关系,并以网络的形式展示这种关系;
生物医学数据整合服务:借助实体关联网络和实体名称-生物医学数据映射技术,我们能够提供基于文献的数据整合服务;
其它文本挖掘定制服务:我们可以依照用户需求,分析文献的内容,为用户定制特定的文本挖掘服务。
bio-equip.com
无锡众信科技有限公司(Shorigen Technology Wuxi Co,.Ltd)是在无锡市引进领军型海外留学归国创业人才计划(简称“530”计划)中创建的。公司以上海生物信息技术研究中心为依托,以中心主持和参与的国家重大科技专项、973、863等项目的科研成果为技术支撑,着重于科研成果的转化。
目前,公司正致力于医疗卫生信息化技术的研究、开发和服务,已研制出拥有自主知识产权的多套医疗信息化软件系统,已在全国多个医疗、科研机构广泛使用。
未来,公司将继续秉承以信息技术为引领,着重科研成果转化,全方位提供面向医疗、健康和生物医药产业的专业化服务,促进公众健康产业的发展,实现“服务大众健康、立足信息技术”。
资质与荣誉
2009年10月31日荣获中国医药生物技术协会“生物医学信息技术分会常务委员”聘书
2010年04月11日荣获中国医药生物技术协会“组织生物样本库分会会员”聘书
2010年3月荣获无锡市人民政府“2009年530计划C类项目”
2010年12月30日“众信样本库信息管理系统软件”荣获国家版权局“计算机软件著作权”
2011年01月21日“众信样本库信心管理系统软件”通过江苏省软件产品检测中心“软件产品登记检测”
2011年01月07日通过“ISO9001质量管理体系认证”
2011年05月18日通过江苏省经济和信息化委员会“软件企业认定”
2011年05月18日“众信样本库信息管理系统软件”荣获江苏省经济和信息化委员会“软件产品登记证书”
2011年06月01日“肺结节图像过滤软件系统” 荣获国家版权局“计算机软件著作权”
2011年06月01日“肺癌智能辅助诊断软件系统” 荣获国家版权局“计算机软件著作权”
2011年06月08日“肺癌影像学导航学习软件系统” 荣获国家版权局 “计算机软件著作权”
2011年06月21日“众信科研电子病例管理系统软件” 荣获国家版权局“计算机软件著作权”
2011年06月23日“众信科研电子病例管理系统软件”通过江苏省软件产品检测中心“软件产品登记检测”
2011年07月05日“众信实验室信息管理系统软件” 荣获国家版权局“计算机软件著作权”
2011年07月06日荣获无锡市科学技术局、无锡市财政局“2011年无锡市第六批科技发展计划(创新基金-创新项目)项目(项目编号CBE011107)”