基于网络模块性的蛋白质序列聚类
DOI:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

国家863计划项目(2006AA020204)


Clustering Protein Sequences through Modularity Optimization
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    蛋白质的远同源性探测是结构基因组学和功能基因组学的主要研究任务之一。一些具有一定相似结构和功能、但序列相似性却较低的蛋白质组成蛋白质超家族,则远同源性探测问题等价于对蛋白质超家族的识别问题。作者提出了一种基于模块性的聚类算法ModuleFind,该方法通过最大化蛋白质网络的模块性来寻找具有较强集团结构的划分。在蛋白质结构分类数据库(SCOP)超家族层次上进行的实验表明,该方法得到的聚类结果更接近分类基准,且具有较高的F-测度值。

    Abstract:

    Remote homology detection between protein sequences is one of the principal research objectives in structural and functional genomics.Proteins with similar structure and function but low sequence similarity consist of protein superfamily.Therefore,the detection of remote homologues is the task of identifying protein superfamily.In this manuscript,a clustering algorithm,called ModuleFind,based on network modularity was presented.The method maximizes the modularity of protein network to find the partitioning with strong community structure.The resulting algorithm gives high quality of clusters quantified by F-measure that combines precise and recall,in the experiments of the detection of the remote homologues based on the superfamily level of SCOP database.

    参考文献
    相似文献
    引证文献
引用本文

梅娟,何胜,王正祥,石贵阳,李炜疆.基于网络模块性的蛋白质序列聚类[J].食品与生物技术学报,2010,29(1):123-127.

MEI Juan, HE Sheng, WANG Zheng-xiang, SHI Gui-yang, LI Wei-jiang. Clustering Protein Sequences through Modularity Optimization[J]. Journal of Food Science and Biotechnology,2010,29(1):123-127.

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期: 2014-06-17
  • 出版日期:

版权所有:《食品与生物技术学报》编辑部

地址:江苏省无锡市蠡湖大道1800号  邮政编码:214122

电话:0510-85913526  电子邮件:xbbjb@jiangnan.edu.cn

技术支持:北京勤云科技发展有限公司

微信公众号二维码

手机版网站二维码