非冗余蛋白质数据库众多，具体都有哪些？如何区分和选择？

2026年1月23日 23:42 • 虚拟主机 • 阅读 177

非冗余蛋白质数据库

随着生物信息学的发展,蛋白质数据库在生物科学研究中的应用越来越广泛，非冗余蛋白质数据库是其中一类重要的资源，它们通过去除冗余信息，为研究者提供更为精确和高效的蛋白质数据查询服务，以下是一些主要的非冗余蛋白质数据库及其特点。

UniProt

UniProt是一个综合性的蛋白质数据库,它收集了来自多个来源的蛋白质信息，包括蛋白质序列、结构、功能描述等，该数据库的非冗余部分称为UniProtKB，它通过严格的筛选过程去除冗余，确保每个蛋白质条目都是唯一的。

特点：

PDB

蛋白质数据银行（Protein Data Bank，简称PDB）是一个全球性的蛋白质结构数据库，它收集了蛋白质的三维结构信息，PDB的非冗余部分包括结构域和亚基，通过去除重复的结构信息，提供了蛋白质结构的唯一表示。

特点：

NCBI Protein

美国国家生物技术信息中心（National Center for Biotechnology Information，简称NCBI）的蛋白质数据库是一个基于序列的数据库，它通过去除冗余序列，提供了蛋白质序列的唯一表示。

特点：

SWISS-PROT

SWISS-PROT是一个高质量的蛋白质序列数据库，它通过去除冗余序列，提供了蛋白质序列的唯一表示，该数据库注重蛋白质的功能和结构信息，为研究者提供了可靠的蛋白质数据。

特点：

TrEMBL

TrEMBL（Translation Extended Markup Language）是SWISS-PROT的一个补充数据库，它收集了来自科学文献和实验数据的蛋白质序列信息，TrEMBL的非冗余部分通过去除重复序列，提供了蛋白质序列的唯一表示。

特点：

非冗余蛋白质数据库在生物科学研究中扮演着重要角色,它们通过去除冗余信息，为研究者提供了更为精确和高效的蛋白质数据查询服务，上述五个数据库是目前较为常用的非冗余蛋白质数据库，它们各自具有独特的特点和优势，为生物科学研究提供了丰富的资源。

图片来源于AI模型，如侵权请联系管理员。作者：酷小编，如若转载，请注明出处：https://www.kufanyun.com/ask/253926.html