PDB数据库简介及下载数据方法解析 (pdb数据库中下载数据)
在生物科学领域中,蛋白质是极其重要的一类分子,它们负责维持细胞的正常功能,参与到细胞的各种代谢过程中。其中,对蛋白质结构的研究是了解蛋白质在生物学中作用的关键。蛋白质数据银行(Protein Data Bank,简称PDB)是全球共同建立和维护的一个重要蛋白质结构数据库,旨在推进生命科学的发展,提高生命科学研究质量,为科学与工业界的成就提供服务。本文将介绍PDB数据库的基本情况以及如何下载PDB数据库中的数据。
一、PDB数据库简介
1.1 PDB数据库背景
PDB数据库是一个协作的国际数据存储中心,由许多国际机构共同维护。PDB数据库的数据内容是X射线衍射结构、核磁共振(NMR)谱、电子显微镜(EM)成像和一些特殊结构(如DNA、RNA结构库)等内容。该数据库的要求是其所收录的所有结晶蛋白质物的原子级结构必须完全确定,同时还需要有相关文献证明。这些文献需要指出实验结果,并详情说明数据的得到和处理过程。
1.2 PDB数据库的使用
科学家们可以通过搜索引擎或者单独访问PDB数据库的官方网站(https://www.rc.org/)来浏览并查询数据库中所存储的结构信息。PDB数据库是一个公共数据库,任何人都可以在上面免费查看和下载任何结晶蛋白质物的结构文件。PDB数据库的数据可用于科研及学术交流用途,也可用于大型生物制药企业的代谢工程。
1.3 PDB数据库的发展历程
PDB数据库最初的版本在1971年由G.R. Hendrickson及其他的科学家建立,其目的是存储结晶蛋白质物的结构信息。到了1990年代,PDB数据库的数据量急剧增长,基础设施的建设则滞缓不前,这導致了数据查詢和下载的困難。1998年,由当时的三个主要贡献者 RCSB、PDBE和PDBj共同建立了PDB统一入口,并聘请专业人员负责数据存储和管理,科学家可以在任何一个合作方的网站问数据库。透過透明的合作机制,PDB建立了一个500多个员工跨越72个国家的明确的国家差异联盟。目前,PDB数据库的版本号已经到了2023年10月27日的v.3.48.0。
二、PDB数据库中的数据类型
PDB数据库中包含了不同类型的蛋白质结构信息,每一种数据类型都有其特定的样本结构描述方式。
2.1 晶体学数据
晶体学数据最为常见,其中包括很多精细的描述信息和三维坐标的点阵数据和位于凝聚态的原子级。
2.2 核磁数据
核磁信号被用来解决固定条件下,高分子大分子结构的问题。该数据也可以采用PDBx/mmCIF格式。
2.3 基因数据
针对大规模数据的重要来源,基因数据包含了构建结晶蛋白质物的DNA和RNA信息,这些数据是由生物学家来描述的
2.4 电子显微镜数据(EM)
电子显微镜数据(EM)方法,摄取三维分辨率的大分子影像。传统的光学显微镜方法在分辨率上受到临界孔径线宽的限制,因而无法用于观察高分子大分子结构。而电子显微镜利用电子束代替可见光,从而摆脱了上述限制,可以对高分子大分子的结构进行观察和分析。
2.5 表示简单序列的数据
PDB数据库还可用于含有未简化氨基酸序列,所以也有过表现文章的数据。
三、如何下载PDB数据
3.1 登录PDB数据库网站
打开PDB数据库的官方网站:https://www.rc.org/
3.2 搜索并下载PDB数据
在网站首页中,选择搜索框,输入你要查询的蛋白质名称或PDB编号,单击“Search”。用户将获得的结果展示在自己的屏幕上。接下来,可以直接点击每个蛋白质或者结构名称,并在其详细页面中查看所有描述信息。在页面底部板块上,会看到“Download files”(下载文件)按钮,请点击此按钮。接着,选择您要下载的格式(PDB或PDBx/mmCIF等)并单击“Download”. PDB文件可以用于衍射结构,而PDBx/mmCIF结构可以用于配合星 etc. 的结构研究。
四、PDB数据库各功能介绍
4.1 3D molecular view
3D molecular view功能展示了蛋白质的构象及其手性,提供了快速下载原始结构文件的互动工具,可帮助用户进一步对PDB数据的理解,便于更深入的研究。
4.2 Sequence data and homology modeling
该服务从PDB数据中提取出蛋白质序列以及启示式,可以配给、比较、归类、构建模型等基础功能。
4.3 Ligand Explorer
该服务涵盖了当前PDB数据库中所有的小分子数据及与之相关的所有信息。此外还提供了相应药物的详细属性信息。
4.4 ChemCompSearch
ChemCompSearch支持在PDB数据库中搜索和选择特定化合物,以便了解其空间构象和影响。
综上所述,PDB数据库是一个重要的蛋白质结构数据库,许多科学家都会在科研及学术交流中应用PDB数据库的数据。对于科研工作者来说,在寻找特定蛋白质结构信息时,首先要清楚了解PDB数据库,并熟悉如何下载其中的数据。在后续的科研工作中,PDB数据库的各项功能还可以用来辅助完成更加深入有益的研究工作。