DSSP 是用于對(duì)蛋白質(zhì)結(jié)構(gòu)中的氨基酸殘基進(jìn)行二級(jí)結(jié)構(gòu)構(gòu)像分類的標(biāo)準(zhǔn)化算法,由Wolfgang Kabsch和Chris Sander設(shè)計(jì)。

簡介

DSSP數(shù)據(jù)庫是由此算法生成的一個(gè)存放蛋白質(zhì)二級(jí)結(jié)構(gòu)分類數(shù)據(jù)的數(shù)據(jù)庫,其中包括了PDB數(shù)據(jù)庫(Protein Data Bank)中的所有條目。算法名稱Define Secondary Structure of Proteins由作者在其原始論文中,作為實(shí)現(xiàn)該算法的Pascal語言程序名稱所提及。DSSP數(shù)據(jù)庫英文全稱則為Definition of Secondary Structure of Proteins。

算法原理

DSSP算法使用PDB格式的原子級(jí)分辨率的蛋白質(zhì)三維結(jié)構(gòu)坐標(biāo)集數(shù)據(jù),依靠以靜電學(xué)定義進(jìn)行的氫鍵識(shí)別,以及對(duì)主鏈和側(cè)鏈二面角的計(jì)算,從而得到每個(gè)氨基酸殘基的二級(jí)結(jié)構(gòu)構(gòu)象參數(shù)。算法使用的鍵能公式為:

E=q1q2{1/rON+1/rCH-1/rOH-1/rCN}·332 kcal/mol

其中q1=0.42,q2=0.20。以上參數(shù)來自分別為-0.42e和+0.20e的羰基氧原子和氨基氫原子間的局部電荷、以及羰基碳原子和氨基氮原子間的互斥電荷。當(dāng)鍵能小于-0.5 kcal/mol時(shí),DSSP算法將其定義為一個(gè)氫鍵。DSSP根據(jù)氫鍵模式,可以識(shí)別八種類型的二級(jí)結(jié)構(gòu)構(gòu)像,各構(gòu)像擁有各自的標(biāo)識(shí)符。這八種構(gòu)像為:310螺旋,α-螺旋,π-螺旋三種螺旋,分別以G、H和I標(biāo)識(shí),它們的識(shí)別特征是殘基與主鏈中分別3、4、5個(gè)后續(xù)殘基間形成氫鍵并產(chǎn)生重復(fù)序列;兩種β-折疊片中的氫鍵對(duì)類型,平行與反向平行橋中,單獨(dú)的橋結(jié)構(gòu)標(biāo)識(shí)為B,即β-橋,含有β-凸起的折疊片標(biāo)識(shí)為E;在其余構(gòu)像種,包含即具有螺旋典型特征,連接螺旋與折疊結(jié)構(gòu)的轉(zhuǎn)角區(qū)域表示為T,具有高曲率,即從第i個(gè)主鏈α碳原子指向第i+2個(gè)的向量與從第i-2個(gè)α碳原子指向第i個(gè)的向量間夾角小于70°的區(qū)域標(biāo)識(shí)為S,這也是程序中唯一不依靠氫鍵分類的構(gòu)像,剩余的環(huán)狀區(qū)域標(biāo)識(shí)為L。

這八種構(gòu)像在實(shí)用中又常被歸為三個(gè)大類:螺旋(G、H和I)、折疊(E和B)以及環(huán)狀結(jié)構(gòu)(其余所有標(biāo)識(shí)符)。