PIR功能
為了提高蛋白質(zhì)預測和實(shí)驗數據之間的相互吻合度,PIR建立了一套系統,允許研究者們遞交、分類(lèi)、提取文獻信息。PIR提供了在超家族、域和模體水平上的對蛋白的分類(lèi)。PIR同時(shí)提供了蛋白的結構和功能信息,并給出了與其他40個(gè)數據庫之間的相互參考。PIR還提供了一個(gè)非冗余的蛋白質(zhì)數據庫,包括從PIR-PSD,SWISS-PROT,TrEMBL,GenPept,PDB收集來(lái)的約800,000條序列,對每條序列給出了一個(gè)符合的名稱(chēng)和相關(guān)文獻。為了提高數據庫的協(xié)同工作能力,PIR采用的數據庫框架,利用XML技術(shù)進(jìn)行數據發(fā)布。
除了蛋白質(zhì)序列數據以外,PIR還包含以下信息:
(1)蛋白質(zhì)名稱(chēng)、蛋白質(zhì)的分類(lèi)、蛋白質(zhì)的來(lái)源;
(2)關(guān)于原始數據的參考文獻;
(3)蛋白質(zhì)功能和蛋白質(zhì)的一般特征,包括基因表達、翻譯后處理、活化等;
(4)序列中相關(guān)的位點(diǎn)、功能區域。