Dalam biologi molekul, domain protein ialah kawasan rantai polipeptidaprotein yang menstabilkan diri dan berlipat bebas daripada yang lain. Setiap domain membentuk struktur tiga dimensi terlipat padat. Banyak protein terdiri daripada beberapa domain, dan domain mungkin muncul dalam pelbagai protein yang berbeza. Evolusi molekul menggunakan domain sebagai blok binaan, dan ini mungkin digabungkan semula dalam susunan yang berbeza untuk mencipta protein dengan fungsi yang berbeza. Secara umum, panjang domain berbeza-beza dari antara kira-kira 50 asid amino sehingga 250 asid amino panjangnya.[1] Domain terpendek seperti jejari zink, distabilkan oleh ion logam atau jambatan disulfida. Domain selalunya membentuk unit berfungsi seperti domain tangan EF yang mengikat kalsium dalam kalmodulin. Oleh kerana ia stabil secara bebas, domain boleh "ditukar" oleh kejuruteraan genetik antara satu protein dengan protein lain untuk membuat protein kimera.
Latar belakang
Konsep domain pertama kali dicadangkan pada tahun 1973 oleh Wetlaufer selepas kajian kristalografi sinar-X lisozim ayam[2] dan papain,[3] dan oleh kajian proteolisis terhad imunoglobulin.[4][5] Wetlaufer mendefinisikan domain sebagai unit struktur protein yang stabil yang boleh dilipat secara autonomi. Pada masa lalu, domain telah diterangkan sebagai unit:
Setiap takrifan adalah sah dan selalunya bertindih, iaitu domain struktur padat yang terdapat dalam kalangan pelbagai protein berkemungkinan terlipat secara bebas dalam persekitaran strukturnya. Alam semula jadi sering menyatukan beberapa domain untuk membentuk protein multidomain dan pelbagai fungsi dengan sejumlah besar kemungkinan.[9] Dalam protein multidomain, setiap domain boleh memenuhi fungsinya sendiri secara bebas, atau secara bersepadu dengan jirannya. Domain boleh berfungsi sama ada sebagai modul untuk membina himpunan besar seperti zarah virus atau gentian otot, atau boleh menyediakan tapak pemangkin atau pengikat tertentu seperti yang terdapat dalam enzim atau protein pengawalseliaan.
Contoh yang sesuai ialah piruvat kinase (lihat rajah pertama), enzim glikolisis yang memainkan peranan penting dalam mengawal fluks daripada fruktosa-1,6-bifosfat kepada piruvat. Ia mengandungi domain pengikat nukleotida semua β (warna biru), domain pengikat substrat α/β (berwarna kelabu) dan domain kawal ataur α/β (dalam hijau zaitun),[10] disambungkan oleh beberapa penghubung polipeptida.[11] Setiap domain dalam protein ini wujud dalam pelbagai set keluarga protein.[12]
Domain pengikat substrat balang α/β pusat ialah salah satu lipatan enzim yang paling biasa. Ia dilihat dalam banyak keluarga enzim yang berbeza yang memangkinkan tindak balas yang sama sekali tidak berkaitan.[13] Balang α/β biasanya dipanggil balang TIM yang dinamakan sempena triosa fosfat isomerase, struktur balang pertama diselesaikan.[14] Ia kini dikelaskan kepada 26 keluarga homolog dalam pangkalan data domain CATH.[15] Balang TIM terbentuk daripada urutan motif β-α-β yang ditutup oleh ikatan hidrogen untaian pertama dan terakhir bersama-sama, membentuk lapan laras terdampar. Terdapat perdebatan tentang asal usul evolusi domain ini. Satu kajian telah mencadangkan bahawa enzim nenek moyang tunggal boleh mencapah kepada beberapa keluarga,[16] manakala satu lagi mencadangkan bahawa struktur tong TIM yang stabil telah berkembang melalui evolusi konvergen.[17]
Balang TIM dalam kinase piruvat adalah "tidak selanjar", bermakna lebih daripada satu segmen polipeptida diperlukan untuk membentuk domain. Ini berkemungkinan hasil daripada penyisipan satu domain ke domain lain semasa evolusi protein. Ia telah ditunjukkan daripada struktur yang diketahui bahawa kira-kira satu perempat daripada domain struktur tidak berterusan.[18][19]
Unit struktur protein
Struktur primer (rentetan asid amino) protein akhirnya mengekodkan konformasi tiga dimensi (3D) yang dilipat secara unik.[20] Faktor terpenting yang mengawal lipatan protein ke dalam struktur 3D ialah taburan rantai sisi berkutub dan tak berkutub.[21] Lipatan didorong oleh pengebumian rantai sampingan hidrofobik ke dalam bahagian dalam molekul untuk mengelakkan persekitaran luar berair. Secara am, protein mempunyai teras sisa hidrofobik yang dikelilingi oleh luaran sisa hidrofilik. Oleh kerana ikatan peptida itu sendiri adalah berkutub, ia dineutralkan oleh ikatan hidrogen antara satu sama lain apabila berada dalam persekitaran hidrofobik. Ini menimbulkan kawasan polipeptida yang membentuk corak struktur 3D biasa yang dipanggil struktur sekunder. Terdapat dua jenis utama struktur sekunder: α-heliks dan β-helai.[perlu rujukan]
Struktur tertier
Beberapa motif digabungkan untuk membentuk unit padat, setempat, separa bebas yang dipanggil domain.[6] Struktur 3D keseluruhan rantai polipeptida dirujuk sebagai struktur tertier protein. Domain ialah unit asas struktur tertier, setiap domain mengandungi teras hidrofobik individu yang dibina daripada unit struktur sekunder yang disambungkan oleh kawasan gelung. Pembungkusan polipeptida biasanya lebih ketat di bahagian dalam berbanding bahagian luar domain yang menghasilkan teras seperti pepejal dan permukaan seperti bendalir.[22] Sisa teras selalunya dipelihara dalam keluarga protein, manakala sisa dalam gelung kurang terpelihara melainkan ia terlibat dalam fungsi protein. Struktur tertiari protein boleh dibahagikan kepada empat kelas utama berdasarkan kandungan struktur sekunder domain.[23]
Domain semua-α mempunyai teras domain yang dibina secara eksklusif daripada α-heliks. Kelas ini didominasi oleh lipatan kecil, kebanyakannya membentuk satu berkas ringkas dengan heliks berjalan ke atas dan ke bawah.
Domain semua-β mempunyai teras yang terdiri daripada helaian β antiselari, biasanya dua helaian dibungkus antara satu sama lain. Pelbagai corak dapat dikenal pasti dalam susunan untaian, selalunya menimbulkan pengenalpastian motif berulang, contohnya motif kunci Yunani.[24]
Domain α+β ialah campuran motif semua-α dan semua-β. Pengelasan protein ke dalam kelas ini adalah sukar oleh kerana pertindihan dengan tiga kelas lain, dan oleh itu, tidak digunakan dalam pangkalan data domain CATH.[15]
Domain α/β dibuat daripada gabungan motif β-α-β yang kebanyakannya membentuk helaian β selari yang dikelilingi oleh α-heliks amfipatik. Struktur sekunder disusun dalam lapisan atau balang.
Domain mempunyai had pada saiz.[25] Saiz domain struktur individu berbeza daripada 36 sisa dalam E-selektin kepada 692 sisa dalam lipoksigenase 1,[18] tetapi majoriti (90%) mempunyai kurang daripada 200 sisa,[26] dengan purata kira-kira 100 sisa.[27] Domain yang sangat pendek, kurang daripada 40 sisa, selalunya distabilkan oleh ion logam atau ikatan disulfida. Domain yang lebih besar, yakni lebih daripada 300 sisa, mungkin terdiri daripada berbilang teras hidrofobik.[28]
Pertukaran domain
Pertukaran domain ialah mekanisme untuk membentuk himpunan oligomer.[29] Dalam pertukaran domain, unsur sekunder atau tertier protein monomer digantikan oleh unsur yang sama dari protein lain. Pertukaran domain boleh terdiri daripada elemen struktur sekunder kepada keseluruhan domain struktur. Ia juga mewakili model evolusi untuk penyesuaian berfungsi secara pengoligomeran, contohnya enzim oligomer yang mempunyai tapak aktifnya di antara muka subunit.[30]
Domain sebagai modul evolusi
Jujukan baharu diadaptasi daripada jujukan sedia ada dan bukannya dicipta. Domain ialah bahan biasa yang digunakan oleh alam semula jadi untuk menjana jujukan baharu; ia boleh dianggap sebagai unit mudah alih genetik, dirujuk sebagai ːmodul". Selalunya, terminal C dan N domain adalah berdekatan, membolehkan ia mudah "dimasukkan ke" struktur induk semasa proses evolusi. Banyak keluarga domain ditemui dalam ketiga-tiga bentuk kehidupan, arkea, bakteria dan Eukarya.[31] Modul protein ialah subset domain protein yang ditemui merentasi pelbagai protein yang berbeza dengan struktur yang sangat serba boleh. Contoh boleh didapati antara protein ekstrasel yang dikaitkan dengan pembekuan, fibrinolisis, pelengkap, matriks ekstrasel, molekul lekatan permukaan sel dan reseptor sitokin.[32] Empat contoh konkrit modul protein meluas ialah domain berikut: SH2, imunoglobulin, fibronektin jenis 3 dan Kringle.[33]
Evolusi molekul menimbulkan keluarga protein berkaitan dengan jujukan dan struktur yang serupa. Walau bagaimanapun, persamaan jujukan boleh menjadi sangat rendah antara protein yang berkongsi struktur yang sama. Struktur protein mungkin serupa kerana protein telah menyimpang daripada leluhur yang sama. Sebagai alternatif, beberapa lipatan mungkin lebih bercenderung daripada yang lain kerana ia mewakili susunan stabil struktur sekunder dan beberapa protein mungkin menumpu ke arah lipatan ini sepanjang tempoh evolusi. Pada masa ini, terdapat kira-kira 110,000 struktur 3D protein yang ditentukan secara eksperimen yang disimpan dalam Bank Data Protein (PDB).[34] Walau bagaimanapun, set ini mengandungi banyak struktur yang serupa atau hampir sama. Semua protein harus dikelaskan kepada keluarga struktur untuk memahami hubungan evolusi mereka. Perbandingan struktur paling baik dicapai pada peringkat domain. Atas sebab ini, banyak algoritma telah dibangunkan untuk menetapkan domain secara automatik dalam protein dengan struktur 3D yang diketahui.[perlu rujukan]
Pangkalan data domain CATH mengkelaskan domain kepada kira-kira 800 keluarga lipatan; sepuluh daripada lipatan ini memiliki banyak ahli, dan dirujuk sebagai "lipatan super". Lipatan super ditakrifkan sebagai lipatan yang mana terdapat sekurang-kurangnya tiga struktur tanpa persamaan urutan yang ketara.[35] Jenis lipatan yang paling banyak ahlinya ialah lipatan super balang α/β seperti yang diterangkan sebelum ini.
Protein berbilang domain
Majoriti protein, yakni kira-kira dua pertiga dalam organisma unisel dan lebih 80% dalam metazoa, ialah protein multidomain.[36] Walau bagaimanapun, kajian lain menyimpulkan bahawa 40% daripada protein prokariot terdiri daripada berbilang domain manakala eukariot mempunyai kira-kira 65% protein berbilang domain.[37]
Banyak domain dalam protein multidomain eukariot boleh didapati sebagai protein bebas dalam prokariot,[38] menunjukkan bahawa domain dalam protein multidomain pernah wujud sebagai protein bebas. Sebagai contoh, vertebrat mempunyai polipeptida berbilang enzim yang mengandungi domain GAR sintetase, AIR sintetase dan GAR transformilase (GAR-AIR-GARt; GAR: glisinamida ribonukleotida sintetase/transferase; AIR: aminoimidazola ribonukleotida sintetase). Dalam serangga, polipeptida muncul sebagai GAR-(AIR)2-GARt, manakala dalam yis, GAR-AIR dikodkan secara berasingan daripada GARt, dan dalam bakteria, setiap domain dikodkan berasingan.[39]
Asal usul
Protein multidomain berkemungkinan muncul daripada tekanan terpilih semasa evolusi untuk mencipta fungsi baharu. Pelbagai protein telah menyimpang daripada nenek moyang yang sama dengan gabungan dan persatuan domain yang berbeza. Unit modular kerap bergerak, dalam dan antara sistem biologi melalui mekanisme penyisihan genetik:
transposisi unsur mudah alih termasuk pemindahan mendatar (antara spesies);[40]
penyusunan semula kasar seperti penyongsangan, translokasi, pemadaman dan penduaan;
Organisasi berbilang domain yang paling mudah dilihat dalam protein ialah domain tunggal yang diulang seiring.[41] Domain mungkin berinteraksi antara satu sama lain (interaksi domain-domain) atau kekal terpencil, seperti manik dalam satu rentetan. Protein otot gergasi, Titin, dengan 30,000 sisa, terdiri daripada kira-kira 120 domain jenis fibronektin-III dan jenis Ig.[42] Dalam serina protease, peristiwa duplikasi gen telah membawa kepada pembentukan dua enzim domain balang β.[43] Ulangan telah menyimpang secara meluas sehingga tidak ada persamaan urutan yang jelas di antara mereka. Tapak aktif terletak di celah antara dua domain balang β, di mana sisa fungsian penting disumbangkan daripada setiap domain. Mutan kejuruteraan genetik serina proteasekimotripsin telah ditunjukkan mempunyai beberapa aktiviti proteinase walaupun sisa tapak aktifnya telah dimansuhkan, dan oleh itu, ada pendapat bahawa peristiwa duplikasi meningkatkan aktiviti enzim.[43]
Modul kerap memaparkan hubungan ketersambungan yang berbeza, seperti yang digambarkan oleh kinesin dan pengangkut ABC. Domain motor kinesin boleh berada di kedua-dua hujung rantai polipeptida yang merangkumi kawasan gegelung bergelung dan domain kargo.[44] Pengangkut ABC dibina dengan sehingga empat domain yang terdiri daripada dua modul yang tidak berkaitan, kaset pengikat ATP dan modul membran integral yang disusun dalam pelbagai kombinasi.
Domain dan fleksibiliti protein
Dinamik domain protein memainkan peranan penting dalam pelbagai proses pengecaman dan isyarat molekul. Domain protein yang disambungkan oleh domain penghubung fleksibel yang tidak teratur secara intrinsik, mendorong alosteri jarak jauh melalui dinamik domain protein. Mod dinamik yang terhasil tidak boleh diramalkan secara amnya daripada struktur statik sama ada keseluruhan protein atau domain individu. Walau bagaimanapun, mereka boleh disimpulkan dengan membandingkan struktur protein yang berbeza (seperti dalam Pangkalan Data Gerakan Molekul). Ia juga boleh dicadangkan dengan pensampelan dalam trajektori dinamik molekul yang luas[45] dan analisis komponen utama,[46] atau ia boleh diperhatikan secara langsung menggunakan spektrum[47][48] diukur dengan spektroskopi gema putaran neutron.
Definisi domain daripada koordinat struktur
Kepentingan domain sebagai blok binaan struktur dan elemen evolusi telah menghasilkan banyak kaedah automatik dalam pengecaman dan pengelasannya dalam protein struktur yang diketahui. Prosedur automatik penetapan domain yang boleh dipercayai adalah penting dalam penjanaan pangkalan data domain, terutamanya apabila bilangan struktur protein yang diketahui semakin meningkat. Walaupun sempadan domain boleh ditentukan melalui pemeriksaan visual, pembinaan kaedah automatik tidak mudah. Masalah berlaku apabila berhadapan dengan domain yang tidak berterusan atau sangat berkaitan.[49] Hakikat bahawa tiada definisi piawai tentang apa sebenarnya satu domain protein bermakna bahawa tugasan domain sangat berbeza, dengan setiap penyelidik menggunakan set kriteria yang unik.[50]
Domain struktur ialah substruktur globul yang padat dengan lebih banyak interaksi di dalamnya berbanding dengan protein yang lain.[51] Oleh itu, domain struktur boleh ditentukan oleh dua ciri visual: kekompakan dan tahap pengasingannya.[52] Ukuran kekompakan tempatan dalam protein telah digunakan dalam kebanyakan kaedah awal penetapan domain[53][54][55][56] dan dalam beberapa kaedah yang lebih terkini.[26][57][58][59][60]
Domain fungsi tidak diketahui
Sebahagian besar domain tidak diketahui fungsinya. Domain fungsi tidak diketahui (DUF) ialah domain protein yang tidak mempunyai fungsi yang dicirikan. Keluarga ini telah dikumpulkan bersama dalampangkalan data Pfam menggunakan awalan DUF, diikuti dengan nombor, dengan contoh ialah DUF2992 dan DUF1220. Kini, terdapat lebih 3,000 keluarga DUF dalam pangkalan data Pfam yang mewakili lebih 20% keluarga yang diketahui.[61] Bilangan DUF dalam Pfam telah meningkat daripada 20% (2010) kepada 22% (2019), kebanyakannya disebabkan oleh peningkatan bilangan jujukan genom baharu. Keluaran Pfam 32.0 (2019) mengandungi 3,961 DUF.[62]
^"Structural principles of alpha/beta barrel proteins: the packing of the interior of the sheet". Proteins. 5 (2): 139–48. 1989. doi:10.1002/prot.340050208. PMID2664768.
^"Native proteins are surface-molten solids: application of the Lindemann criterion for the solid versus liquid state". Journal of Molecular Biology. 285 (4): 1371–5. January 1999. doi:10.1006/jmbi.1998.2374. PMID9917381.
^Garel, J. (1992). "Folding of large proteins: Multidomain and multisubunit proteins". Dalam Creighton, T. (penyunting). Protein Folding (ed. First). New York: W.H. Freeman and Company. m/s. 405–454. ISBN978-0-7167-7027-5.
^"Three-dimensional domain duplication, swapping and stealing". Current Opinion in Structural Biology. 7 (3): 416–21. June 1997. doi:10.1016/S0959-440X(97)80060-7. PMID9204285.
^"Domain combinations in archaeal, eubacterial and eukaryotic proteomes". Journal of Molecular Biology. 310 (2): 311–25. July 2001. doi:10.1006/jmbi.2001.4776. PMID11428892.
^"Multi-domain proteins in the three kingdoms of life: orphan domains and other unassigned regions". Journal of Molecular Biology. 348 (1): 231–43. April 2005. doi:10.1016/j.jmb.2005.02.007. PMID15808866.
^"The evolutionary history of the first three enzymes in pyrimidine biosynthesis". BioEssays. 15 (3): 157–64. March 1993. doi:10.1002/bies.950150303. PMID8098212.
^"The elastic I-band region of titin is assembled in a "modular" fashion by weakly interacting Ig-like domains". Journal of Molecular Biology. 255 (4): 604–16. February 1996. doi:10.1006/jmbi.1996.0050. PMID8568900.
^ ab"Gene duplications in the structural evolution of chymotrypsin". Journal of Molecular Biology. 128 (1): 49–79. February 1979. doi:10.1016/0022-2836(79)90308-5. PMID430571.
^"Kinesin proteins: a phylum of motors for microtubule-based motility". BioEssays. 18 (3): 207–19. March 1996. doi:10.1002/bies.950180308. PMID8867735.
SUPERFAMILY Perpustakaan HMM yang mewakili superfamili dan pangkalan data anotasi (superfamili dan keluarga) untuk semua organisma terjujukan sepenuhnya
Pangkalan data fungsian
dcGO Pangkalan data komprehensif ontologi berpusatkan domain tentang fungsi, fenotip dan penyakit.