Analiza sekvence u biologiji podrazumeva izlaganje DNK ili peptidnih sekvenci poravnavanju sekvenci,[1] pretragu baza podataka sekvenci, pretragu za ponovljenim sekvencama, ili primenu drugih bioinformatičkih metoda[2] na računaru[3].
Od vremena razvoja metoda visokog-protoka proizvodnje gena i proteinskih sekvenci tokom 90-ih godina, stopa dodavanja novih sekvenci u bazama podataka se kontinuirano povećava. Zbirka sekvenci sama po sebi ne uvećava razumevanje biologije organizama. Međutim, poređenje sekvenci koje imaju poznate funkcije sa novim sekvencama je jedan od načina razumevanja biologije organizma iz kojeg dolazi nova sekvenca. Analiza sekvenci se može koristiti za dodelu funkcija gena i proteina putem studija sličnosti između sekvenci. Danas postoje mnogi alati i tehnike koje omogućuju poređenje (poravnanje) sekvenci, kao i za analizu proizvoda poravnavanja u biološkom kontekstu.[4]
Metodologija
Metodi za poravnavanje sekvenci se dele na metode za poravnavanje parova (poravnavanje dve sekvence), i za višestruko poravnavanje (sa više od dve sekvence). Postoje brojni alati za poravnavanje. Neki od njih su: ClustalW, PROBCONS, MUSCLE, MAFFT, DIALIGN[5], T-Coffee, POA, i MANGO[6].
Postoji više algoritama za studiranje poravnavanja sekvenci, np.: dinamičko programiranje, Skriveni Markovljev model, Viterbi and Greedy.
Povezano
Reference
Literatura