BLAST

BLAST
Información general
Tipo de programa Herramienta Bioinformática
Autor Altschul S.F., Gish W., Miller E.W. y Lipman D.J.,
Desarrollador NCBI
Licencia Dominio Público
Información técnica
Programado en
Versiones
Última versión estable 2.2.25 ( 31 de marzo de 2011)
Archivos legibles
XML BLAST Output
Archivos editables
XML BLAST Output
Enlaces

BLAST (Basic Local Alignment Search Tool) es un algoritmo y programa informático de alineamiento de secuencias de tipo local, ya sea de ADN, ARN o de proteínas.[1]​ El programa es capaz de comparar una secuencia problema (también denominada en la literatura secuencia query) contra una gran cantidad de secuencias que se encuentren en una base de datos. El algoritmo encuentra las secuencias de la base de datos que tienen mayor parecido a la secuencia problema. Es importante mencionar que BLAST usa un algoritmo heurístico por lo que no nos puede garantizar que ha encontrado la solución correcta. Sin embargo, BLAST es capaz de calcular la significación de sus resultados, por lo que nos provee de un parámetro para juzgar los resultados que se obtienen.

Normalmente el BLAST es usado para encontrar probables genes homólogos. Por lo general, cuando una nueva secuencia es obtenida, se usa el BLAST para compararla con otras secuencias que han sido previamente caracterizadas, para así poder inferir su función. El BLAST es la herramienta más usada para la anotación y predicción funcional de genes o secuencias proteicas. Muchas variantes han sido creadas para resolver algunos problemas específicos de búsqueda.

BLAST es desarrollado por los Institutos Nacionales de Salud del gobierno de EE. UU., por lo que es de dominio público y puede usarse gratuitamente desde el servidor del Centro Nacional para la Información Biotecnológica (NCBI). También está disponible para ser instalado localmente. Algunas ventajas de usar el servidor del NCBI son que el usuario no tiene que mantener ni actualizar las bases de datos y que la búsqueda se hace en un cluster de computadoras, lo que otorga rapidez. Las desventajas son: no se permiten hacer búsquedas masivas dado que es un recurso compartido, no se puede personalizar las bases de datos contra la que busca el programa, y las secuencias son enviadas al servidor del NCBI sin ningún tipo de cifrado, lo que puede ser un problema para quienes quieran mantener sus secuencias privadas. La aplicación local de BLAST tiene la ventaja de que permite manejar varios parámetros que en las búsquedas de NCBI están estandarizados, por lo que provee una mayor flexibilidad para los usuarios avanzados.


Algoritmo del BLAST

BLAST usa el algoritmo Smith-Waterman para realizar sus alineamientos[2]

BLAST usa una matriz de sustitución de aminoácidos o nucleótidos para calificar sus alineamientos. Dicha matriz contiene la puntuación (también llamada score) que se le da al alinear un nucleótido o un aminoácido X de la secuencia A con otro aminoácido Y de la secuencia B. Las matrices más usadas para calificar alineamientos de proteínas son la BLOSUM y la PAM (ambas fueron obtenidas midiendo la frecuencia de los aminoácidos en una gran muestra de proteínas). También se permite al usuario definir su propia matriz. El tipo de matriz usada es determinante para los resultados que se obtendrán, el uso de una matriz incorrecta puede llevar a calificar erróneamente los alineamientos y por lo tanto obtener resultados equivocados.

El algoritmo de BLAST tiene tres etapas principales: ensemillado, extensión y evaluación. A continuación se describen brevemente cada una de ellas:

Primera etapa: ensemillado o seeding.

En esta etapa se buscan "palabras" pequeñas en las secuencias de la base de datos, que corresponden a fragmentos de la secuencia problema. BLAST asume que los alineamientos significativos deben contener estas palabras. Sólo se consideran significativas las palabras que tengan una puntuación mayor a T (T es un parámetro que se pueda modificar al usar el programa) y que se encuentren al menos a una distancia A de otra palabra. W es otro parámetro usado por BLAST y se refiere al tamaño de las palabras a buscar. Ajustando los parámetros T, A y W se puede escoger entre hacer un alineamiento sensible pero lento, o uno más rápido pero con menor sensibilidad.

Segunda etapa: extensión.

Una vez obtenidas las palabras que cumplen con los criterios dados, se pasa a la etapa de extensión. En esta etapa el alineamiento se va extendiendo a ambos lados de las palabras. La extensión realizada en este punto se realiza haciendo uso del algoritmo de Smith-Waterman. BLAST va extendiendo el alineamiento hasta que la puntuación del alineamiento descienda X o más puntos con respecto a la puntuación más alta obtenida anteriormente. Aquí reside el factor heurístico del BLAST, ya que al imponer el límite X, evita extender a lo largo de toda la secuencia todos los alineamientos (proceso que llevaría demasiado tiempo). El peligro que esto conlleva es que el programa se puede quedar atorado en un máximo local. Es por ello que la definición de X es determinante para el resultado.

Tercera etapa: evaluación

Una vez terminada la extensión de todas las palabras, cada uno de los alineamientos realizados es evaluado para determinar su significación estadística. Para ello, el programa elimina los alineamientos inconsistentes (alineamientos que junten la misma parte de la secuencia problema con distintas partes de una secuencia en la base de datos). Los alineamientos resultantes son llamados pares de alta puntuación (High Score Pairs o HSPs, por sus siglas en inglés). Una vez realizado esto, se calcula la puntuación final de los alineamientos resultantes y se determina su significación tomando en cuenta la probabilidad que tiene dicho alineamiento de haber sido obtenido por azar de acuerdo al tamaño de la base de datos. Al final se reportan sólo los alineamientos que hayan obtenido una probabilidad menor a E. El parámetro E es conocido como e-valor (e-value) de corte, y nos permite definir qué alineamientos queremos obtener de acuerdo a su significación estadística. Cuanto menor sea el valor de E, más significativo es un alineamiento.

Programas de la familia BLAST

Blastn

Es de los más comúnmente usados. Compara una secuencia de nucleótidos contra una base de datos que contenga también secuencias nucleotídicas.

Blastp

Es el otro tipo de BLAST más usado. Es un BLAST "con huecos" (o gaps) que compara una secuencia de aminoácidos contra una base de datos del mismo tipo. Usualmente usa la matriz de sustitución BLOSUM o PAM para realizar los alineamientos, aunque puede usar una matriz definida por el usuario.

BlastX

Este programa usa como entrada una secuencia de nucléotidos. Traduce la secuencia en sus seis posibles marcos de lectura (tres marcos de lecturas por hebra) y compara estas secuencias traducidas contra una base de datos de proteínas. Se usa cuando se tiene sospecha de que la secuencia de entrada codifica para una proteína pero no se sabe exactamente cuál es su producto.

TBlastn

Compara una secuencia proteica con una base de datos de nucléotidos. Para realizar esto traduce todas las secuencias de nucleótidos en sus seis marcos de lectura. Se usa cuando se tiene una proteína, y el análisis con Blastp no ha sido exitoso. Se debe tener cuidado con los resultados de este Blast, porque una buena cantidad de las secuencias traducidas no son proteínas que existan en la naturaleza.

TBlastX

Tblastx compara las traducciones de seis cuadros de una secuencia de consulta de nucleótidos contra las traducciones de seis cuadros de una base de datos de secuencias de nucleótidos.

Bl2seq

Bl2seq (BLAST 2 Secuencias) permite la búsqueda BLAST de una secuencia en contra de otra secuencia, sin tener que ejecutar formatdb para crear una base de datos BLAST de la secuencia que ha de ser contrastada. Bl2seq es uno de los programas distribuidos junto con el antiguo programa blastall por el NCBI. El NCBI recomienda que las personas comienzan a usar los programas del paquete blast+ en su lugar.

Variantes del BLAST

Gapped Blast

Esta es una mejora al algoritmo original del BLAST.[3]​ También se lo conoce como BLAST 2.0. Se trata de un BLAST que contempla la existencia de pequeñas inserciones o eliminaciones en las secuencias que se están comparando, permitiendo así alinear uno o varios nucléotidos o aminoácidos con huecos vacíos llamados gaps. Actualmente es la forma usual de BLAST que se usa. El uso de este nuevo enfoque, agrega dos parámetros al algoritmo, uno es la penalización que se da en la puntuación por alinear un nucleótido o aminoácido con un gap y el otro es una penalización por extender un gap preexistente. Siempre se considera más "costoso" abrir un nuevo gap que expandir uno existente.

PsiBlast

Esta variante de BLAST[3]​ es usada para buscar posibles homólogos en organismos muy lejanos entre ellos, filogenéticamente hablando. Está disponible sólo para secuencias de aminoácidos. Se trata de un programa iterativo que va calculando sus propias Matriz de sustitución en cada iteración.

Al inicio, hace un Blastp normal, usando una matriz estándar para calificar los alineamientos. De las secuencias obtenidas en este alineamiento, el programa genera una nueva matriz de sustitución, basándose en las frecuencias de los aminoácidos de las secuencias obtenidas en los alineamientos. Usa esta nueva matriz para realizar otro alineamiento. Esto permite en general encontrar nuevos alineamientos, que son usados para calcular una nueva matriz. El proceso se repite tantas veces como el usuario lo indique, o hasta que ya no se encuentran nuevos alineamientos.

WU BLAST

Más que una variante, es el algoritmo de BLAST implementado por bioinformáticos de la Universidad de Washington. Según sus creadores, es un algoritmo mucho más rápido y eficiente que el BLAST de NCBI, e igual de sensible. Es ideal si se quieren realizar análisis masivos de BLAST. Otra diferencia es la licencia, WU BLAST es software propietario y es gratuito solo para uso académico.

Consideraciones al usar BLAST

  • A pesar de que BLAST es un programa muy poderoso y casi siempre podemos confiar en sus resultados, se debe recordar que el programa es heurístico y por lo tanto puede que no encuentre la solución óptima. En la actualidad, el abuso y la pobre interpretación de los resultados de BLAST ha llevado a múltiples errores de anotación. Una cosa a tener en cuenta al usar BLAST es que cuanta más evidencia externa se pueda obtener para corroborar un alineamiento (fisiológica, filogenética, genética, etc.) es mejor.
  • El programa de BLAST NO garantiza que las secuencias que alinea sean homólogas y mucho menos que tengan la misma función, simplemente provee posibles candidatos. Se necesitan más análisis para anotar correctamente una secuencia.
  • La puntuación del BLAST depende del largo de la secuencia, una secuencia muy corta tendrá una puntuación menor que una grande simplemente por la cantidad de caracteres que tiene. Así que siempre se debe interpretar la puntuación con respecto al largo de la secuencia.
  • El e-valor depende del tamaño de la base de datos. Para bases de datos muy pequeñas, e-valores altos son más significativos que para bases de datos muy grandes. Para la base de datos no redundante (NR) de NCBI por lo general e-valores de 0.01 o menos son considerados como significativos, pero esto puede depender de la secuencia que se esté analizando.
  • Se debe tener cuidado con los errores de anotación; es común que alguna secuencia que se anotó mal (ya sea porque se anotó automáticamente o por error humano) sea utilizada como referencia para anotar otras secuencias similares, por lo que los errores de anotación se pueden propagar rápidamente. Siempre debemos especificar que la función de nuestra secuencia es posible o probable si fue asignada usando identidad con otras secuencias. Asimismo debemos tener en cuenta que la gran mayoría de las funciones asignadas en la actualidad son putativas y que pueden no ser una buena referencia para una asignación funcional.
  • A pesar de lo que comúnmente se piensa, las secuencias con la mejor puntuación o el mejor e-valor NO necesariamente son los mejores candidatos a ser genes homólogos. Es importante analizar todos los alineamientos que encuentra el programa y sacar conclusiones en base al resultado global.
  • BLAST tiene varios parámetros por defecto que en general funcionan bien para la mayoría de los casos, pero habrá situaciones en las que es necesario cambiarlos para obtener mejores resultados. No hay forma de saber exactamente qué parámetro es el óptimo, y se tienen que realizar múltiples pruebas hasta encontrar las mejores condiciones.

Véase también

Enlaces externos

Referencias

  1. Altschul, S. F.; Gish, W.; Miller, W.; Myers, E. W.; Lipman, D. J. (5 de octubre de 1990). «Basic local alignment search tool». Journal of Molecular Biology 215 (3): 403-410. ISSN 0022-2836. PMID 2231712. doi:10.1016/S0022-2836(05)80360-2. Consultado el 21 de julio de 2023. 
  2. Smith TF, Waterman MS (1981). «Identification of common molecular subsequences». J Mol Biol 147 (1): 195-7. PMID 7265238. 
  3. a b Altschul, S. F., et. al. (1997). «Gapped BLAST and PSI-BLAST: a new generation of protein database search programs». Nucleic Acid Res 25: 3389-402. PMID 9254694. Archivado desde el original el 11 de mayo de 2008. Consultado el 10 de marzo de 2007. 

Read other articles:

Guess, Inc.JenisPerusahaan terbukaKode emitenNYSE: GESS&P 600 componentIndustriFesyenDidirikan1981; 43 tahun lalu (1981)PendiriGeorges MarcianoMaurice MarcianoPaul MarcianoArmand MarcianoKantorpusatLos Angeles, California, AmerikaCabang1.638 (April 2022)[1]TokohkunciCarlos Alberini (CEO)Paul Marciano (Chairperson dan CCO)Maurice Marciano (Direktur)Alexander Grujicic (Kepala Desainer)ProdukPakaian, aksesorisPendapatan US$2,59 miliar (2021)[2]Laba operasi US$307,93 juta...

 

Sing for Youalbum mini karya EXODirilis10 Desember 2015 (2015-12-10)Direkam2015Genre R&B Balada Bahasa Korea Mandarin Label S.M. Entertainment KT Music Produser Lee Soo-man (eksekutif) Kronologi EXO Exodus(2015)Exodus2015 Sing for You(2015) Singel dalam album Sing for You LightsaberDirilis: 11 November 2015 Sing for You/UnfairDirilis: 10 Desember 2015 Video musikLightsaber (Korean Ver.) di YouTube Lightsaber (Chinese Ver.) di YouTube Sing for You (Korean Ver.) di YouTube Sing for...

 

American basketball player (born 1986) Lazar HaywardHayward with the TimberwolvesPersonal informationBorn (1986-11-26) November 26, 1986 (age 37)Buffalo, New York, U.S.NationalityAmericanListed height6 ft 6 in (1.98 m)Listed weight225 lb (102 kg)Career informationHigh schoolBuffalo Traditional(Buffalo, New York)Notre Dame Prep(Fitchburg, Massachusetts)CollegeMarquette (2006–2010)NBA draft2010: 1st round, 30th overall pickSelected by the Washington WizardsPlayin...

Historic house in New York, United States United States historic placeAndrew Short HouseU.S. National Register of Historic Places Andrew Short House, January 2008Show map of New YorkShow map of the United StatesLocation1294 Lehigh Station Rd., Henrietta, New YorkCoordinates43°03′34″N 77°37′54″W / 43.05944°N 77.63167°W / 43.05944; -77.63167Arealess than 1 acre (0.40 ha)Builtc. 1855 (1855)NRHP reference No.14000005[1]Added to NRHPF...

 

Questa voce sull'argomento allenatori di pallacanestro statunitensi è solo un abbozzo. Contribuisci a migliorarla secondo le convenzioni di Wikipedia. Segui i suggerimenti del progetto di riferimento. Gary Blair Nazionalità  Stati Uniti Pallacanestro Ruolo Allenatore Termine carriera 2022 Hall of fame Naismith Hall of Fame (2023) Carriera Carriera da allenatore 1973-1980South Oak Cliff HS1980-1985 L.T. Lady Techsters(vice)1985-1993 SFA Ladyjacks210-431993-2003 ...

 

Project For AwesomeSingkatanP4ATanggal pendirian2007; 17 tahun lalu (2007)TujuanAmalWilayah layanan Seluruh duniaTokoh pentingHank dan John GreenOrganisasi indukFoundation to Decrease WorldsuckSitus webprojectforawesome.com Project for Awesome (biasa disingkat P4A) adalah gerakan amal komunitas di YouTube yang dibentuk oleh para Vlogbrothers,[1][2] Hank dan John Green. Proyek ini berlangsung pada bulan Desember setiap tahunnya sejak 2007.[3][4] Gerakan ini...

American baseball pitcher (born 1991) Baseball player Matt StrahmStrahm with the San Diego Padres in 2018Philadelphia Phillies – No. 25PitcherBorn: (1991-11-12) November 12, 1991 (age 32)West Fargo, North Dakota, U.S.Bats: RightThrows: LeftMLB debutJuly 31, 2016, for the Kansas City RoyalsMLB statistics (through March 31, 2024)Win–loss record27–33Earned run average3.73Strikeouts436 Teams Kansas City Royals (2016–2017) San Diego Padres (2018–2021) Boston Red Sox (...

 

Pour la cérémonie des BAFTAs récompensant la télévision, voir la 52e cérémonie des British Academy Television Awards. 58e cérémonie des British Academy Film Awards BAFTA Awards Organisée par la British Academy of Film and Television Arts Détails Date 12 février 2005 Lieu Odeon Leicester Square, Londres Royaume-Uni Présentateur Stephen Fry Diffusé sur BBC Site web http://www.bafta.org/ Résumé Meilleur film Aviator Meilleur film britannique My Summer of Love Film le p...

 

Questa voce sull'argomento società calcistiche norvegesi è solo un abbozzo. Contribuisci a migliorarla secondo le convenzioni di Wikipedia. Kapp I.F.Calcio Segni distintiviUniformi di gara Casa Trasferta Colori sociali Blu, bianco Dati societariCittàKapp Nazione Norvegia ConfederazioneUEFA Federazione NFF Campionato5. divisjon Fondazione1918 StadioFauchaldplassen(? posti) PalmarèsSi invita a seguire il modello di voce Il Kapp Idrettsforening è una società calcistica norvegese...

土库曼斯坦总统土库曼斯坦国徽土库曼斯坦总统旗現任谢尔达尔·别尔德穆哈梅多夫自2022年3月19日官邸阿什哈巴德总统府(Oguzkhan Presidential Palace)機關所在地阿什哈巴德任命者直接选举任期7年,可连选连任首任萨帕尔穆拉特·尼亚佐夫设立1991年10月27日 土库曼斯坦土库曼斯坦政府与政治 国家政府 土库曼斯坦宪法 国旗 国徽 国歌 立法機關(英语:National Council of Turkmenistan) ...

 

This article is in list format but may read better as prose. You can help by converting this article, if appropriate. Editing help is available. (July 2022) Public high school in Hayward, California, United StatesMt. Eden High SchoolAddress2300 Panama StreetHayward, California 94545United StatesCoordinates37°37′30″N 122°5′26″W / 37.62500°N 122.09056°W / 37.62500; -122.09056InformationTypePublic high schoolMottoYou can't hide that Monarch Pride!Established19...

 

School in Lake Forest, Illinois, United StatesLake Forest AcademyLocationLake Forest, IllinoisUnited StatesInformationTypeIndependent, college-prep, day & boardingMottoMidwestern Heart. Global MindEstablished18571974 -- Merged with Ferry Hall SchoolFounderSylvester LindCEEB code142525Head of SchoolChris TennysonFaculty118[2]Grades9–12GenderCo-educationalEnrollment43552% day, 48% boarding[1]Average class size12 studentsStudent to teacher ratio6:1[1]CampusSuburban,...

Частина серії проФілософіяLeft to right: Plato, Kant, Nietzsche, Buddha, Confucius, AverroesПлатонКантНіцшеБуддаКонфуційАверроес Філософи Епістемологи Естетики Етики Логіки Метафізики Соціально-політичні філософи Традиції Аналітична Арістотелівська Африканська Близькосхідна іранська Буддій�...

 

Para información sobre el municipio colombiano, véase Sotará (Cauca). Volcán Sotará Localización geográficaContinente AméricaCordillera Cadena volcánica de los Coconucos, Cordillera Central, AndesCoordenadas 2°06′29″N 76°35′31″O / 2.1080555555556, -76.591944444444Localización administrativaPaís ColombiaDivisión CaucaLocalización Colombia ColombiaCaracterísticas generalesTipo EstratovolcánAltitud 4580 m s. n. m.GeologíaTipo de rocas andesitaObser...

 

City in Oregon, United StatesRoseburgCityNickname: Timber capital of AmericaLocation within Douglas County and OregonCoordinates: 43°13′23″N 123°21′07″W / 43.22306°N 123.35194°W / 43.22306; -123.35194CountryUnited StatesStateOregonCountyDouglasIncorporated1872Government • MayorLarry RichArea[1] • Total10.91 sq mi (28.26 km2) • Land10.72 sq mi (27.77 km2) • Water0.19&...

Political party in Hong Kong Kowloon West New Dynamic 西九新動力ChairpersonPriscilla LeungFounded16 March 2008 (2008-03-16)HeadquartersCapital CommercialBuilding, 448Shanghai Street,Mongkok, KowloonIdeologyConservatism (HK)Economic LiberalismPolitical positionCentre-rightRegional affiliationPro-Beijing campColorsGreenLegislative Council1 / 90District Councils0 / 470Websitewww.kowloonwest.hkPolitics of Hong KongPolitical partiesElections Kowloon West New DynamicTra...

 

NASA Mars orbiter This article is about the Mars orbiter. For other uses, see Maven (disambiguation). Mars Atmosphere and Volatile EvolutionArtist's rendering of the MAVEN spacecraft busNames MAVEN Mars Atmosphere and Volatile Evolution Mission typeMars atmospheric researchOperatorNASACOSPAR ID2013-063A SATCAT no.39378WebsiteOfficial websiteMission duration2 years (planned)Science phase extended indefinitely9 years, 8 months, 23 days (in progress) Spacecraft propertiesManufactu...

 

Parliamentary constituency in the United Kingdom, 1918–1983 Battersea NorthFormer Borough constituencyfor the House of CommonsCountyCounty of London, then Greater London1918–1983SeatsOneCreated fromBatterseaReplaced byBattersea Battersea North was a parliamentary constituency in the Metropolitan Borough of Battersea, and then the London Borough of Wandsworth, in South London. It returned one Member of Parliament (MP) to the House of Commons of the Parliament of the United Kingdom, elected...

Radio station in Libby, MontanaKLCBLibby, MontanaBroadcast areaKootenai ValleyFrequency1230 kHzProgrammingFormatCountryOwnershipOwnerLincoln County BroadcastersSister stationsKTNYHistoryFirst air dateDecember 1950Call sign meaningLincoln County BroadcastersTechnical informationFacility ID37526ClassCPower1,000 watts (unlimited)Transmitter coordinates48°22′14″N 115°32′19″W / 48.37056°N 115.53861°W / 48.37056; -115.53861LinksWebsiteklcb-ktny.com KLCB (1230 AM)...

 

«Odo ancora la vostra voce simile al suono dell’organo. Ricordo il vostro passo felino, la capigliatura d’argento e il mozzicone che fumava continuamente all’angolo delle vostre labbra, facendo credere in una sorta di noncuranza della maestà dello Stato, della cui luce non vi dispiaceva improvvisamente risplendere» (Louise Weiss, Presidente decano del Parlamento europeo, allocuzione introduttiva della seduta tenutasi a Strasburgo il 17 luglio 1979, p. 31) Aristide Briand Presidente ...