Kolekcija baze podataka BioCyc je asortiman baza podataka o putevima/genomima specifičnih za organizam (PGDB) koje pružaju referencu na informacije o genomu i metaboličkom putu za hiljade organizama.[1] Od juna 2021. godine, u BioCyc-u je bilo preko 17.800 baza podataka. SRI International,[2] sa sjedištem u Menlo Parku, Kalifornija, održava porodicu podataka BioCyc.
Kategorije baza podataka
Na osnovu urađenog ručnog kuriranja, porodica BioCyc baza podataka podijeljena je na 3 nivoa:
Nivo 1: Baze podataka koje su primile najmanje godinu dana ručnog kuriranja zasnovanog na literaturi. Trenutno postoji sedam baza podataka u Tier 1. Od sedam, MetaCyc je glavna baza podataka koja sadrži skoro 2500 metaboličkih puteva iz mnogih organizama.[1][3] Druga važna baza podataka Tier 1 je HumanCyc koja sadrži oko 300 metaboličkih puteva pronađenih kod ljudi.[4] Preostalih pet baza podataka uključuje EcoCyc (E. coli),[5] AraCyc (Arabidopsis thaliana), YeastCyc ( Saccharomyces cerevisiae ), LeishCyc (Leishmania major Friedlin) i TrypanoCyc (Trypanosoma brucei).
Nivo 2: Baze podataka koje su kompjuterski predviđene, ali su primile umjereno ručno kuriranje (većina s kuracijom od 1-4 mjeseca). Baze podataka Tier 2 dostupne su za ručno vođenje od strane naučnika koji su zainteresovani za bilo koji određeni organizam. Tier 2 baze podataka trenutno sadrže 43 različite baze podataka o organizmima.
Nivo 3: Baze podataka koje je PathoLogic predvidio računarski i koje nisu dobile ručno kuriranje. Kao i kod Tier 2, baze podataka Tier 3 su takođe dostupne za kuriranje zainteresovanim naučnicima.
Softverski alati
BioCyc web stranica sadrži niz softverskih alata za pretraživanje, vizualizaciju, poređenje i analizu informacija o genomu i putevima. Uključuje pretraživač genoma i pretraživače za metaboličke i regulatorne mreže . Web stranica također uključuje alate za slikanje velikih ("omics") skupova podataka na metaboličke i regulatorne mreže, te na genom.
Upotreba u istraživanju
Budući da porodica BioCyc Database sadrži dugačku listu baza podataka specifičnih za organizam, kao i podatke na različitim sistemskim nivoima u živom sistemu, upotreba u istraživanju je bila u širokom spektru konteksta. Ovdje su istaknute dvije studije koje pokazuju dvije različite varijante upotrebe, jednu na skali genoma i drugu za identifikaciju specifičnih SNP-a ( single Nucleotide Polymorphisms) unutar genoma.
AlgaGEM
AlgaGEM je model metaboličke mreže na nivou genoma za kompartmentalnu ćeliju algi koju su razvili Gomes de Oliveira Dal'Molin et al.[6] baziran na genomu Chlamydomonas reinhardtii. Ima 866 jedinstvenih ORF-a, 1862 metabolita, 2499 unosa gen-enzim-reakcija-asocijacija i 1725 jedinstvenih reakcija. Jedna od Pathway baza podataka koja se koristi za rekonstrukciju je MetaCyc.
SNP-ovi
Studija Shimul Chowdhury i drugi.[7] pokazala je razliku između majčinih SNP-ova i metabolita uključenih u puteve homocisteina, folata i transsulfuracije u slučajevima s kongenitalnim srčanim defektima (CHDs) za razliku od kontrola. Studija je koristila HumanCyc za odabir gena kandidata i SNP-ova.