Энциклопедия элементов ДНК

ENCODE
Изображение данных ENCODE в UCSC Genome Browser. Показаны несколько дорожек с информацией о регуляции экспрессии генов. Ген, расположенный слева (ATP2B4), экспрессируется во многих типах клеток. Ген, расположенный справа, экспрессируется только в нескольких типах клеток, в том числе, в эмбриональных стволовых клетках.
Изображение данных ENCODE в UCSC Genome Browser. Показаны несколько дорожек с информацией о регуляции экспрессии генов. Ген, расположенный слева (ATP2B4), экспрессируется во многих типах клеток. Ген, расположенный справа, экспрессируется только в нескольких типах клеток, в том числе, в эмбриональных стволовых клетках.
Содержимое
Описание Whole-genome database
Контакты
Исследовательский центр University of California Santa Cruz
Лаборатория Center for Biomolecular Science and Engineering
Авторы Brian J Raney[1]
Оригинальная публикация PMID 21037257
Дата выпуска 2010
Доступность
Сайт encodeproject.org

Энциклопедия элементов ДНК (англ. The Encyclopedia of DNA Elements, ENCODE) — международный исследовательский консорциум, созданный в сентябре 2003 года. Организован и финансируется американским Национальным институтом исследований генома человека (англ. National Human Genome Research Institute, NHGRI)[1][2][3]. Задуманный как продолжение проекта «Геном человека», ENCODE ставит целью проведение полного анализа функциональных элементов генома человека. Все результаты, получаемые в ходе реализации проекта, публикуются в общедоступных базах данных.

5 сентября 2012 года первые результаты проекта были опубликованы в виде 30 взаимосвязанных публикаций на сайтах журналов «Nature», «Genome Biology[англ.]» и «Genome Research»[4][5]. Эти публикации показывают, что по крайней мере 80 % генома человека является биологически активным, до этого господствовало представление, что большая часть ДНК является «мусорной». Однако такие поспешные выводы подвергаются критике со стороны многих учёных, которые указывают на отсутствие необходимых доказательств функциональности этих элементов[6].

Актуальность

Геном человека по приблизительным оценкам содержит 20 000 белок-кодирующих генов (все вместе они составляют экзом), и на их долю приходится всего около 1,5 % ДНК генома человека. Первостепенная задача проекта ENCODE — определить функцию остальной части генома, большая часть которой традиционно рассматривалась как «мусор» (например, ДНК, которая не транскрибируется).

Примерно 90 % однонуклеотидных полиморфизмов в геноме человека (которые, как было показано с помощью полногеномного поиска ассоциаций, связаны с различными заболеваниями) найдено за пределами белок-кодирующих областей.[7]

Активность и экспрессия белок-кодирующих генов может регулироваться регуломом — различными элементами ДНК, такими как промотор, регуляторные последовательности и участки хроматина, а также модификации гистонов. Считается, что изменения в регуляторных областях могут нарушать экспрессию белка и функционирование клетки и, таким образом, приводить к заболеваниям (ENCODE Project Background). Определяя расположение регуляторных элементов и их влияние на транскрипцию, можно выяснить связь между изменением уровней экспрессии конкретных генов и развитием заболеваний.[8]

ENCODE задуман как всеобъемлющий ресурс, который позволит научному сообществу лучше понять, как геном может влиять на здоровье человека, и простимулирует развитие новых методов профилактики и лечения заболеваний.[9]

На сегодняшний день проект помогает в обнаружении новых регуляторных элементов ДНК, позволяя по-новому понять организацию и регуляцию наших генов и генома, а также того, как изменения в последовательности ДНК могут влиять на развитие заболеваний.[7] Один из главных результатов проекта — описание того, что для 80 % человеческого генома на данный момент показана связь хотя бы с одной биохимической функцией.[10][11] Большинство этой некодирующей ДНК участвует в регуляции экспрессии кодирующих генов.[10] Кроме того, экспрессия каждого кодирующего гена контролируется множеством регуляторых участков, расположенных как вблизи, так и на расстоянии от гена. Эти результаты демонстрируют, что генная регуляция оказывается намного сложнее, чем считалась ранее.[12]

Проект ENCODE

Проект ENCODE реализуется в три этапа: начальная фаза, фаза развития технологии и продуктивная фаза.

В течение начальной фазы консорциум ENCODE оценивал стратегии для определения различных типов элементов генома. Цель начального этапа состояла в определении набора процедур, которые в совокупности позволили бы точно и наиболее подробно охарактеризовать большие регионы генома человека, с учётом экономической рентабельности и высокой эффективности процесса. Начальная фаза должна была выявить пробелы в наборе инструментов для определения функциональных последовательностей, а также показать, если какие-то из используемых методов окажутся неэффективными или непригодными для масштабного применения. Некоторые из этих проблем пришлось решать на этапе развития технологии ENCODE (проходящим одновременно с начальным этапом проекта), целью которого была разработка новых лабораторных и вычислительных методов, которые улучшили бы определение известных функциональных последовательностей или исследование новых функциональных элементов генома. Результат первых двух этапов на примере исследования 1 % человеческого генома определил наилучший способ анализа оставшихся 99 % с максимальной эффективностью и наименьшими затратами во время продуктивной фазы.[9]

I фаза проекта ENCODE: начальная фаза

Во время пилотной фазы проводилось исследование и сравнение существующих методов тщательного анализа определённого участка последовательности генома человека. Она была организована как открытый консорциум и объединила исследователей с различной базой и опытом, чтобы оценить достоинства каждой техники, технологии и стратегии из разнообразного набора. В то же время целью фазы развития технологии проекта была разработка новых высокоэффективных методов для определения функциональных элементов. Целью этой работы было определение набора подходов, который бы позволил наиболее точно определять все функциональные элементы в геноме человека. Во время начальной фазы была определена способность различных методов к масштабированию для анализа всего генома человека целиком и выявлены пробелы в определении функциональных элементов в последовательности генома.

Начальная фаза проекта происходила при тесном сотрудничестве экспериментаторов и теоретиков, которое позволило оценить ряд методов для аннотирования генома человека. Набор участков, составляющий примерно 1 % (30 Mb) генома человека, был выбран в качестве мишени для начальной фазы проекта и анализировался всеми участниками пилотной фазы проекта. Все данные об этих регионах, полученные участниками ENCODE, были быстро выпущены в общедоступные базы данных.[13][14]

Результаты I фазы[13]

  • Геном человека транскрибируется повсеместно, так что большинство его оснований связано по крайней мере с одним первичным транскриптом, а многие транскрипты связывают дистальные области с определёнными локусами, кодирующими белок.
  • Идентифицировано множество новых не кодирующих белок транскриптов, причем многие из них перекрывают локусы, кодирующие белок, и другие локусы, расположенные в областях генома, ранее считавшиеся транскрипционно «молчащими».
  • Были идентифицированы многочисленные ранее нераспознанные сайты начала транскрипции, многие из которых демонстрируют структуру хроматина и свойства связывания с конкретными последовательностями белков, подобные хорошо изученным промоторам.
  • Регуляторные последовательности, которые окружают сайты начала транскрипции, распределены симметрично, без смещения в сторону вышележащих участков.
  • Доступность хроматина и паттерны модификации гистонов в высокой степени позволяют предсказать как присутствие, так и активность сайтов начала транскрипции.
  • Дистальные гиперчувствительные сайты DNaseI имеют характерные паттерны модификации гистонов, которые надежно отличают их от промоторов.
  • Время репликации ДНК коррелирует со структурой хроматина.
  • В общей сложности 5 % оснований в геноме можно с уверенностью идентифицировать как находящиеся под эволюционными ограничениями у млекопитающих; для примерно 60 % этих ограниченных оснований есть доказательства функционирования на основе результатов экспериментальных анализов, выполненных на сегодняшний день.
  • Различные функциональные элементы сильно различаются по изменчивости их последовательностей в человеческой популяции и по вероятности нахождения в структурно изменчивой области генома.
  • Удивительно, но многие функциональные элементы, по-видимому, не ограничиваются эволюцией млекопитающих. Это предполагает возможность наличия большого количества нейтральных элементов, которые являются биохимически активными, но не приносят особой пользы организму. Этот пул может служить «складом» для естественного отбора, потенциально действуя как источник клоноспецифичных элементов и функционально консервативных, но неортологичных элементов между видами.

II фаза проекта ENCODE: продуктивная фаза

В сентябре 2007 года началось финансирование продуктивной фазы проекта ENCODE. На этом этапе целью был анализ генома целиком и проведение "дополнительных исследований в промышленных условиях.[15]

Как и в начальной фазе, работа продуктивной фазы была организована в виде открытого консорциума. В октябре 2007 года Национальный институт исследований генома человека выделил на неё гранты общей суммой более 80 млн долларов на 4 года .[16] Во время продуктивной фазы в состав проекта вошли Центр Координирования Данных, Центр Анализа Данных и Центр Технологических Разработок.[17] В это время проект превращается в по-настоящему масштабное предприятие, включающее 440 ученых из 32 лабораторий по всему миру. В 2007 году, когда начальная стадия была закончена, проект нарастил мощности в значительной степени благодаря секвенированию нового поколения. Было обработано действительно много данных, исследователи получили около 15 терабайт сырой информации.

К 2010 году проектом ENCODE было получено более 1000 полногеномных наборов данных. Взятые вместе эти данные демонстрируют, какие участки, по-видимому, контролируют экспрессию генов, используемых в клетках определённого типа, и какие участки взаимодействуют с большим набором белков. Проект предоставляет информацию об участках транскрипции, ассоциированных с ними транскрипционных факторах, структуре хроматина и модификациях гистонов.

Результаты II фазы[18]

  • Подавляющее большинство (80,4 %) генома человека участвует по крайней мере в одном биохимическом событии, связанном с РНК и/или хроматином, по крайней мере в одном типе клеток. Большая часть генома находится рядом с регуляторными событиями: 95 % генома находится в пределах 8 килобаз от взаимодействия ДНК-белок (по результатам анализа мотивов ChIP-seq или связывания ДНКазы I), а 99 % находится в пределах 1,7 килобаз от хотя бы одного из биохимических событий, представленных ENCODE.
  • Классификация генома на семь состояний хроматина предполагает начальный набор из 399 124 регионов с характеристиками, подобными энхансерам, и 70 292 регионов с характеристиками, подобными промоторам, а также сотни тысяч неподвижных регионов. Анализ высокого разрешения дополнительно подразделяет геном на тысячи узких состояний с различными функциональными свойствами.
  • Можно количественно коррелировать образование и процессинг последовательности РНК как с метками хроматина, так и с связыванием факторов транскрипции (TF) на промоторах, что указывает на то, что функциональность промотора может объяснить большую часть вариаций экспрессии РНК.
  • Многие некодирующие варианты в индивидуальных последовательностях генома лежат в функциональных областях, аннотированных ENCODE; это число, по крайней мере, не меньше тех, которые содержатся в генах, кодирующих белки.
  • SNP, ассоциированные с заболеванием посредством GWAS, обогащены некодирующими функциональными элементами, большинство из которых находится в определённых ENCODE-определенных областях или около них, за пределами генов, кодирующих белки. Во многих случаях фенотипы заболевания могут быть связаны с конкретным типом клеток или транскрипционных факторов.
  • Консорциум ENCODE

Консорциум ENCODE в основном состоит из ученых, которые спонсируются Национальным институтом исследований генома человека США. Другие участники проекта входят в Консорциум или Аналитическую рабочую группу.

Начальная фаза проекта состояла из восьми исследовательских групп и двенадцати групп, участвующих в фазе развития технологии проекта ENCODE (ENCODE Pilot Project: Participants and Projects). К концу 2007 года, когда пилотная фаза проекта официально завершилась, количество участников возросло до 440 ученых из 32 лабораторий, расположенных по всему миру. В настоящее время консорциум состоит из различных центров, которые выполняют различные задачи (ENCODE Participants and Projects):

  1. Производственные центры (ENCODE Production Centers)
  2. Центр координации данных (ENCODE Data Coordination Center)
  3. Центр анализа данных (ENCODE Data Analysis Center)
  4. Вычислительный анализ результатов (ENCODE Computational Analysis Awards)
  5. Технологическое развитие (ENCODE Technology Development Effort)

Представленные данные

С 2007 года участниками проекта ENCODE было проведено большое количество исследований на основе различных биологических последовательностей для картирования функциональных элементов генома человека[19]. Картированные элементы (и используемые подходы) включают области транскрипции РНК (RNA-seq, CAGE, RNA-PET и ручная аннотация), белок-кодирующие области (масс-спектрометрия), сайты связывания транскрипционных факторов (ChIP-seq и DNase-seq), структура хроматина (DNase-seq, FAIRE-seq, гистоновые ChIP-seq и MNase-seq) и сайты метилирования ДНК (анализ RRBS). Ниже подробно описаны данные, полученные участниками проекта за годы его работы и представленные на сайте проекта.

Транскрибируемые и белок кодирующие области

В рамках проекта была использована ручная и автоматическая аннотацию для создания исчерпывающего каталога человеческих белков-кодирующих и некодирующих РНК, а также псевдогенов, получившего название GENCODE.[20][21] Каталог включает 20 687 генов, кодирующих белки, в среднем с 6,3 альтернативно сплайсированных на локус.

Кроме того, было аннотировано 8801 автоматически полученная малая РНК и 9640 вручную курируемых длинных некодирующих РНК (lncRNA). Сравнение lncRNAs с другими данными ENCODE показывает, что lncRNA генерируются посредством пути, аналогичного белок-кодирующим генам.[22] Проект GENCODE также аннотировал 11 224 псевдогена, из которых 863 транскрибируются и ассоциированы с активным хроматином.[23]

РНК

  • РНК секвенировались 16 из разных клеточных линий и множества субклеточных фракций, чтобы разработать обширный каталог экспрессии РНК. При условии использования консервативного порога для идентификации областей активности РНК, 62 % геномных оснований воспроизводимо представлены в секвенированных длинных (> 200 нуклеотидов) молекулах РНК или экзонах GENCODE.
  • Был использован метод CAGE-seq (выделение и секвенирование 5'-кэп-целевой РНК) для идентификации 62 403 сайтов начала транскрипции (TSS) с высокой достоверностью (IDR 0,01).
  • Наконец, была обнаружена значительная доля кодирующих и некодирующих транскриптов, обработанных в устойчивые стабильные РНК короче 200 нуклеотидов. Эти предшественники включают РНК для переноса, микроРНК, малую ядерную РНК и малую ядрышковую РНК (тРНК, miRNA, snRNA и snoRNA, соответственно)

Участки связывания белков

Чтобы напрямую идентифицировать регуляторные области, участники проекта картировали места связывания 119 различных ДНК-связывающих белков и ряда компонентов РНК-полимеразы в 72 типах клеток с помощью ChIP-seq.[24] Каждый сайт связывания был изучен на предмет обогащения известными ДНК-связывающими мотивами и наличия новых мотивов.

Гиперчувствительные к ДНКазе I области генома

Доступность хроматина, характеризуемая гиперчувствительностью к ДНКазе I, является отличительным признаком регуляторных областей ДНК.[25][26] Участники проекта картировали 2,89 миллиона уникальных, неперекрывающихся сайтов гиперчувствительности к ДНКазе I (DHS) с помощью DNase-seq в 125 типах клеток.

Участки модификации гистонов

Были проанализированы хромосомные местоположения 12 гистоновых модификаций в 46 типах клеток. Полученные данные показывают, что глобальные паттерны модификации сильно различаются для разных типов клеток в соответствии с изменениями транскрипционной активности. Было обнаружено, что интеграция различной информации о модификациях гистонов может использоваться систематически для присвоения функциональных атрибутов геномным областям.[27]

Метилирование ДНК

Метилирование цитозина (обычно по динуклеотидам CpG) участвует в эпигенетической регуляции экспрессии генов. Метилирование промотора зачастую связано с репрессией, тогда как генное метилирование коррелирует с транскрипционной активностью.[28] Участники проекта использовали метод бисульфитного секвенирования ограниченных наборов геномных локусов (RRBS) для количественного профилирования метилирования ДНК в среднем для 1,2 миллиона CpG в каждой из 82 клеточных линий и тканей, включая CpG в межгенных областях проксимальных промоторах и областях внутри гена (тела генов).[29]

Участки взаимодействия хромосом

Физическое взаимодействие между отдельными участками хромосом, которые могут быть разделены сотнями килобаз, считается важным в регуляции экспрессии генов 46. Метод 5C позволил обнаружить дальнодействующие взаимодействия с участками начала транскрипции (TSS) в целевом 1 % генома (44 пилотных региона ENCODE) в четырёх типах клеток (GM12878, K562, HeLa-S3 и H1 hESC) 49. Были найдены сотни статистически значимых дальнодействующих взаимодействий в каждом типе клеток после учёта поведения полимера хроматина и экспериментальных вариаций. Пары взаимодействующих локусов показали сильную корреляцию между уровнем экспрессии генов TSS и наличием определённых классов функциональных элементов, таких как энхансеры. Среднее количество дистальных элементов, взаимодействующих с TSS, было 3.9, а среднее количество TSS, взаимодействующих с дистальным элементом, было 2,5, что указывает на сложную сеть взаимосвязанного хроматина. Такая переплетенная архитектура «дальнего действия» была также раскрыта по всему геному с помощью анализа взаимодействия хроматина с секвенированием парных концевых меток (ChIA-PET), применяемого для выявления взаимодействий в хроматине, обогащенном РНК-полимеразой II (Pol II) в пяти типах клеток.[30]

Критика

Несмотря на утверждения консорциума о том, что проект ENCODE далек от завершения, реакция на уже опубликованные статьи и освещение в прессе была положительной. Редакторы журнала Nature и авторы проекта ENCODE пишут: «… мы сотрудничали на протяжении многих месяцев, чтобы возникла эта крупнейшая новость, которая привлечет внимание не только ученого сообщества, но и широкой публики» («… collaborated over many months to make the biggest splash possible and capture the attention of not only the research community but also of the public at large»).[31] Заявление, выдвинутое в рамках проекта ENCODE, о том, что 80 % геноме человека имеет биохимическую функцию[10] было быстро подхвачено научно-популярными изданиями, которые охарактеризовали результаты проекта как влекущие за собой смерть «мусорной» ДНК.[32][33]

Однако вывод о том, что основная часть генома «функциональна» был раскритикован на тех основаниях, что проект ENCODE слишком широко определяет «функциональность», а именно: все, что транскрибируется в клетке, имеет свою функцию. Такое заключение было высказано, несмотря на общепринятую точку зрения, что множество элементов ДНК, которые транскрибируются, например, псевдогены, тем не менее, не являются функциональными. Более того, в проекте ENCODE сделан акцент в пользу чувствительности, а не специфичности, что ведет к множеству ложноположительных результатов.[34][35][36] В некоторой степени произвольный выбор клеточных линий и транскрипционных факторов, так же как недостаток необходимых контрольных экспериментов, стал дополнительным поводом для серьёзной критики в адрес ENCODE, поскольку случайная молекула ДНК может имитировать такое «функциональное» поведение в интерпретации ENCODE.[37]

В ответ на эту критику было высказано мнение, что транскрибирование большей части генома и сплайсинг, которые наблюдаются у человека, являются более точным индикатором генетической функции, чем консервативность последовательности. Кроме того, большая часть «мусорной» ДНК участвует в эпигенетической регуляции и была необходимой предпосылкой для развития сложных организмов.[38] В ответ на замечания насчет определения слова «функциональный» многие отметили, что в данном случае спор касается разницы в определении, а не сути проекта, которая заключается в предоставлении данных для последующих исследований биохимической активности не белок-кодирующих участков ДНК. Несмотря на то, что определения важны, и наука заключена в рамки языка, по-видимому, ENCODE добился своей цели, поскольку в настоящее время, в большом количестве научно-исследовательских статей используются данные, полученные проектом, а не обсуждаются определения «функциональности».[39] Эван Бирни (Ewan Birney), один из исследователей ENCODE прокомментировал некоторые реакции на проект. Он отмечает, что слово «функция» было использовано прагматично для обозначения «определенной биохимической активности», которая проявляется в различных классах экспериментов различным образом: наличие РНК, модификации гистонов, ДНКазаI-гиперчувствительные области, ChIP-seq-пики факторов транскрипции, футпринтинг ДНК, участки связывания транскрипционных факторов и экзоны.[40]

Кроме того проект критиковался за высокий бюджет (около 400 млн долларов в общей сложности) и покровительство со стороны так называемой «большой науки», фундаментальных научных исследований, которые забирают деньги у более продуктивных научных разработок, которые приходится проводить за счет самих исследователей.[41] Стоимость начальной стадии проекта ENCODE оценивалась в 55 млн долларов, его расширение стоило примерно 130 млн долларов, и Национальный институт исследований генома человека США был готов выделить до 123 млн для следующего этапа проекта. Некоторые исследователи утверждают, что должной отдачи от инвестиций до сих пор не последовало. При попытке подсчитать все публикации, в которых ENCODE играет значительную роль, с 2012 года было выявлено 300 таких статей, 110 из них основывались на результатах, полученных в лабораториях без финансового участия ENCODE. Дополнительной проблемой стало то, что ENCODE не является уникальным названием, относящимся только к проекту ENCODE, поэтому слово 'encode' (кодировать) всплывает в большом количестве литературы по генетике и исследованию генома.[7]

В качестве ещё одного крупного замечания высказывается мнение, что результаты не оправдали количество потраченного времени и что проект в принципе бесконечен по своей сути. Хотя он и сравнивается с проектом «Геном человека» и даже назван его продолжением, «Геном человека» имеет чёткое окончание, которое в настоящее время отсутствует у ENCODE.

Авторы проекта по всей видимости разделяют беспокойство научного мира и не отрицают наличие проблем, но в то же время пытаются оправдать свои усилия, объясняя в интервью подробности проекта не только научному сообществу, но и средствам массовой информации. Они говорят, что потребовалось более полувека, чтобы прийти от понимания того, что ДНК — это материальная основа наследственности, к расшифровке последовательности генома человека, так что их план на следующий век — понять эту последовательность[7].

Другие проекты

В настоящее время консорциумом ENCODE участвует в нескольких дополнительных проектах со схожими целями. Некоторые из этих проектов были частью второй фазы ENCODE.

modENCODE

По аналогии с проектом ENCODE был также начат проект картирования функциональных элементов генома основных модельных объектов — Drosophila melanogaster и Caenorhabditis elegans — англ. Model Organism ENCyclopedia Of DNA Elements (modENCODE). Преимущество данного проекта состоит в возможности проведения на модельных организмах некоторых экспериментов, которые трудно или невозможно осуществить на человеке.[42]

Проект был основан в 2007 году Национальным институтом здравоохранения США (англ. National Institutes of Health (NIH).[43][44] В 2010 году modENCODE консорциум представил ряд статей в Science по аннотации и анализу распределения функциональных элементов в геноме Drosophila melanogaster и Caenorhabditis elegans. Данные из этих публикаций доступны на сайте modENCODE[45].

В настоящий момент, modENCODE это исследовательское объединение, состоящее из 11 начальных проектов, разделенных между исследованием D. melanogaster и C. elegans. Проект охватывает исследование следующих областей:

modERN

modERN (англ.  model organism Encyclopedia of Regulatory Networks) является ответвлением modENCODE. Проект совмещает исследования групп C. elegans and D. melanogaster и фокусируется на идентификации дополнительных сайтов связывания транскрипционных факторов. Проект был начат одновременно с третьей фазой ENCODE, завершение планируется в 2017 г. В настоящее время modERN опубликовал результаты 198 экспериментов, другие 500 приняты к публикации и обрабатываются центром координации данных ENCODE.

Genomics of Gene Regulation

Программа Геномики регуляции генов (англ.  Genomics of Gene Regulation, GGR) была запущена в начале 2015 учреждением Национальных институтов здоровья США и продлится три года. Целью программы является изучение генных сетей и путей в различных системах организма для дальнейшего углубления понимания механизмов, контролирующих экспрессию генов. Хотя проект ENCODE ведется отдельно от GGR, центр координации данных ENCODE хранит данные GGR на своем портале.

Roadmap

В 2008 учреждением Национальных институтов здоровья США был организован консорциум Разметки эпигенетической карты (англ.  Roadmap Epigenomics Mapping Consortium), чьей целью стала разработка общедоступного источника эпигенетических данных генома человека для биологических и медицинских исследований. По результатам работы в феврале 2015 консорциум выпустил статью «Integrative analysis of 111 reference human epigenomes». Консорциум собрал and аннотировал регуляторные элементы в 127 референсных эпигеномах, 16 из которых были частью проекта ENCODE. Данные проекта Roadmap доступны на порталах Roadmap или ENCODE.

fruitENCODE

Проект fruitENCODE: энциклопедия элементов ДНК созревающих фруктов, являющийся частью ENCODE. Целью проекта является генерация датасетов: сайтов метилирования ДНК, гистонных модификаций, гиперчувствительных к ДНКазе I участков хроматина, экспрессии генов, сайтов связывания транскрипционных факторов для сочных плодов всех видов на разных стадиях развития. Предварительная дата публикации результатов размещается на портале fruitENCODE.

FactorBook

Полученные ENCODE данные по связыванию транскрипционных факторов в настоящее время доступны на Factorbook.org[47] — в базе данных, созданной на вики-основе. Первый выпуск FactorBook содержит:

  • 457 наборов данных ChIP-seq для 119 транскрипционных факторов в некоторых культурах человеческих клеток
  • Усредненные профили гистонных модификаций и позиционирования нуклеосом вокруг участков связывания транскрипционных факторов
  • Мотивы, которыми обогащены участки связывания, а также расстояние между ними и их ориентация[48]

См. также

Примечания

  1. 1 2 Raney B. J., Cline M. S., Rosenbloom K. R., Dreszer T. R., Learned K., Barber G. P., Meyer L. R., Sloan C. A., Malladi V. S., Roskin K. M., Suh B. B., Hinrichs A. S., Clawson H., Zweig A. S., Kirkup V., Fujita P. A., Rhead B., Smith K. E., Pohl A., Kuhn R. M., Karolchik D., Haussler D., Kent, WJ. ENCODE whole-genome data in the UCSC genome browser (2011 update) (англ.) // Nucleic Acids Res. : journal. — 2011. — January (vol. 39, no. Database issue). — P. D871—5. — doi:10.1093/nar/gkq1017. — PMID 21037257. — PMC 3013645.
  2. EGASP: the human ENCODE Genome Annotation Assessment Project. (англ.). PubMed. Дата обращения: 1 октября 2017. Архивировано 4 апреля 2017 года.
  3. Клещенко Е. ДНК без мусора // The New Times. — 2012. — Вып. 29 (256). Архивировано 22 сентября 2012 года.
  4. ENCODE project at UCSC. ENCODE Consortium. Дата обращения: 5 сентября 2012. Архивировано из оригинала 10 сентября 2012 года.
  5. Walsh, Fergus (5 сентября 2012). "Detailed map of genome function". BBC News. Архивировано 5 сентября 2012. Дата обращения: 6 сентября 2012. {{cite news}}: |archive-date= / |archive-url= несоответствие временной метки; предлагается 5 сентября 2012 (справка)
  6. Dan Graur's blog. Дата обращения: 29 декабря 2014. Архивировано 17 декабря 2014 года.
  7. 1 2 3 4 Maher B. ENCODE: The human encyclopaedia (англ.) // Nature. — 2012. — September (vol. 489, no. 7414). — P. 46—8. — doi:10.1038/489046a. — PMID 22962707.
  8. Saey, Tina Hesman Team releases sequel to the human genome. Society for Science & the Public (6 октября 2012). Дата обращения: 18 октября 2012. Архивировано 23 октября 2012 года.
  9. 1 2 The ENCODE Project Consortium. The ENCODE (ENCyclopedia Of DNA Elements) Project. Science (2004). Дата обращения: 30 апреля 2015. Архивировано 27 февраля 2015 года.
  10. 1 2 3 Bernstein B. E., Birney E., Dunham I., Green E. D., Gunter C., Snyder M. An integrated encyclopedia of DNA elements in the human genome (англ.) // Nature : journal. — 2012. — September (vol. 489, no. 7414). — P. 57—74. — doi:10.1038/nature11247. — Bibcode2012Natur.489...57T. — PMID 22955616. — PMC 3439153.
  11. Timmer J. Most of what you read was wrong: how press releases rewrote scientific history. Staff / From the Minds of Ars. Ars Technica (10 сентября 2012). Дата обращения: 10 сентября 2012. Архивировано 12 сентября 2012 года.
  12. Pennisi E. Genomics. ENCODE project writes eulogy for junk DNA (англ.) // Science : journal. — 2012. — September (vol. 337, no. 6099). — P. 1159, 1161. — doi:10.1126/science.337.6099.1159. — PMID 22955811.
  13. 1 2 Birney E., Stamatoyannopoulos J. A., Dutta A. et al. Identification and analysis of functional elements in 1% of the human genome by the ENCODE pilot project. (англ.) // Nature. — 2007. — Vol. 447, no. 7146. — P. 799—816. — doi:10.1038/nature05874. — PMID 17571346. [исправить]
  14. ENCODE Program Staff. ENCODE: Pilot Project: overview. National Human Genome Research Institute (18 октября 2012). Дата обращения: 30 апреля 2015. Архивировано 24 апреля 2015 года.
  15. Genome.gov | ENCODE and modENCODE Projects. The ENCODE Project: ENCyclopedia Of DNA Elements. United States National Human Genome Research Institute (1 августа 2011). Дата обращения: 5 августа 2011. Архивировано 7 августа 2011 года.
  16. National Human Genome Research Institute - Organization. The NIH Almanac. United States National Institutes of Health. Дата обращения: 5 августа 2011. Архивировано 4 октября 2015 года.
  17. Genome.gov | ENCODE Participants and Projects. The ENCODE Project: ENCyclopedia Of DNA Elements. United States National Human Genome Research Institute (1 августа 2011). Дата обращения: 5 августа 2011. Архивировано 7 августа 2011 года.
  18. Joseph R. Ecker, Wendy A. Bickmore, Inês Barroso, Jonathan K. Pritchard, Yoav Gilad. ENCODE explained (англ.) // Nature. — 2012-09. — Vol. 489, iss. 7414. — P. 52–54. — ISSN 1476-4687. — doi:10.1038/489052a. Архивировано 27 февраля 2023 года.
  19. The ENCODE Project Consortium. A User's Guide to the Encyclopedia of DNA Elements (ENCODE) (англ.) // PLOS Biology. — 2011-04-19. — Vol. 9, iss. 4. — P. e1001046. — ISSN 1545-7885. — doi:10.1371/journal.pbio.1001046. Архивировано 17 ноября 2020 года.
  20. Jennifer Harrow, Adam Frankish, Jose M. Gonzalez, Electra Tapanari, Mark Diekhans. GENCODE: The reference human genome annotation for The ENCODE Project (англ.) // Genome Research. — 2012-09-01. — Vol. 22, iss. 9. — P. 1760–1774. — ISSN 1549-5469 1088-9051, 1549-5469. — doi:10.1101/gr.135350.111. Архивировано 25 сентября 2020 года.
  21. Cédric Howald, Andrea Tanzer, Jacqueline Chrast, Felix Kokocinski, Thomas Derrien. Combining RT-PCR-seq and RNA-seq to catalog all genic elements encoded in the human genome (англ.) // Genome Research. — 2012-09-01. — Vol. 22, iss. 9. — P. 1698–1710. — ISSN 1549-5469 1088-9051, 1549-5469. — doi:10.1101/gr.134478.111. Архивировано 16 ноября 2020 года.
  22. Thomas Derrien, Rory Johnson, Giovanni Bussotti, Andrea Tanzer, Sarah Djebali. The GENCODE v7 catalog of human long noncoding RNAs: Analysis of their gene structure, evolution, and expression (англ.) // Genome Research. — 2012-09-01. — Vol. 22, iss. 9. — P. 1775–1789. — ISSN 1549-5469 1088-9051, 1549-5469. — doi:10.1101/gr.132159.111. Архивировано 10 ноября 2020 года.
  23. Baikang Pei, Cristina Sisu, Adam Frankish, Cédric Howald, Lukas Habegger. The GENCODE pseudogene resource // Genome Biology. — 2012-09-05. — Т. 13, вып. 9. — С. R51. — ISSN 1474-760X. — doi:10.1186/gb-2012-13-9-r51.
  24. Mark B. Gerstein, Anshul Kundaje, Manoj Hariharan, Stephen G. Landt, Koon-Kiu Yan. Architecture of the human regulatory network derived from ENCODE data (англ.) // Nature. — 2012-09. — Vol. 489, iss. 7414. — P. 91–100. — ISSN 1476-4687. — doi:10.1038/nature11245. Архивировано 5 ноября 2020 года.
  25. David S. Gross, William T. Garrard. Nuclease hypersensitive sites in chromatin // Annual Review of Biochemistry. — 1988-06-01. — Т. 57, вып. 1. — С. 159–197. — ISSN 0066-4154. — doi:10.1146/annurev.bi.57.070188.001111. Архивировано 16 ноября 2020 года.
  26. Fyodor D. Urnov. Chromatin remodeling as a guide to transcriptional regulatory networks in mammals (фр.) // Journal of Cellular Biochemistry. — 2003. — Vol. 88, livr. 4. — P. 684–694. — ISSN 1097-4644. — doi:10.1002/jcb.10397. Архивировано 11 ноября 2020 года.
  27. Jason Ernst, Pouya Kheradpour, Tarjei S. Mikkelsen, Noam Shoresh, Lucas D. Ward. Mapping and analysis of chromatin state dynamics in nine human cell types (англ.) // Nature. — 2011-05. — Vol. 473, iss. 7345. — P. 43–49. — ISSN 1476-4687. — doi:10.1038/nature09906. Архивировано 5 ноября 2020 года.
  28. Madeleine P. Ball, Jin Billy Li, Yuan Gao, Je-Hyuk Lee, Emily M. LeProust. Targeted and genome-scale strategies reveal gene-body methylation signatures in human cells (англ.) // Nature Biotechnology. — 2009-04. — Vol. 27, iss. 4. — P. 361–368. — ISSN 1546-1696. — doi:10.1038/nbt.1533. Архивировано 1 сентября 2020 года.
  29. Alexander Meissner, Tarjei S. Mikkelsen, Hongcang Gu, Marius Wernig, Jacob Hanna. Genome-scale DNA methylation maps of pluripotent and differentiated cells (англ.) // Nature. — 2008-08. — Vol. 454, iss. 7205. — P. 766–770. — ISSN 1476-4687. — doi:10.1038/nature07107. Архивировано 8 марта 2021 года.
  30. Redirecting. linkinghub.elsevier.com. Дата обращения: 10 ноября 2020. Архивировано 30 сентября 2020 года.
  31. Maher B. Fighting about ENCODE and junk. News Blog. Nature Publishing Group (6 сентября 2012). Дата обращения: 30 апреля 2015. Архивировано 6 августа 2013 года.
  32. Kolata G (5 сентября 2012). "Far From 'Junk,' DNA Dark Matter Proves Crucial to Health". The New York Times. Архивировано 2 октября 2017. Дата обращения: 1 октября 2017. {{cite news}}: |archive-date= / |archive-url= несоответствие временной метки; предлагается 2 октября 2017 (справка)
  33. Gregory TR. The ENCODE media hype machine. Genomicron (6 сентября 2012). Дата обращения: 30 апреля 2015. Архивировано из оригинала 6 апреля 2015 года.
  34. Graur D., Zheng Y., Price N., Azevedo R. B., Zufall R. A., Elhaik E. On the immortality of television sets: "function" in the human genome according to the evolution-free gospel of ENCODE (англ.) // Genome Biol Evol[англ.] : journal. — 2013. — Vol. 5, no. 3. — P. 578—590. — doi:10.1093/gbe/evt028. — PMID 23431001. — PMC 3622293.
  35. Moran LA. Sandwalk: On the Meaning of the Word "Function". Sandwalk (15 марта 2013). Дата обращения: 30 апреля 2015. Архивировано 6 апреля 2015 года.
  36. Gregory TR. Critiques of ENCODE in peer-reviewed journals. « Genomicron. Genomicron (11 апреля 2013). Дата обращения: 30 апреля 2015. Архивировано из оригинала 2 апреля 2015 года.
  37. White M. A., Myers C. A., Corbo J. C., Cohen B. A. Massively parallel in vivo enhancer assay reveals that highly local features determine the cis-regulatory function of ChIP-seq peaks (англ.) // Proceedings of the National Academy of Sciences of the United States of America : journal. — 2013. — July (vol. 110, no. 29). — P. 11952—11957. — doi:10.1073/pnas.1307449110. — PMID 23818646.
  38. Mattick J. S., Dinger M. E. The extent of functionality in the human genome (неопр.) // The HUGO Journal. — 2013. — Т. 7, № 1. — С. 2. — doi:10.1186/1877-6566-7-2.
  39. Nature Editorial. Form and function (англ.) // Nature. — 2013. — 14 March (vol. 495). — P. 141—142. — doi:10.1038/495141b. Архивировано 27 апреля 2015 года.
  40. Birney, Ewan ENCODE: My own thoughts. Ewan's Blog: Bioinformatician at large (5 сентября 2012). Дата обращения: 30 апреля 2015. Архивировано 25 апреля 2015 года.
  41. Timpson T. Debating ENCODE: Dan Graur, Michael Eisen. Mendelspod (5 марта 2013). Дата обращения: 30 апреля 2015. Архивировано из оригинала 11 апреля 2015 года.
  42. The modENCODE Project: Model Organism ENCyclopedia Of DNA Elements (modENCODE). NHGRI website. Дата обращения: 13 ноября 2008. Архивировано 23 декабря 2008 года.
  43. modENCODE Participants and Projects. NHGRI website. Дата обращения: 13 ноября 2008. Архивировано 1 октября 2008 года.
  44. Berkeley Lab Life Sciences Awarded NIH Grants for Fruit Fly, Nematode Studies. Lawrence Berkeley National Laboratory website (14 мая 2007). Дата обращения: 13 ноября 2008. Архивировано из оригинала 21 сентября 2008 года.
  45. modENCODE. The National Human Genome Research Institute. Архивировано 27 декабря 2010 года.
  46. Celniker S. Unlocking the secrets of the genome. Nature (11 июня 2009). Дата обращения: 30 апреля 2015. Архивировано 21 февраля 2015 года.
  47. FactorBook. Дата обращения: 30 апреля 2015. Архивировано 14 июля 2011 года.
  48. Wang J. Factorbook.org: a Wiki-based database for transcription factor-binding data generated by the ENCODE consortium. Nucleic Acid Research (29 ноября 2012). Дата обращения: 30 апреля 2015. Архивировано 21 ноября 2016 года.

Ссылки

Read other articles:

Donald Ray JohnstonArmy Medal of HonorLahir(1947-11-19)19 November 1947Columbus, GeorgiaMeninggal21 Maret 1969(1969-03-21) (umur 21)Provinsi Tay Ninh, Republik VietnamTempat pemakamanFort Benning Post Cemetery, Fort Benning, GeorgiaPengabdianAmerika SerikatDinas/cabangAngkatan Darat Amerika SerikatLama dinas1968 - 1969KesatuanResimen Kavaleri ke-8, Divisi Kavaleri ke-1Perang/pertempuranPerang Vietnam †PenghargaanMedal of Honor Donald Ray Johnston (19 November 1947 –...

 

 

جازيليك أجاكسيو الاسم الكامل نادي جازيليك أولمبيك أجاكسيو لكرة القدم الاسم المختصر جازيليك أجاكسيو تأسس عام 1 يناير 1910؛ منذ 114 سنة (1910-01-01) [1] الملعب أنجي كازانوفا , أجاكسيو , فرنسا(السعة: 6,000) البلد فرنسا  الدوري الدوري الفرنسي الدرجة الأولى 2015-2016 المركز التا...

 

 

Cucu Somantri Panglima Komando Daerah Militer I/Bukit BarisanMasa jabatan22 Februari 2017 – 9 Maret 2018 PendahuluMayor Jenderal TNI Lodewyk PusungPenggantiMayor Jenderal TNI Ibnu TriwidodoKepala Staf Komando Cadangan Strategis Angkatan DaratMasa jabatan20 Mei 2016 – 25 April 2017 PendahuluMayor Jenderal TNI Meris WiryadiPenggantiMayor Jenderal TNI Benny Susianto Informasi pribadiLahir5 November 1961 (umur 62)Bandung, Jawa BaratAlma materAkademi Militer (1984)Karier...

Piala FA 1920–1921Negara Inggris WalesJuara bertahanAston VillaJuaraTottenham Hotspur(gelar ke-2)Tempat keduaWolverhampton Wanderers← 1919–1920 1921–1922 → Piala FA 1920–1921 adalah edisi ke-46 dari penyelenggaraan Piala FA, turnamen tertua dalam sepak bola di Inggris. Edisi ini dimenangkan oleh Tottenham Hotspur setelah mengalahkan Wolverhampton Wanderers pada pertandingan final dengan skor 1–0. Final Artikel utama: Final Piala FA 1921 Tottenham Hotspur v Wolverhampto...

 

 

Artikel ini tidak memiliki referensi atau sumber tepercaya sehingga isinya tidak bisa dipastikan. Tolong bantu perbaiki artikel ini dengan menambahkan referensi yang layak. Tulisan tanpa sumber dapat dipertanyakan dan dihapus sewaktu-waktu.Cari sumber: Uni Oposisi Nasional – berita · surat kabar · buku · cendekiawan · JSTORArtikel ini perlu dikembangkan agar dapat memenuhi kriteria sebagai entri Wikipedia.Bantulah untuk mengembangkan artikel ini. Jika ...

 

 

PT Asuransi Umum BCAJenisJasa keuangan/publikDidirikanIndonesia (1988)Kantorpusat Jakarta, IndonesiaTokohkunciGregorius Hariyanto (Kepala Eksekutif)IndukBank Central AsiaSitus webwww.bcainsurance.co.id BCA Insurance adalah perusahaan asuransi umum yang berdiri sejak 1988 dan berkantor pusat di Jakarta. Sejarah Perusahaan ini berdiri sejak tahun 1988, dengan nama Asuransi Ganesha Ciptadanamas. Pada tahun 2006, perusahaan ini berubah nama menjadi Transpacific General Insurance. Setelah diakuisi...

Данио-рерио Научная классификация Домен:ЭукариотыЦарство:ЖивотныеПодцарство:ЭуметазоиБез ранга:Двусторонне-симметричныеБез ранга:ВторичноротыеТип:ХордовыеПодтип:ПозвоночныеИнфратип:ЧелюстноротыеГруппа:Костные рыбыКласс:Лучепёрые рыбыПодкласс:Новопёрые рыбыИн�...

 

 

Mountain range in Texas, United States Chisos MountainsThe Chisos Mountains as photographed facing southeastHighest pointPeakEmory PeakElevation7,825 ft (2,385 m)Coordinates29°14′45″N 103°18′14″W / 29.24583°N 103.30389°W / 29.24583; -103.30389GeographyChisos Mountains Country United StatesState TexasRange coordinates29°16′N 103°18′W / 29.267°N 103.300°W / 29.267; -103.300 South rim sunset (left) and a...

 

 

Questa voce o sezione sull'argomento Africa non è ancora formattata secondo gli standard. Commento: vedi Wikipedia:Modello di voce/Centro abitato Contribuisci a migliorarla secondo le convenzioni di Wikipedia. Segui i suggerimenti del progetto di riferimento. Questa voce sull'argomento eSwatini è solo un abbozzo. Contribuisci a migliorarla secondo le convenzioni di Wikipedia. LobambaumphakatsiLocalizzazioneStato eSwatini DistrettoHhohho InkhundlaLobamba TerritorioCoordinate2...

土库曼斯坦总统土库曼斯坦国徽土库曼斯坦总统旗現任谢尔达尔·别尔德穆哈梅多夫自2022年3月19日官邸阿什哈巴德总统府(Oguzkhan Presidential Palace)機關所在地阿什哈巴德任命者直接选举任期7年,可连选连任首任萨帕尔穆拉特·尼亚佐夫设立1991年10月27日 土库曼斯坦土库曼斯坦政府与政治 国家政府 土库曼斯坦宪法 国旗 国徽 国歌 立法機關(英语:National Council of Turkmenistan) ...

 

 

Bài này nói về một thành phố của Anh. Các nghĩa khác xin xem Liverpool (định hướng) Liverpool—  Thành phố và Khu tự quản vùng đô thị  — Trên cùng: Pier Head và Mersey Ferry Giữa: St George's Hall và Đại giáo đường Thánh George và Nhà thờ Chính tòa Liverpool Dưới cùng: Khu phố Georgian và Cảng Prince Huy hiệuTên hiệu: The Pool, The Pool of Life, The Pool of Talent, The World in One Ci...

 

 

Questa voce sugli argomenti botanici italiani e biologi italiani è solo un abbozzo. Contribuisci a migliorarla secondo le convenzioni di Wikipedia. Antonio Giuseppe Risso Antonio Giuseppe Risso, francesizzato in Antoine Joseph Risso (Nizza, 7 agosto 1777 – Nizza, 25 agosto 1845), è stato un naturalista italiano. Si appassionò precocemente alla storia naturale seguendo i corsi di Giovanni Battista Balbis (1765-1831) ed entrando a dodici anni come apprendista in una farmacia. Citrus ...

Novel by Peter Carey Jack Maggs AuthorPeter CareyLanguageEnglishGenreParallel NovelPublisherUQP (Australia)Faber & Faber (UK)Knopf (US)Publication date1997 (Australia & UK)1998 (US)Publication placeAustraliaMedia typePrint (Hardback)Pages392ISBN0-7022-2952-0OCLC37500556Dewey Decimal823 21LC ClassPR9619.3.C36 J33 1997Preceded byThe Unusual Life of Tristan Smith Followed byTrue History of the Kelly Gang  Jack Maggs (1997) is a novel by Australian novelist ...

 

 

أحد ضحايا الوباء يظهر شلل كامل في الأطراف السفلية مع ضمور بها في عام 1900 ، تسمم أكثر من 6000 شخص في إنجلترا بالبيرة الملوثة بالزرنيخ، مما أسفر عن موت 70 من مصاب. وقد كان سبب أزمة سلامة الأغذية هو دخول الزرنيخ في سلسلة التموين عن طريق السكر المشوب الذي تم إنتاجه باستخدام حمض الكبر...

 

 

هاوغسوند    علم شعار   الإحداثيات 59°24′37″N 5°16′32″E / 59.41015°N 5.27551°E / 59.41015; 5.27551   [1] تاريخ التأسيس 1 فبراير 1855[2]  تقسيم إداري  البلد النرويج[3][4]  التقسيم الأعلى روغالاند  خصائص جغرافية  المساحة 72.68 كيلومتر مربع (1 يناير 2020)[5...

Sporting event delegationIceland at the2002 Winter OlympicsIOC codeISLNOCNational Olympic and Sports Association of IcelandWebsitewww.isi.is (in Icelandic)in Salt Lake CityCompetitors6 (4 men, 2 women) in 1 sportFlag bearer Dagný Linda KristjánsdóttirMedals Gold 0 Silver 0 Bronze 0 Total 0 Winter Olympics appearances (overview)19481952195619601964196819721976198019841988199219941998200220062010201420182022 Iceland competed at the 2002 Winter Olympics in Salt Lake City, United Sta...

 

 

Indian actress and model Neha DhupiaDhupia in 2013Born (1980-08-27) 27 August 1980 (age 43)Kochi, Kerala, IndiaOccupation(s)Actress, modelHeight5 ft 4 in (163 cm)Spouse Angad Bedi ​(m. 2018)​Children2Beauty pageant titleholderYears active1994–presentMajorcompetition(s)Femina Miss India 2002(Winner)Miss Universe 2002(Top-10 finalist) Neha Dhupia (born 27 August 1980[1]) is an Indian actress, model and beauty pageant titleholder. She wo...

 

 

Football match2023 Slovak Cup finalBoth sets of fans during the finalEvent2022–23 Slovak Cup Spartak Trnava Slovan Bratislava 3 1 Date1 May 2023VenueAnton Malatinský Stadium, TrnavaRefereeMichal OčenášAttendance15,427← 2022 2024 → The 2023 Slovak Cup final (known as the Slovnaft Cup for sponsorship reasons) was the final match of the 2022–23 Slovak Cup, the 54th season of the top cup competition in Slovak football. It was played at the Anton Malatinský Stadium in Trnava, ...

Bubalus kerbau TaksonomiKelasMammaliaOrdoArtiodactylaFamiliBovidaeGenusBubalus H. Smith, 1827 Tata namaSinonim taksonAnoa (en) SpeciesBubalus arneeBubalus depressicornisBubalus quarlesiBubalus mindorensisBubalus bubalisBubalus cebuensis Bubalus adalah genus dari keluarga sapi-sapian (Bovidae) yang mencakup: Kerbau, Bubalus bubalis Kerbau liar, Bubalus arnee Anoa dataran rendah, Bubalus depressicornis Anoa pegunungan, Bubalus quarlesi Tamaraw, Bubalus mindorensis lbsKeluarga Bovidae yang masih...

 

 

Natural disaster aid organization MedairFounded1989TypeNon-governmental organisationFocusHelping people affected by natural disaster or conflict recover with dignityLocationEcublens, Switzerland (Global Support Office)Area served 13 countriesEmployees 1500+Websitemedair.org Medair HQ in Écublens, Vaud, Switzerland Medair is an international non-governmental organisation (INGO) whose purpose is to relieve human suffering in some of the world's most remote and devastated places. Medair aims to...