Секвени́рование РНК (англ.RNA sequencing, RNA-seq) — метод определения первичной структурымолекулРНК, представляющий собой высокочувствительный и точный инструмент для изучения транскриптома. Под этим может подразумеваться как секвенированиемРНК, так и определение последовательности некодирующих РНК. Современное полногеномное секвенирование основано на прямом секвенировании фрагментов кДНК[1].
В отличие от другого широкомасштабного метода анализа транскриптома — экспрессионных микрочипов, РНК-секвенирование позволяет получать данные об аллель-специфичной экспрессии генов, сплайсинговых вариантах транскриптов, пост- и ко-трансляционном редактировании РНК, однонуклеотидных полиморфизмах, а также химерных генах. Кроме того, РНК-секвенирование позволяет получить абсолютную количественную информацию о представленности различных транскриптов в пробе, в отличие от относительных количественных данных микрочипов[2][3].
Совершенствование технологий секвенирования РНК наряду с развитием секвенирования РНК одиночных клеток (англ.single-cell RNA-seq) позволяет более детально изучать этиологию и патогенез различных заболеваний[4][5].
Технологическая платформа для быстрого широкомасштабного секвенирования была создана в 2005 году фирмами 454 Life Sciences[6] и Illumina (ранее Solexa)[7], и сначала использовалась для секвенирования геномов[англ.]. Первые работы по секвенированию транскриптомов появились в 2008 году. В числе первых были секвенированы транскриптом дрожжей[8], арабидопсиса[9] и мыши[10].
В настоящее время РНК-секвенирование осуществляется в основном с использованием трех инструментальных платформ широкомасштабного секвенирования: Illumina, 454 Life Sciences и SOLiD[11].
В 2019 году удалось секвенировать РНК из кожи, хрящей, печени и скелетных мышц щенка Тумата (волка или собаки) возрастом 14300 лет[12].
Методы
Основные принципы секвенирования РНК
Большинство экспериментов по секвенированию РНК проводятся на оборудовании, которое предназначено для секвенирования молекул ДНК. В связи с этим необходимым шагом для секвенирования РНК является создание библиотеки кДНК, полученной из исследуемой тотальной РНК. Каждая кДНК из такой библиотеки представляет собой фрагмент ДНК разного размера, фланкированный по обоим краям специальными адаптерами[англ.]. Наличие адаптеров необходимо для последующей амплификации образцов и секвенирования. Методы создания библиотек кДНК[англ.] варьируются в зависимости от конечной цели исследования и типа изучаемой РНК (РНК может различаться в размере, последовательности, структурных особенностях а также в концентрации). Перед созданием библиотеки кДНК, подходящей для конкретного эксперимента, необходимо ответить на следующие вопросы: 1) какие именно молекулы РНК представляют интерес; 2) как получить кДНК желаемого размера; 3) каким способом лучше присоединить адаптерные последовательности к краям кДНК для амплификации и секвенирования[13].
Создание библиотеки поли(А)-транскриптов
Секвенирование полиаденилированной РНК находит широкое применение в секвенировании РНК. У эукариот большая часть белок-кодирующих РНК (мРНК) и длинных некодирующих РНК (РНК длиной более 200 пар оснований (п. о.)) содержат поли-(А)-хвосты. Наличие поли-(А)-хвоста делает технически простым обогащение препарата суммарной РНК поли-(А)-содержащими РНК (1—5 % от всей суммарной клеточной РНК). Отбор поли-А содержащих РНК можно производить с помощью магнитных или целлюлозных бусин, покрытых праймерами, содержащими олиго-dT-участки[13]. Веб-сайт «The Protocol Online»[14] предоставляет список нескольких протоколов, относящихся к выделению мРНК.
Удаление рибосомной РНК
Неполиаденилированные РНК, такие как мРНК прокариот, фрагменты мРНК, полученные из препаратов, зафиксированных формалином, и транскрипты без поли-(А)-хвостов у эукариот, зачастую являются объектами исследований. Самая большая трудность в секвенировании таких РНК заключается в необходимости очистить суммарную РНК от рибосомной РНК (рРНК), которая превалирует в образце (например, в активно делящихся клетках млекопитающих количество рРНК от суммарной РНК может доходить до 80 %[15])[13]. Существует несколько способов элиминации рРНК:
Первый подход основан на специфичных к последовательностям пробах, которые могут быть гибридизованы с рРНК. Нежелательные рРНК или их кДНК гибридизуют с биотинилированнойДНК или же с пробами, содержащими «закрытые» нуклеиновые кислоты (англ.locked nucleic acid, LNA), и затем проводят очистку на стрептавидиновых бусинах. В другом методе (методе направленной деградации (англ.probe-directed degradation, PDD[16]) рРНК помечаются антисмысловыми олиго-ДНК-праймерами и обрабатываются РНКазой Н. В третьем методе из всех кДНК, полученных и с рРНК и с других РНК, делают кольцевые молекулы, а затем гибридизуют с пробами, содержащими рРНК. Гибридизованные последовательности расщепляются при последующей обработке дуплекс-специфической нуклеазой (англ.duplex-specific nuclease, DSN), которая обладает специфичностью к двуцепочечной ДНК. Последний метод имеет ограничения ввиду необходимости большого количества РНК[17].
Другой подход избавления от рРНК основан на использовании специфических праймеров NSR (англ.not-so-random (NSR) primers), которые связываются только с интересующими молекулами РНК во время обратной транскрипции при получении кДНК. Данный метод, запущенный на рынок под названием Ovation компанией NuGEN, использует гексамерные или гептамерные праймеры, последовательности которых отсутствуют в рРНК. Одним из самых ярких преимуществ данного метода является хорошая работа праймеров NSR в отношении частично деградированной РНК, а также с количественно малыми образцами. Очень часто данный подход используют при изучении транскриптомов прокариот, так как создание библиотеки поли-(А)-содержащих РНК в этом случае невозможно ввиду отсутствия полиаденилирования РНК у прокариот[13].
К третьей группе можно отнести методы, которые используют некоторые особенности рРНК для её последующего удаления. Так, первый метод, известный как СоТ-гибридизация, основан на тепловой денатурации, отжиге и селективной деградации с помощью дуплекс-специфической нуклеазы. Двуцепочечные кДНК, полученные с РНК, превалирующей в образце, будут избирательно подвергаться деградации за счет более быстрой кинетики отжига по сравнению с другой РНК, которой в образце намного меньше. Второй метод основан на использовании ферментаTEX[18] (англ.terminator 5'-phosphate exonuclease), который узнает молекулы РНК, имеющие на 5'-конце фосфат, как у рРНК и тРНК[19].
Фрагментация
После процедуры создания библиотеки поли-(А)-транскриптов либо процедуры удаления рРНК образцы РНК подвергаются фрагментации (обычно перед проведением обратной транскрипции все образцы РНК делаются одинакового размера). Отчасти это обусловлено ограниченными возможностями секвенирующих платформ. Так например, Illumina позволяет секвенировать образцы размером до 1500 п. о. В качестве альтернативы можно не фрагментировать РНК, а сначала сделать из неё кДНК, а затем уже полученную кДНК подвергнуть фрагментации[13].
Адаптеры и направление цепей
В стандартных протоколах по созданию библиотек для секвенирования РНК перед амплификацией и секвенированием к кДНК желаемого размера лигируются ДНК-адаптеры. Несмотря на простоту, в данном подходе теряется информация о том, какая из цепей ДНК соответствует смысловой цепи РНК. Особенно это критично в исследованиях для поиска и идентификации антисмысловых и новых видов РНК. В связи с этим разработаны несколько методов, которые позволяют выявить направление цепи молекул РНК в соответствующей библиотеке кДНК[13].
Первый подход подразумевает присоединение разных адаптеров непосредственно к 5'-концу и к 3'-концу РНК . Изначально этот метод был создан для секвенирования микроРНК. Сначала у фрагментированной РНК убирается фосфатная группа с 3'-конца, а на 5'-конец, наоборот, навешивается. Данная процедура сопровождается последовательным лигированием 5'-аденилированного 3' адаптера с помощью T4 РНК лигазы II и присоединением 5'-адаптера с помощью T4 РНК лигазы I. Различие в адаптерах на разных концах РНК сохраняет информацию о её направлении (имеется в виду, что после проведения процедуры обратной транскрипции информация о том, какая их цепей кДНК соответствует исходной последовательности РНК, сохранится)[20].
Второй подход основан на включении дУТФ во вторую цепь кДНК. Помеченная цепь может быть деградирована непосредственно перед амплификацией с помощью урацил-ДНК-гликозилазы[англ.] — фермента, который выщепляет урацил из ДНК, содержащей дУТФ. Считается, что этот метод наиболее эффективный из всех[13].
Третий подход включает в себя несколько методов. В одном из них производят замену матрицы после отжига на неё случайного гексамерного праймера, содержащего тэг (короткую, до 20 п.о., уникальную последовательность)[21]. В другом методе (англ.breath adapter directional sequencing, BrAD-seq) в момент временного разделения цепей ДНК вводят последовательность с тэгом[22].
Амплификация и молекулярная маркировка
Перед секвенированием кДНК её необходимо амплифицировать с помощью ПЦР. Непосредственно перед проведением ПЦР можно ввести молекулярные маркеры. Эта процедура особенно актуальна, если РНК в образце изначально немного, как, например, в случае секвенирования РНК одной клетки[13].
Секвенирование РНК для особых целей
Измерение профиля экспрессии генов с помощью методов, основанных на использовании тэгов
Секвенирование DGE (от англ.digital gene expression), или Tag-seq — это метод глубокого секвенирования, полученный из SAGE[англ.] (от англ.Serial Analysis of Gene Expression). Как и в SAGE, метод включает в себя присоединение мРНК за поли-А хвост к бусинам, покрытым олиго-dT-праймерами; синтез первой и второй цепи кДНК на бусинах; расщепление двуцепочечной кДНК часто щепящей эндонуклеазой рестрикции. Оставшийся 3'-конец, который присоединен к бусинам, лигируется со своим адаптером, находящимся на 5'-конце. В адаптере есть сайт узнавания для специфической эндонуклеазы рестрикции TE (от англ.tagging enzyme). TE расщепляет кДНК, в ходе чего образуется короткий тэг длинной 21 п. о., который затем лигируется со следующим адаптером, находящимся на 3'-конце. кДНК амплифицируется с помощью ПЦР и секвенируется. Так как секвенируется только короткий тэг из целого транскрипта, секвенирование DGE является более экономичным вариантом в сравнении со стандартным секвенированием РНК. Секвенирование DGE сохраняет информацию о том, какая из цепей кДНК соответствует исходной РНК. Также этот метод находит широкое применение в случае, если полноразмерный геном или транскриптом организма недоступен для полноразмерного выравнивания с прочтениями[англ.], полученными в ходе секвенирования[13][23].
Секвенирование 3'-концов включает в себя целый ряд методов, большинство из которых было специально разработано для поиска альтернативного сплайсинга и сайтов полиаденилирования у эукариот[13].
Прямое секвенирование РНК
Так как обратная транскрипция РНК с помощью обратной транскриптазы дает большое число ошибок и артефактов, которые могут препятствовать корректному качественному и количественному анализу транскриптов[24], компанией Helicos была начата разработка технологии мономолекулярного прямого секвенирования РНК (англ.Direct RNA Sequencing, DRSTM). Этот метод предполагает секвенирование РНК массово-параллельным образом, без получения кДНК, лигирования, амплификации и других процедур, которые могут изменить образец[25].
Проблемы
Основная проблема технологии RNA-seq заключается в том, что исходно неизвестно, какому транскрипту соответствует прочитанный фрагмент. Особенно сложно решить данную проблему в случае исследования транскриптома высших эукариот с частым альтернативным сплайсингом и присутствием в геноме большого числа паралогов. Существует два подхода для восстановления транскриптов по прочитанным фрагментам: картирование на геном отдельных прочитанных фрагментов[26] или восстановление структуры транскрипта de novo[англ.] с последующим картированием полноразмерного транскрипта на геном[27].
Применение
Определение профиля экспрессии генов
Метод секвенирования РНК становится основным методом определения того, какие гены и на каком уровне экспрессируются в клетке. С помощью РНК секвенирования можно определять различия в экспрессии генов на различных стадиях развития организма[28] или в разных тканях[29]. Например, разработан метод локализации in situ последовательностей РНК-транскриптов с помощью флуоресцентного секвенирования (англ.Fluorescent in situ Sequencing, FISSEQ[англ.]), который позволяет изучать фенотип клеток и регуляцию активности генов непосредственно в биологическом образце (на срезах тканей)[30][30]. Также можно определить, транскрипция каких генов изменяется при развитии болезней и рака[31]. В связи с удешевлением методов секвенирования нового поколения появилась возможность определять экспрессию генов у любого человека для диагностики заболеваний. Наряду с секвенированием РНК для измерения профиля экспрессии генов также широко используется кэп-анализ экспрессии генов[32].
Определение мест альтернативного сплайсинга и выявление однонуклеотидных полиморфизмов
Секвенирование РНК — наиболее удобный способ определения мест альтернативного сплайсинга, а также количественного соотношения различных альтернативных форм транскрипта[33][34]. Другие методы не позволяют картировать места альтернативного сплайсинга на всем протяжении генома. Также как и определение экспрессии генов, определение соотношения альтернативных форм транскриптов можно проводить на различных стадиях развития организма или в разных тканях.
РНК-секвенирование позволяет различить транскрипты с отличием в одном нуклеотиде, поэтому может быть использовано как для выявления экспрессируемых однонуклеотидных полиморфизмов в генах, так и для изучения процесса редактирования РНК[35][36].
Редактирование РНК — процесс пост- или ко- транскрипционной модификации рибонуклеотидов в молекуле РНК. В большинстве случаев редактирование РНК приводит к замене аденозинаинозином[36]; катализаторами указанных изменений являются белкисемействаADAR[англ.]. В дальнейшем инозин распознаётся клеточной машинерией (например, рибосомой) как гуанозин, что приводит к возникновению различий между закодированной в геноме информацией и её интерпретацией[37].
Основным методом выявления внесённых изменений является сравнение последовательности нуклеотидов геномной ДНК и соответствующих участков РНК[38].
Важным прогностическим признаком обнаружения сайтов редактирования РНК является наличие эволюционноконсервативных нуклеотидных последовательностей в окружении места редактирования[39].
Вследствие значительного прогресса в развитии методов массового параллельного секвенирования стало технически возможным проводить секвенирование полного транскриптома исследуемого организма с целью выявления связанных с редактированием РНК событий. Однако в силу генетического разнообразия наличие различий в определённой позиции между последовательностью РНК и референсным геномом[англ.] не означает присутствия сайта редактирования в этой позиции, так как идентификация сайтов редактирования РНК подразумевает секвенирование как геномной ДНК, так и кДНК, выделенных из одного и того же организма. Также необходимо принимать во внимание то, что уровни редактирования РНК различаются в разных тканях организма[40].
Для упрощения процедуры идентификации сайтов редактирования РНК предпринимаются попытки разработать программные пакеты, использующие только транскриптомные данные и не требующие секвенирования геномной ДНК. Возможным решением может послужить программное обеспечение GIREMI[41] (англ.Genome-independent Identification of RNA Editing by Mutual Information), которое способно детектировать сайты редактирования РНК, используя исключительно последовательности транскриптов[42].
РНК-секвенирование раковых транскриптомов
РНК-секвенирование широко используется в настоящее время для исследование особенностей транскриптома раковых клеток, в том числе появление химерных транскриптов[43] и продуктов альтернативного сплайсинга, специфичных для раковых клеток[44].
Детекция гибридных генов
Гибридизация генов происходит из-за различных структурных модификаций в геноме и может быть связана с раком[45]. Возможность анализировать весь транскриптом образца с помощью секвенирования РНК делает этот метод привлекательным для поиска подобных частых преобразований при раковой трансформации клеток[43].
Секвенирование РНК является одним из основных методов исследований, проводимых в рамках проектов ENCODE и modENCODE, направленных на создание базы данных элементов генома человека[46] и основных модельных объектов молекулярной биологии[47][48].
↑Margulies Marcel, Egholm Michael, Altman William E., Attiya Said, Bader Joel S., Bemben Lisa A., Berka Jan, Braverman Michael S., Chen Yi-Ju, Chen Zhoutao, Dewell Scott B., Du Lei, Fierro Joseph M., Gomes Xavier V., Godwin Brian C., He Wen, Helgesen Scott, Ho Chun He, Irzyk Gerard P., Jando Szilveszter C., Alenquer Maria L. I., Jarvie Thomas P., Jirage Kshama B., Kim Jong-Bum, Knight James R., Lanza Janna R., Leamon John H., Lefkowitz Steven M., Lei Ming, Li Jing, Lohman Kenton L., Lu Hong, Makhijani Vinod B., McDade Keith E., McKenna Michael P., Myers Eugene W., Nickerson Elizabeth, Nobile John R., Plant Ramona, Puc Bernard P., Ronan Michael T., Roth George T., Sarkis Gary J., Simons Jan Fredrik, Simpson John W., Srinivasan Maithreyan, Tartaro Karrie R., Tomasz Alexander, Vogt Kari A., Volkmer Greg A., Wang Shally H., Wang Yong, Weiner Michael P., Yu Pengguang, Begley Richard F., Rothberg Jonathan M.Genome sequencing in microfabricated high-density picolitre reactors (англ.) // Nature. — 2005. — 31 July (vol. 437, no. 7057). — P. 376—380. — ISSN0028-0836. — doi:10.1038/nature03959. [исправить]
↑Langevin Stanley A., Bent Zachary W., Solberg Owen D., Curtis Deanna J., Lane Pamela D., Williams Kelly P., Schoeniger Joseph S., Sinha Anupama, Lane Todd W., Branda Steven S.Peregrine (англ.) // RNA Biology. — 2013. — April (vol. 10, no. 4). — P. 502—515. — ISSN1547-6286. — doi:10.4161/rna.24284. [исправить]
↑Graveley Brenton R., Brooks Angela N., Carlson Joseph W., Duff Michael O., Landolin Jane M., Yang Li, Artieri Carlo G., van Baren Marijke J., Boley Nathan, Booth Benjamin W., Brown James B., Cherbas Lucy, Davis Carrie A., Dobin Alex, Li Renhua, Lin Wei, Malone John H., Mattiuzzo Nicolas R., Miller David, Sturgill David, Tuch Brian B., Zaleski Chris, Zhang Dayu, Blanchette Marco, Dudoit Sandrine, Eads Brian, Green Richard E., Hammonds Ann, Jiang Lichun, Kapranov Phil, Langton Laura, Perrimon Norbert, Sandler Jeremy E., Wan Kenneth H., Willingham Aarron, Zhang Yu, Zou Yi, Andrews Justen, Bickel Peter J., Brenner Steven E., Brent Michael R., Cherbas Peter, Gingeras Thomas R., Hoskins Roger A., Kaufman Thomas C., Oliver Brian, Celniker Susan E.The developmental transcriptome of Drosophila melanogaster (англ.) // Nature. — 2010. — 22 December (vol. 471, no. 7339). — P. 473—479. — ISSN0028-0836. — doi:10.1038/nature09715. [исправить]
↑ 12Lee J. H., Daugharthy E. R., Scheiman J., Kalhor R., Yang J. L., Ferrante T. C., Terry R., Jeanty S. S. F., Li C., Amamoto R., Peters D. T., Turczyk B. M., Marblestone A. H., Inverso S. A., Bernard A., Mali P., Rios X., Aach J., Church G. M.Highly Multiplexed Subcellular RNA Sequencing in Situ (англ.) // Science. — 2014. — 27 February (vol. 343, no. 6177). — P. 1360—1363. — ISSN0036-8075. — doi:10.1126/science.1250212. [исправить]
↑Gerstein M. B., Lu Z. J., Van Nostrand E. L., Cheng C., Arshinoff B. I., Liu T., Yip K. Y., Robilotto R., Rechtsteiner A., Ikegami K., Alves P., Chateigner A., Perry M., Morris M., Auerbach R. K., Feng X., Leng J., Vielle A., Niu W., Rhrissorrakrai K., Agarwal A., Alexander R. P., Barber G., Brdlik C. M., Brennan J., Brouillet J. J., Carr A., Cheung M.-S., Clawson H., Contrino S., Dannenberg L. O., Dernburg A. F., Desai A., Dick L., Dose A. C., Du J., Egelhofer T., Ercan S., Euskirchen G., Ewing B., Feingold E. A., Gassmann R., Good P. J., Green P., Gullier F., Gutwein M., Guyer M. S., Habegger L., Han T., Henikoff J. G., Henz S. R., Hinrichs A., Holster H., Hyman T., Iniguez A. L., Janette J., Jensen M., Kato M., Kent W. J., Kephart E., Khivansara V., Khurana E., Kim J. K., Kolasinska-Zwierz P., Lai E. C., Latorre I., Leahey A., Lewis S., Lloyd P., Lochovsky L., Lowdon R. F., Lubling Y., Lyne R., MacCoss M., Mackowiak S. D., Mangone M., McKay S., Mecenas D., Merrihew G., Miller D. M., Muroyama A., Murray J. I., Ooi S.-L., Pham H., Phippen T., Preston E. A., Rajewsky N., Ratsch G., Rosenbaum H., Rozowsky J., Rutherford K., Ruzanov P., Sarov M., Sasidharan R., Sboner A., Scheid P., Segal E., Shin H., Shou C., Slack F. J., Slightam C., Smith R., Spencer W. C., Stinson E. O., Taing S., Takasaki T., Vafeados D., Voronina K., Wang G., Washington N. L., Whittle C. M., Wu B., Yan K.-K., Zeller G., Zha Z., Zhong M., Zhou X., Ahringer J., Strome S., Gunsalus K. C., Micklem G., Liu X. S., Reinke V., Kim S. K., Hillier L. W., Henikoff S., Piano F., Snyder M., Stein L., Lieb J. D., Waterston R. H., modENCODE Consortium.Integrative Analysis of the Caenorhabditis elegans Genome by the modENCODE Project (англ.) // Science. — 2010. — 22 December (vol. 330, no. 6012). — P. 1775—1787. — ISSN0036-8075. — doi:10.1126/science.1196914. [исправить]
↑The modENCODE Consortium, Roy S., Ernst J., Kharchenko P. V., Kheradpour P., Negre N., Eaton M. L., Landolin J. M., Bristow C. A., Ma L., Lin M. F., Washietl S., Arshinoff B. I., Ay F., Meyer P. E., Robine N., Washington N. L., Di Stefano L., Berezikov E., Brown C. D., Candeias R., Carlson J. W., Carr A., Jungreis I., Marbach D., Sealfon R., Tolstorukov M. Y., Will S., Alekseyenko A. A., Artieri C., Booth B. W., Brooks A. N., Dai Q., Davis C. A., Duff M. O., Feng X., Gorchakov A. A., Gu T., Henikoff J. G., Kapranov P., Li R., MacAlpine H. K., Malone J., Minoda A., Nordman J., Okamura K., Perry M., Powell S. K., Riddle N. C., Sakai A., Samsonova A., Sandler J. E., Schwartz Y. B., Sher N., Spokony R., Sturgill D., van Baren M., Wan K. H., Yang L., Yu C., Feingold E., Good P., Guyer M., Lowdon R., Ahmad K., Andrews J., Berger B., Brenner S. E., Brent M. R., Cherbas L., Elgin S. C. R., Gingeras T. R., Grossman R., Hoskins R. A., Kaufman T. C., Kent W., Kuroda M. I., Orr-Weaver T., Perrimon N., Pirrotta V., Posakony J. W., Ren B., Russell S., Cherbas P., Graveley B. R., Lewis S., Micklem G., Oliver B., Park P. J., Celniker S. E., Henikoff S., Karpen G. H., Lai E. C., MacAlpine D. M., Stein L. D., White K. P., Kellis M., Acevedo D., Auburn R., Barber G., Bellen H. J., Bishop E. P., Bryson T. D., Chateigner A., Chen J., Clawson H., Comstock C. L. G., Contrino S., DeNapoli L. C., Ding Q., Dobin A., Domanus M. H., Drenkow J., Dudoit S., Dumais J., Eng T., Fagegaltier D., Gadel S. E., Ghosh S., Guillier F., Hanley D., Hannon G. J., Hansen K. D., Heinz E., Hinrichs A. S., Hirst M., Jha S., Jiang L., Jung Y. L., Kashevsky H., Kennedy C. D., Kephart E. T., Langton L., Lee O.-K., Li S., Li Z., Lin W., Linder-Basso D., Lloyd P., Lyne R., Marchetti S. E., Marra M., Mattiuzzo N. R., McKay S., Meyer F., Miller D., Miller S. W., Moore R. A., Morrison C. A., Prinz J. A., Rooks M., Moore R., Rutherford K. M., Ruzanov P., Scheftner D. A., Senderowicz L., Shah P. K., Shanower G., Smith R., Stinson E. O., Suchy S., Tenney A. E., Tian F., Venken K. J. T., Wang H., White R., Wilkening J., Willingham A. T., Zaleski C., Zha Z., Zhang D., Zhao Y., Zieba J.Identification of Functional Elements and Regulatory Circuits by Drosophila modENCODE (англ.) // Science. — 2010. — 22 December (vol. 330, no. 6012). — P. 1787—1797. — ISSN0036-8075. — doi:10.1126/science.1198374. [исправить]