Кэп-анализ экспрессии генов

Кэп-ана́лиз экспре́ссии ге́нов[1] (англ. cap analysis gene expression, CAGE) — технология, используемая в молекулярной биологии, в результате которой получают профили экспрессии генов эукариот с одновременным определением специфических для клетки/ткани условий транскрипционных стартовых сайтов (TSS), включая данные о задействованных промоторах. Метод заключается в получении и прочтении коротких (обычно длиной 27 нуклеотидов) участков последовательности 5'-конца кэпированных РНК эукариот. Далее проводится картирование секвенированных последовательностей на готовый геном, что позволяет уточнить 5'-границы транскрибируемых областей, а также провести количественный анализ экспрессии. Методика была разработана и опубликована в 2003 году, после чего активно совершенствовалась[2]. Метод активно используется в исследовательском проекте по функциональной аннотации геномов млекопитающих (англ. FANTOM — Functional Annotation of the Mammalian Genome)[3].

С помощью данного метода было показано существование альтернативно регулируемых сайтов начала транскрипции[4][5] и были открыты новые регуляторные элементы[6]. Также он позволил предсказывать сайты связывания факторов транскрипции[7] и других мотивов, связанных с транскрипцией[8]. Анализ 5'-концов данным методом особенно хорош для исследования регуляторных взаимосвязей генов; с его помощью выявили ключевые транскрипционные факторы, ответственные за дифференцировку монобластов в моноциты[9]. Поскольку данный метод не предполагает никакую известную модель гена, он показал, что ретротранспозоны экспрессируются специфично и регулируют мРНК и другие некодирующие РНК[10].

Актуальность метода

Биологический аспект

Для транскрипции необходимо, чтобы РНК-полимераза связалась с промоторной последовательностью ДНК. У бактерий за этот процесс отвечает сигма-фактор, и, как правило, инициация происходит на −10 и −35 нуклеотидов до точки начала транскрипции (σ70 узнает консенсусные последовательности в этой области)[11]. У архей и эукариот происходит преинициация с участием транскрипционных факторов. В зависимости от типа транскрипционного фактора инициация у эукариот может происходить в разных сайтах промоторной области до точки начала транскрипции. Кроме того, существует множество механизмов регуляции этого процесса. Например, некоторые транскрипционные факторы способны связываться со специальными регуляторными последовательностями, что приводит к активации или подавлению транскрипции целевого гена. Сложность системы инициации транскрипции затрудняет точное предсказание сайта начала транскрипции по последовательности ДНК[12].

Секвенирование последовательностей мРНК позволяет решить эту проблему, однако используемый для поиска транскрибируемых участков RNA-seq, основанный на современных методах секвенирования с последующим картированием ридов на геном, обычно не позволяет определить четкие границы (с точностью до одного нуклеотида) концов РНК. С одной стороны, чем более протяженный участок мы можем отсеквенировать, тем проще будет собирать риды. С другой стороны, чем длиннее риды, тем меньше вероятность каждого из них попасть на край транскрипта. В результате при любой технологии секвенирования обычно возникают отклонения в количестве ридов на концах транскрибируемой области (см. рис. 1)[13].

Для решения проблемы определения точки начала транскрипции у бактерий существуют различные методы, основанные на избирательном присоединении различных тэгов к 5'-концу мРНК с трифосфатом на конце[14][15].

Для решения проблемы определения точки начала транскрипции у эукариот был создан метод CAGE и последующие его модификации. Он сосредоточен на секвенировании 5’-концов РНК, которые кэпированы у эукариот. У прокариот на 5'-конце вместо кэпа находится трифосфат, поэтому метод CAGE к ним применить невозможно. Однако применяется альтернативный метод: РНК обрабатывают эндонуклеазами, после чего подвергают обработке 5'-экзонуклеазами. При этом остаются только защищенные трифосфатом 5’-концевые фрагменты[16].

Внешние изображения
Поддержка ридами участков секвенируемой РНК при RNA-seq не одинакова
Рис. 1. Зависимость количества ридов от их положения на РНК при различных методиках RNA-seq

Технологические особенности

Сравнение методов RNA-seq и CAGE показывает, что оба метода дают почти одинаковые количественные оценки экспрессии генов[17]. Это подтверждает высокую эффективность метода CAGE ещё и для количественного анализа экспрессии. Основное преимущество CAGE — возможность секвенирования последовательностей старта транскрипции. Данная методика неоднократно совершенствовалась и были достигнуты следующие технологические показатели[18]:

  • Малое время эксперимента (около 62 ч)
  • Низкое начальное количество РНК (1 — 5 мкг)
  • Возможность упрощения протоколов (можно сократить некоторые стадии эксперимента, например амплификацию с помощью ПЦР)
  • Относительно небольшая стоимость (81$ за библиотеку)

Ограничения

Так как метод был изначально создан для анализа 5'-концевых участков РНК, претерпевших процесс кэпирования, с помощью него невозможно анализировать некэпированные РНК. В связи с этим метод не применим к прокариотам, а также к РНК, транскрибированных РНК-полимеразами I и III. Кроме того большинство разработанных протоколов не работают с РНК короче ~100 нуклеотидов, так как они вымываются в ходе очистки[19].

Базовая схема эксперимента

Внешние изображения
Схема базового эксперимента
Рис. 2. Схема базового протокола CAGE[2]

Ниже приводится схема базового эксперимента CAGE[2][19].

  1. Синтез полной кДНК обратной транскриптазой с олиго(dТ) праймером, комплементарным полиаденилированному 3’-концу мРНК. Получение полных мРНК-кДНК гибридов.
  2. Биотинилирование[англ.] 5'-конца мРНК с помощью обработки реагентом «CAP Trapper»[20], специфично взаимодействующим с двумя соседними гидроксильными группами кэпа.
  3. Очистка кэп-содержащих дуплексов с использованием стрептавидиновых носителей.
  4. Гидролиз мРНК, получение одноцепочечной полной кДНК.
  5. Прикрепление к 5'-концу 1-го биотинилированного линкера с сайтами узнавания эндонуклеаз рестрикции XmaJI и MmeI.
  6. Синтез второй цепи кДНК (до сайта полиаденилирования).
  7. Обработка дцДНК эндонулеазой рестрикции MmeI. Рестриктаза MmeI способна делать разрез двухцепочечной нуклеиновой кислоты, отступив 20/18 нуклеотидов. Эта её особенность используется, чтобы избавиться от большей части кДНК, сохранив примерно 20 нуклеотидов, соответствующих 5'-концу мРНК.
  8. Лигирование с противоположной стороны 2-го линкера, содержащего сайт узнавания XbaI.
  9. ПЦР (увеличение числа копий).
  10. Обработка рестриктазами XmaJI и XbaI (получение фрагментов по 32 нуклеотида, из которых 20 — последовательность с 5'-конца мРНК).
  11. Очистка стрептавидином (избавляемся от фрагментов линкеров).
  12. Получение конкатемеров[англ.] лигированием липких GATC концов, возникших после обработки рестриктазами.
  13. Создание библиотеки клонов и секвенирование по Сэнгеру.
  14. Картирование фрагментов на собранный геном.

Развитие технологии

Внешние изображения
Схема обновленного эксперимента
Рис. 3. Схема нового протокола CAGE

В 2011 году, в связи с задействованием технологии в ENCODE, был переосмыслен протокол CAGE для секвенирования платформами нового поколения. Так, теперь[21]:

  • В реакции обратной транскрипции используется фермент, не имеющий рибонуклеазной активности. Обратная транскриптаза SuperScript II (РНКаза Н активность практически уничтожена мутагенезом)[22] заменена на PrimeScript (полностью отсутствует активность РНКаза Н, кроме того хорошо работает с GC-богатой РНК и РНК с богатой вторичной структурой, обладает более высокой точностью)[23]. В результате происходит более качественный синтез первой цепи кДНК.
  • Вместо олиго(dТ) праймеров используются праймеры, содержащие случайную последовательность длиной 15 нт. Случайные праймеры были впервые предложены в 2006 году[19] и позволяют работать с слабополиаденилированной и неполиаденилированной РНК. Также при использовании случайных праймеров эффективность транскрипции 5'-концов не зависит от длины мРНК.
  • Вместо эндонуклеазы рестрикции MmeI используется EcoP15I. Эндонуклеаза EcoP15I разрезает ДНК с отступом в 27 нт от сайта узнавания, что позволяет увеличить читаемое число нуклеотидов с 20 до 27, увеличив таким образом однозначность картирования последовательностей на геном.
  • Перед биотинилированием смесь обрабатывается РНКазами. Это приводит к увеличению качества очистки целевой РНК, так как экстрагируются только полные с 5'-конца РНК
  • Биотинилируются как кэп, так и 3'-конец РНК.
  • Одноцепочечные кДНК лигируют со специально подготовленными димерами маркированных линкеров, неспособными соединяться друг с другом.
  • После лигирования кДНК с димерами линкеров смесь обрабатывают специальной фосфатазой, работающей при низких температурах Данная процедура увеличивает точность метода.
  • Синтез второй цепи кДНК происходит при участии биотинилированных праймеров.
  • Производится лигирование со 2-м линкером, комплеметарным 3'-концевым праймерам секвенирования.
  • ПЦР (необходимый этап при создании библиотеки клонов и дальнейшего секвенирования) содержит 5'- и 3'-концевые последовательности праймеров секвенирования.

Методы, основанные на CAGE

DeepCAGE

Данный метод был разработан для нахождения малоактивных промоторов. Метод устарел по сравнению с более поздними протоколами. Для прочтения конкатемеров применяются методы 454-секвенирования «нового поколения»[24].

nanoCAGE

Данный метод был разработан для работы с очень малыми количествами РНК (до 10 нг тотальной РНК)[25]:

  • Вместо использования реагента «CAP Trapper» применяется подход со сменой матрицы.
  • Используется эндонуклеаза EcoP15I, что позволяет увеличить длины последовательностей до 27 нуклеотидов.
  • Последовательности читаются напрямую на NGS-платформе Solexa (сейчас часть Illumina), что позволяет отказаться от получения конкатемеров.

CAGEscan

Данный метод является адаптацией nanoCAGE (от тех же авторов) для секвенирования спаренных концов[25]:

  • Не используется стадия ферментативного отрезания 5'-тегов.
  • 5'-концы кДНК секвенируются в обе стороны, чтобы соединить данные о новых промоторах со старыми аннотациями.

HeliScopeCAGE

Данный метод был разработан для уменьшения предвзятости и предполагает использование одномолекулярного секвенирования. Протокол автоматизирован Itoh et al.[26] в 2012 году[6].

  • Отсутствуют стадии достраивания второй цепи, лигирования и отрезания 5'-концевых участков.
  • 5'-кэпированные РНК секвенируются без ПЦР с использованием платформы HeliScope (секвенирует индивидуальные молекулы).

RAMPAGE

Данный метод был разработан для профилирования активности промоторов[27].

  • Использование исходного реагента «CAP Тrapper», смена матрицы (nanoCAGE) и обработка 5′-фосфат-зависимыми экзонуклеазами совмещены для максимизации специфичности промотора.

nAnTi-CAGE

Данный метод был разработан для уменьшения предвзятости и предполагает использование Illumina[28].

  • Отсутствует стадия отрезания 5'-концевых участков последовательностей.
  • 5'-кэпированные РНК секвенируются без ПЦР.

Анализ

Результатом кэп-анализа экспрессии генов является набор последовательностей секвенированных областей, следующих за сайтами старта транскрипции, и их уровень экспрессии. Граница начала транскрипции определяется с точностью до одного нуклеотида. Окружение сайта начала транскрипции обычно включают в себя регуляторные элементы, контролирующие экспрессию генов. Таким образом, становится возможным сопоставление уровня экспрессии с различных точек инициации транскрипции, выявление и анализ мотивов в прилегающих к ним областях для поиска и качественного описания энхансеров и репрессоров[29].

Благодаря CAGE стало возможным картировать сайты стартов транскрипции и промоторы для мРНК с низким уровнем экспрессии[29]. Также удалось доказать, что транскрипция часто начинается не строго с определённой позиции, а существует распределение: острое (где предпочтителен один старт и вариации незначительны) или широкое (когда явного пика не существует, и транскрипция может начинаться на участке в десятки и даже сотни нуклеотидов). В результате разное начало инициации транскрипции может влиять на функцию РНК/белка и открывает возможность для дополнительной регуляции[30].

При анализе результатов CAGE надо учитывать отклонение в получаемых библиотеках в сторону добавления лишних гуанозинов на 5'-конец[30]. Это происходит из-за проскальзывания обратной транскриптазы и даже используется в ряде протоколов, использующих «смену матрицы»[25][31].

Примечания

  1. Маргасюк Сергей Дмитриевич. Анализ корреляции между данными CAGE и концами генов. Конференция Ломоносов 2017 (2017). Дата обращения: 30 апреля 2019. Архивировано 30 апреля 2019 года.
  2. 1 2 3 Shiraki T., Kondo S., Katayama S., Waki K., Kasukawa T., Kawaji H., Kodzius R., Watahiki A., Nakamura M., Arakawa T., Fukuda S., Sasaki D., Podhajska A., Harbers M., Kawai J., Carninci P., Hayashizaki Y. Cap analysis gene expression for high-throughput analysis of transcriptional starting point and identification of promoter usage (англ.) // Proceedings of the National Academy of Sciences. — 2003. — 8 December (vol. 100, no. 26). — P. 15776—15781. — ISSN 0027-8424. — doi:10.1073/pnas.2136655100. [исправить]
  3. FANTOM. fantom.gsc.riken.jp. Дата обращения: 1 мая 2019. Архивировано из оригинала 2 ноября 2018 года.
  4. Carninci Piero, Sandelin Albin, Lenhard Boris, Katayama Shintaro, Shimokawa Kazuro, Ponjavic Jasmina, Semple Colin A M, Taylor Martin S, Engström Pär G, Frith Martin C, Forrest Alistair R R, Alkema Wynand B, Tan Sin Lam, Plessy Charles, Kodzius Rimantas, Ravasi Timothy, Kasukawa Takeya, Fukuda Shiro, Kanamori-Katayama Mutsumi, Kitazume Yayoi, Kawaji Hideya, Kai Chikatoshi, Nakamura Mari, Konno Hideaki, Nakano Kenji, Mottagui-Tabar Salim, Arner Peter, Chesi Alessandra, Gustincich Stefano, Persichetti Francesca, Suzuki Harukazu, Grimmond Sean M, Wells Christine A, Orlando Valerio, Wahlestedt Claes, Liu Edison T, Harbers Matthias, Kawai Jun, Bajic Vladimir B, Hume David A, Hayashizaki Yoshihide. Genome-wide analysis of mammalian promoter architecture and evolution (англ.) // Nature Genetics. — 2006. — 28 April (vol. 38, no. 6). — P. 626—635. — ISSN 1061-4036. — doi:10.1038/ng1789. [исправить]
  5. Gustincich Stefano, Sandelin Albin, Plessy Charles, Katayama Shintaro, Simone Roberto, Lazarevic Dejan, Hayashizaki Yoshihide, Carninci Piero. The complexity of the mammalian transcriptome (англ.) // The Journal of Physiology. — 2006. — 24 August (vol. 575, no. 2). — P. 321—332. — ISSN 0022-3751. — doi:10.1113/jphysiol.2006.115568. [исправить]
  6. 1 2 Kanamori-Katayama M., Itoh M., Kawaji H., Lassmann T., Katayama S., Kojima M., Bertin N., Kaiho A., Ninomiya N., Daub C. O., Carninci P., Forrest A. R. R., Hayashizaki Y. Unamplified cap analysis of gene expression on a single-molecule sequencer (англ.) // Genome Research. — 2011. — 19 May (vol. 21, no. 7). — P. 1150—1159. — ISSN 1088-9051. — doi:10.1101/gr.115469.110. [исправить]
  7. Vitezic Morana, Lassmann Timo, Forrest Alistair R. R., Suzuki Masanori, Tomaru Yasuhiro, Kawai Jun, Carninci Piero, Suzuki Harukazu, Hayashizaki Yoshihide, Daub Carsten O. Building promoter aware transcriptional regulatory networks using siRNA perturbation and deepCAGE (англ.) // Nucleic Acids Research. — 2010. — 19 August (vol. 38, no. 22). — P. 8141—8148. — ISSN 0305-1048. — doi:10.1093/nar/gkq729. [исправить]
  8. Frith M. C., Valen E., Krogh A., Hayashizaki Y., Carninci P., Sandelin A. A code for transcription initiation in mammalian genomes (англ.) // Genome Research. — 2007. — 21 November (vol. 18, no. 1). — P. 1—12. — ISSN 1088-9051. — doi:10.1101/gr.6831208. [исправить]
  9. The FANTOM Consortium, Riken Omics Science Center. The transcriptional network that controls growth arrest and differentiation in a human myeloid leukemia cell line (англ.) // Nature Genetics. — 2009. — 19 April (vol. 41, no. 5). — P. 553—562. — ISSN 1061-4036. — doi:10.1038/ng.375. [исправить]
  10. Faulkner Geoffrey J, Kimura Yasumasa, Daub Carsten O, Wani Shivangi, Plessy Charles, Irvine Katharine M, Schroder Kate, Cloonan Nicole, Steptoe Anita L, Lassmann Timo, Waki Kazunori, Hornig Nadine, Arakawa Takahiro, Takahashi Hazuki, Kawai Jun, Forrest Alistair R R, Suzuki Harukazu, Hayashizaki Yoshihide, Hume David A, Orlando Valerio, Grimmond Sean M, Carninci Piero. The regulated retrotransposon transcriptome of mammalian cells (англ.) // Nature Genetics. — 2009. — 19 April (vol. 41, no. 5). — P. 563—571. — ISSN 1061-4036. — doi:10.1038/ng.368. [исправить]
  11. Biology. — 9th ed. — Dubuque, IA: McGraw-Hill, 2011. — С. 278—301. — xxvi, 1279, [97] pages с. — ISBN 9780073532226, 9780077350024, 0077350022, 0073532223, 9780071222068, 0071222065, 9780071327640, 0071327649.
  12. Lieberman, Michael, 1950-. Chapter 14 // Marks' basic medical biochemistry : a clinical approach. — Fourth edition. — Philadelphia: Wolters Kluwer Health/Lippincott Williams & Wilkins, [2013]. — ix, 1014 pages с. — ISBN 9781608315727, 160831572X, 9781451100037, 1451100035.
  13. Head Steven R., Komori H. Kiyomi, LaMere Sarah A., Whisenant Thomas, Van Nieuwerburgh Filip, Salomon Daniel R., Ordoukhanian Phillip. Library construction for next-generation sequencing: Overviews and challenges (англ.) // BioTechniques. — 2014. — 1 February (vol. 56, no. 2). — ISSN 1940-9818. — doi:10.2144/000114133. [исправить]
  14. Innocenti Nicolas, Golumbeanu Monica, Fouquier d'Hérouël Aymeric, Lacoux Caroline, Bonnin Rémy A., Kennedy Sean P., Wessner Françoise, Serror Pascale, Bouloc Philippe, Repoila Francis, Aurell Erik. Whole-genome mapping of 5′ RNA ends in bacteria by tagged sequencing: a comprehensive view inEnterococcus faecalis (англ.) // RNA. — 2015. — 3 March (vol. 21, no. 5). — P. 1018—1030. — ISSN 1355-8382. — doi:10.1261/rna.048470.114. [исправить]
  15. Ettwiller Laurence, Buswell John, Yigit Erbay, Schildkraut Ira. A novel enrichment strategy reveals unprecedented number of novel transcription start sites at single base resolution in a model prokaryote and the gut microbiome (англ.) // BMC Genomics. — 2016. — 8 March (vol. 17, no. 1). — ISSN 1471-2164. — doi:10.1186/s12864-016-2539-z. [исправить]
  16. Mazin Pavel V., Fisunov Gleb Y., Gorbachev Alexey Y., Kapitskaya Kristina Y., Altukhov Ilya A., Semashko Tatiana A., Alexeev Dmitry G., Govorun Vadim M. Transcriptome analysis reveals novel regulatory mechanisms in a genome-reduced bacterium (англ.) // Nucleic Acids Research. — 2014. — 31 October (vol. 42, no. 21). — P. 13254—13268. — ISSN 1362-4962. — doi:10.1093/nar/gku976. [исправить]
  17. Kawaji H., Lizio M., Itoh M., Kanamori-Katayama M., Kaiho A., Nishiyori-Sueki H., Shin J. W., Kojima-Ishiyama M., Kawano M., Murata M., Ninomiya-Fukuda N., Ishikawa-Kato S., Nagao-Sato S., Noma S., Hayashizaki Y., Forrest A. R. R., Carninci P., The FANTOM Consortium. Comparison of CAGE and RNA-seq transcriptome profiling using clonally amplified and single-molecule next-generation sequencing (англ.) // Genome Research. — 2014. — 27 March (vol. 24, no. 4). — P. 708—717. — ISSN 1088-9051. — doi:10.1101/gr.156232.113. [исправить]
  18. Adiconis Xian, Haber Adam L., Simmons Sean K., Levy Moonshine Ami, Ji Zhe, Busby Michele A., Shi Xi, Jacques Justin, Lancaster Madeline A., Pan Jen Q., Regev Aviv, Levin Joshua Z. Comprehensive comparative analysis of 5′-end RNA-sequencing methods (англ.) // Nature Methods. — 2018. — 4 June (vol. 15, no. 7). — P. 505—511. — ISSN 1548-7091. — doi:10.1038/s41592-018-0014-2. [исправить]
  19. 1 2 3 Kodzius Rimantas, Kojima Miki, Nishiyori Hiromi, Nakamura Mari, Fukuda Shiro, Tagami Michihira, Sasaki Daisuke, Imamura Kengo, Kai Chikatoshi, Harbers Matthias, Hayashizaki Yoshihide, Carninci Piero. CAGE: cap analysis of gene expression (англ.) // Nature Methods. — 2006. — March (vol. 3, no. 3). — P. 211—222. — ISSN 1548-7091. — doi:10.1038/nmeth0306-211. [исправить]
  20. Carninci Piero, Kvam Catrine, Kitamura Akiko, Ohsumi Tomoya, Okazaki Yasushi, Itoh Mitsuteru, Kamiya Mamoru, Shibata Kazuhiro, Sasaki Nobuya, Izawa Masaki, Muramatsu Masami, Hayashizaki Yoshihide, Schneider Claudio. High-Efficiency Full-Length cDNA Cloning by Biotinylated CAP Trapper (англ.) // Genomics. — 1996. — November (vol. 37, no. 3). — P. 327—336. — ISSN 0888-7543. — doi:10.1006/geno.1996.0567. [исправить]
  21. Takahashi Hazuki, Lassmann Timo, Murata Mitsuyoshi, Carninci Piero. 5′ end–centered expression profiling using cap-analysis gene expression and next-generation sequencing (англ.) // Nature Protocols. — 2012. — 23 February (vol. 7, no. 3). — P. 542—561. — ISSN 1754-2189. — doi:10.1038/nprot.2012.005. [исправить]
  22. SuperScript II Reverse Transcriptase - Thermo Fisher Scientific. www.thermofisher.com. Дата обращения: 1 мая 2019. Архивировано 1 мая 2019 года.
  23. Efficient preparation of cDNA: PrimeScript Reverse Transcriptase. www.takarabio.com. Дата обращения: 1 мая 2019. Архивировано 1 мая 2019 года.
  24. Valen E., Pascarella G., Chalk A., Maeda N., Kojima M., Kawazu C., Murata M., Nishiyori H., Lazarevic D., Motti D., Marstrand T. T., Tang M.-H. E., Zhao X., Krogh A., Winther O., Arakawa T., Kawai J., Wells C., Daub C., Harbers M., Hayashizaki Y., Gustincich S., Sandelin A., Carninci P. Genome-wide detection and analysis of hippocampus core promoters using DeepCAGE (англ.) // Genome Research. — 2008. — 3 December (vol. 19, no. 2). — P. 255—265. — ISSN 1088-9051. — doi:10.1101/gr.084541.108. [исправить]
  25. 1 2 3 Plessy Charles, Bertin Nicolas, Takahashi Hazuki, Simone Roberto, Salimullah Md, Lassmann Timo, Vitezic Morana, Severin Jessica, Olivarius Signe, Lazarevic Dejan, Hornig Nadine, Orlando Valerio, Bell Ian, Gao Hui, Dumais Jacqueline, Kapranov Philipp, Wang Huaien, Davis Carrie A, Gingeras Thomas R, Kawai Jun, Daub Carsten O, Hayashizaki Yoshihide, Gustincich Stefano, Carninci Piero. Linking promoters to functional transcripts in small samples with nanoCAGE and CAGEscan (англ.) // Nature Methods. — 2010. — 13 June (vol. 7, no. 7). — P. 528—534. — ISSN 1548-7091. — doi:10.1038/nmeth.1470. [исправить]
  26. Itoh Masayoshi, Kojima Miki, Nagao-Sato Sayaka, Saijo Eri, Lassmann Timo, Kanamori-Katayama Mutsumi, Kaiho Ai, Lizio Marina, Kawaji Hideya, Carninci Piero, Forrest Alistair R. R., Hayashizaki Yoshihide. Automated Workflow for Preparation of cDNA for Cap Analysis of Gene Expression on a Single Molecule Sequencer (англ.) // PLoS ONE. — 2012. — 30 January (vol. 7, no. 1). — P. e30809. — ISSN 1932-6203. — doi:10.1371/journal.pone.0030809. [исправить]
  27. Batut P., Dobin A., Plessy C., Carninci P., Gingeras T. R. High-fidelity promoter profiling reveals widespread alternative promoter usage and transposon-driven developmental gene expression (англ.) // Genome Research. — 2012. — 30 August (vol. 23, no. 1). — P. 169—180. — ISSN 1088-9051. — doi:10.1101/gr.139618.112. [исправить]
  28. Murata Mitsuyoshi, Nishiyori-Sueki Hiromi, Kojima-Ishiyama Miki, Carninci Piero, Hayashizaki Yoshihide, Itoh Masayoshi. Detecting Expressed Genes Using CAGE (англ.) // Transcription Factor Regulatory Networks. — 2014. — P. 67—85. — ISBN 9781493908042. — ISSN 1064-3745. — doi:10.1007/978-1-4939-0805-9_7. [исправить]
  29. 1 2 de Hoon Michiel, Hayashizaki Yoshihide. Deep cap analysis gene expression (CAGE): genome-wide identification of promoters, quantification of their expression, and network inference (англ.) // BioTechniques. — 2008. — April (vol. 44, no. 5). — P. 627—632. — ISSN 0736-6205. — doi:10.2144/000112802. [исправить]
  30. 1 2 Zhao Xiaobei, Valen Eivind, Parker Brian J., Sandelin Albin. Systematic Clustering of Transcription Start Site Landscapes (англ.) // PLoS ONE. — 2011. — 24 August (vol. 6, no. 8). — P. e23409. — ISSN 1932-6203. — doi:10.1371/journal.pone.0023409. [исправить]
  31. Islam S., Kjallquist U., Moliner A., Zajac P., Fan J.-B., Lonnerberg P., Linnarsson S. Characterization of the single-cell transcriptional landscape by highly multiplex RNA-seq (англ.) // Genome Research. — 2011. — 4 May (vol. 21, no. 7). — P. 1160—1167. — ISSN 1088-9051. — doi:10.1101/gr.110882.110. [исправить]

Ссылки