ゲノミクス

ゲノミクス: genomics、ジェノミクス)とは、ゲノム遺伝子について研究する生命科学の一分野。ゲノム学(ゲノムがく)、ゲノム科学(ゲノムかがく)とも。

ゲノミクスは1980年代に現れ、1990年代のゲノムプロジェクトの開始とともに発展した。初めて完全長のゲノムが解読されたのはバクテリオファージFX174 (5,368 kb) で1980年のことである。自由生活生物としてはインフルエンザ菌で1995年。以来、猛烈な速さでゲノム解読が進行している。ヒトゲノムのおおまかな配列はヒトゲノムプロジェクトによって2001年前半に解読されている。

ポストゲノムプロジェクトのゲノミクスとして、さまざまな生物種のゲノムを比較することで、進化の解明を試みる比較ゲノミクスや、RNAiなどによる遺伝子阻害から、全体論的な機構解明を行う機能ゲノミクスなどがある。ゲノミクスではバイオインフォマティクス遺伝学分子生物学をツールとして用いるとともに、システム生物学のツールとしても用いられる。またゲノミクスは医療の分野に新たな治療法を提供してきている(ファーマコゲノミクス)。食品(ニュートリゲノミクス)や農業の分野へも応用される。

ゲノム解析

ある生物が対象に選ばれた後、次の三つの段階を経る。:シーケンシング、アセンブリ、アノテーション。[1]

ゲノムプロジェクト概要。初めに、解析対象ゲノムが選ばれる。この選択は、コストや研究の妥当性などの要因を勘案してなされる。第二に、シーケンシングが実行され、アセンブリされる。第三に、アノテーションを様々なレベルでおこなう。: 遺伝子、タンパク質、gene pathways、種間比較

シーケンシング

歴史的に見ると、初め、シーケンシングはシーケンシングセンターという中央集中型の施設(一年に数十テラ塩基の配列決定をおこなうJoint Genome Instituteのような巨大独立行政法人に囲まれた施設)で行われていた。そこには高価な実験器具や技術サポートを必要とする研究室が集まっていた。しかし、塩基配列決定技術が進歩し、十分に高速なベンチトップ型のシーケンサーができると、平均的なアカデミックラボでもシーケンサーを使えるようになってきた。[2][3]

全体的に見て、ゲノムシーケンシングの手法は二つに区分される。ショットガンシーケンシングハイスループットシーケンシング(いわゆる、次世代シーケンシング)である。 [1]

An ABI PRISM 3100 Genetic Analyzer. このようなキャピラリーシーケンサーによって、初期のゲノムシーケンシング作業が自動化された。
Illumina Genome Analyzer II System. Illumina technologiesは標準的なhigh throughput massively parallel sequencing技術である。

アセンブリ

Overlapping reads form contigs; contigs and gaps of known length form scaffolds.
next generation sequencing data のPaired end reads を reference genome にマップしている。
複数の断片化された sequence reads は、どの領域が重複しているかという情報を基にアセンブリされる。

配列アセンブリは大量のDNA配列断片をアライメントし、繋ぎ合わせ、オリジナルの配列を再構築することである。[1] [4]

アノテーション

アセンブリされたDNA配列は、さらに追加の解析がなされないとほとんどの場合価値はない。[1] ゲノムアノテーションはDNA配列に生物学的情報を付加し、意味付けするプロセスである。

このプロセスは三つのステップからなる。[5]

  1. ゲノムの非コード領域部分を同定する。
  2. タンパク質をコードする遺伝子など、何らかの機能を持つと推測される領域を同定する。(gene prediction
  3. これらの要素に生物学的情報を付加する。

出典

  1. ^ a b c d Pevsner, Jonathan (2009). Bioinformatics and functional genomics (2nd ed.). Hoboken, N.J: Wiley-Blackwell. ISBN 9780470085851 
  2. ^ Monya Baker (2012年9月14日). “Benchtop sequencers ship off” (Blog). Nature News Blog. 2012年12月22日閲覧。
  3. ^ Quail, M.; Smith, M. E.; Coupland, P.; Otto, T. D.; Harris, S. R.; Connor, T. R.; Bertoni, A.; Swerdlow, H. P. et al. (2012). “A tale of three next generation sequencing platforms: Comparison of Ion torrent, pacific biosciences and illumina MiSeq sequencers”. BMC Genomics 13: 341. doi:10.1186/1471-2164-13-341. PMC 3431227. PMID 22827831. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3431227/. 
  4. ^ 北上 始, 太田 聡史, 斎藤 成也:「ビッグデータ時代のゲノミクス情報処理」、コロナ社、ISBN 978-4339024852(2014年10月)
  5. ^ Stein, L. (2001). “Genome Annotation: From Sequence to Biology”. Nature Reviews Genetics 2 (7): 493–503. doi:10.1038/35080529. PMID 11433356. 

関連項目

外部リンク