第5回生命医薬情報学連合大会(IIBMP2016)

スポンサードセッション

スポンサードセッション

 

開催日時 セッションタイトル
9/29(木)15:15-16:45 新学術領域研究「植物新種誕生原理」
9/30(金)10:15-11:15 SpringerNature
9/30(金)15:45-17:15 日本マイクロソフト株式会社
10/1(土)10:00-11:30 株式会社Preferred Networks

 

セッション概要

 

新学術領域研究「植物新種誕生原理」
日時:9/29(木)15:15-16:45
会場:プラザ平成 メディアホール

・はじめに:生命情報科学と「植物新種誕生原理」の関わり
演者:瀬々潤(産総研 人工知能研究センター)

 
・植物幹細胞エピゲノムのリプログラミング
演者:辻寛之(横浜市立大学 木原生物学研究所)

DNAメチル化は、遺伝子の発現制御やトランスポゾンの転移抑制を通して多細胞生物の発生・分化に重要な役割を果たしている。植物と動物に共通して、その発生と分化は未分化状態の幹細胞から特定の機能を分化させた細胞を生み出す過程を経て進行する。この過程におけるDNAのメチル化パターンを明らかにすることは発生・分化の理解に重要である。近年、ヒト幹細胞や分化細胞のDNAメチロームが解析されるようになったが、発生様式を異にする植物において未分化な幹細胞群と分化細胞から構成される器官の比較解析は行われていない。植物の幹細胞は、地上部では茎の先端に位置する茎頂メリステムと呼ばれる組織に存在している。茎頂メリステムは植物の地上部すべての起源となる幹細胞領域であり、発芽当初は葉を分化する栄養成長期にあるが、花芽分化に適した環境になると葉で移動性の花芽分化決定因子フロリゲン(Hd3aタンパク質)が合成され、これがメリステムへ到達すると花器官を分化する生殖成長期へ質的に転換される(Taoka, Ohki, Tsuji et al., Nature 2011, Tamaki, Tsuji et al., PNAS 2015)。本研究では、栄養成長期及び生殖成長期のイネ茎頂メリステムを材料にDNAメチローム解析を行い、分化を完了した葉のメチロームと比較した。またRNA-seq、small RNA-seq、プロテオーム解析も並行して実施し、これらを統合して解析した。その結果、フロリゲンは植物メリステムの機能転換を誘導する過程で大規模なエピゲノムのリプログラミングを誘導することを見出した。

 
・The 1001 Epigenomes Project: Epigenomic diversity in a global collection of Arabidopsis thaliana accessions
演者:川勝泰二(農業・食品産業技術総合研究機構 生物機能利用研究部門、Salk Institute for Biological Studies)

The epigenome orchestrates genome accessibility, functionality and three-dimensional structure. Because epigenetic variation can impact transcription and thus phenotypes, it may contribute to adaptation, especially in plants as sessile organisms that can persist in the same location. Leveraging the expanded analysis of sequence variations in the genomes of 1,135 natural accessions (The 1001 Genomes Project: http://1001genomes.org), here we report results from the accompanying the 1001 Epigenomes Project (http://neomorph.salk.edu/1001.php), with 1,107 methylomes from 1,028 accessions and 1,203 transcriptomes from 998 accessions. Although the genetic basis of methylation variation is highly complex, geographic origin is a major predictor of genome-wide DNA methylation levels and of altered gene expression caused by epialleles. Comparison to the 2.7 million transcription factor binding sites (TFBS) of 329 TFs identified on Col-0 leaf DNA with methylcytosines (Col-0 cistrome) and the additional ~180,000 TFBS identified on methylation-free DNA (Col-0 epicistrome) identifies associations between TFBS, methylation, nucleotide variation and co-expression modules. Optical genome maps for nine of the most diverse genomes reveals how transposons and other structural variants shape the epigenome, with dramatic effects on immunity genes. The 1001 Epigenomes Project provides a comprehensive resource for understanding how variation in DNA methylation contributes to molecular and non-molecular phenotypes in natural populations of the most studied model plant.

Ref. Kawakatsu et al. (2016) Cell 166:492-505
 
・ゲノミックインプリンティング ~全ゲノムバイサルファイトシーケンス解析から“目印”として働くDNAメチル化の本質を探る~
演者:小林久人(東京農業大学 生物資源ゲノム解析センター)

全ゲノムバイサルファイトシーケンス(WGBS)解析法は全ゲノムを対象に一塩基解像度でDNAメチル化状態を定量化することを可能である。我々は、胎盤を有する哺乳動物においてみられる、片方の親に由来する対立遺伝子のみが発現するゲノム刷り込み(Genomic imprinting)機構に注目し、刷り込みが成立する生殖細胞系列を対象としたWGBS解析を行ってきた。数多くの雌雄配偶子間DNAメチル化再領域(germline DMRs)を特定すると同時に、DNAメチル化刷り込み確立には配偶子での遺伝子転写に起因するジーンバディメチル化(転写される領域全体が高度にメチル化される現象)が重要であることを明らかにした。本発表では、WGBS法により詳細が明らかとなった生殖細胞および受精卵が受けるゲノムワイドなDNAの新規メチル化・脱メチル化とそれらに対する配列特異的な抵抗性について解説し、DNAメチル化がGenomic imprinting機構で担う役割の本質について議論する。

 

SpringerNature
日時:9/30(金)10:15-11:15
会場:プラザ平成 メディアホール

・オープンアクセスジャーナルとデータベースから支援するヒトゲノムバリエーションのデータ共有
演者:徳永勝士(東京大学大学院 医学系研究科、Human Genome Variation編集長)

データ駆動型研究手法が近年の科学研究のあり方を一新し、大規模データが科学研究における主役になった昨今、研究を飛躍的に推進するとともに、再現性のある研究データへのアクセスを確保する必要性がますます高まっている。研究結果を利活用しやすい形で共有する体制作りや、再現性を確証するためのデータの有用性の確保をサポートするため、数多くのデータベースに加えて、Springer Nature社のScientific DataやGigascienceをはじめとして、データを扱うジャーナル創刊も相次いでいる。今フォーラムでは、さまざまな試みの中から、私達が関わっているジャーナルおよびデータベースによるデータの蓄積、活用を支援するための試みを紹介する。

データベースつきオープンアクセスジャーナルHuman Genome Variationの創刊:
日本人類遺伝学会は、論文のサイズやインパクト等の観点から採択されにくい論文の中に、“既知の疾患遺伝子に見出された新規の変異の報告”が多くあることに着目した。これらの変異データは、まれではあっても新規の変異であれば、その特定の疾患の研究者あるいは治療に携わる臨床医にとって貴重な情報となる。このため、疾患遺伝子の新規変異に関する報告(Data Report)を主要なコンテンツとし、報告された変異データを蓄積する簡易データベースが付帯されているオープンアクセスジャーナルをつくり、これらの論文に出版の場を提供することを考案した。本格的なデータベースとは異なる役割を担いつつ、従来のジャーナルではカバーできない「データ公表・活用」の方法を模索する一形態としての本誌の出版について、今後の展望と共に紹介する。

ヒトゲノムバリエーションデータベース:
SNPタイピング技術と次世代シーケンサ技術の革新により、多くの疾患関連多型・変異がゲノム全域から発見されつつある。私達は国内/アジアにおけるこれらのデータの散逸を防ぎ研究者間で共有するために、2007年よりGWAS-DB, CNV-DBを、2011年度よりHuman variation DB, HLA-DBを構築し(https://gwas.biosciencedbc.jp/)、GWASデータ、NGS変異データの提供を広く呼びかけると共にデータの受け入れ・再配布を行ってきた。2014年度からはNBDCが受け入れ・再配布を実施し、本DBは引き続き解析結果の可視化や、バイオパスウェイと疾患関連変異の関係の可視化などを実施している。これらのDBではGWASのデータとともに、健常者や患者の多様な生殖細胞系列変異(SNP/SNV、CNV、short in/delなど)を収集対象とし、文献から抽出した疾患関連変異・臨床情報30,000以上のエントリーも追加登録しており、日本人/アジア人の変異と表現型(疾患・病態、薬剤応答性)の関係の体系化を目指している。

 

日本マイクロソフト株式会社
日時:9/30(金)15:45-17:15
会場:プラザ平成 国際会議場

・マイクロソフトの研究者向けBig Computeサービス「Azure」とその活用事例のご紹介
演者:Kurt Niebuhr(Principal Program Manager, Microsoft Azure Big Compute, Microsoft Corporation)

世界中の研究者にとって、大量のデータを格納して分析する能力は欠かせません。技術の進化によって研究者は従来よりも大きなデータを格納して処理できるようになったものの、依然として課題が残されています。CPU/GPUとストレージの制限は、研究者の活動を妨げる可能性があります。特に、大量の情報および計算を使う研究者にとっては深刻な問題です。
マイクロソフトの分析およびシミュレーションに携わる研究者向けBig Computeサービス「Azure」は、クラウドをベースとした柔軟性の高いHigh Performance Computing(HPC)環境を提供しています。Azureは、オンデマンドでHPCのリソースを、大規模並列計算、バッチジョブに使用することが可能となります。例えば突発的な需要に対しても、待ち行列に並ぶことなくコンピュートリソースと大量のデータを使用することが出来るようになり、研究者が早期に結果を出すことが可能となります。いつでも大規模のコンピュートリソースが必要となった場合でも容易に拡張、そして使用が終わったらいつでもシャットダウンすることが出来ます。コンピュータのメンテナンス、電源、冷却の心配は不要です。必要な時だけのお支払いとなります。他にも特記すべき事項として、いくつものLinuxディストリビューションもサポート、HPC 業界標準のInfiniBandの搭載、MS MPI、Intel MPI を使用しての大規模な並列計算の実行、VPNや閉域網への接続が可能でありセキュアなアクセス且つ大量のデータを扱うことが出来ます。これらによりAzureは、研究者の課題を解決し、コストの削減と運用負荷の低減を実現します。本セッションで詳しくご説明をします。

 
・Large scale and reproducible cancer genome analysis using Genomon2 and Azure
演者:白石友一(東大医科学研究所 ヒトゲノム解析センター DNA情報解析分野)

シークエンス技術の発達に伴い、がんゲノムシークエンス解析を通じ、多数の新規がん遺伝子が同定された。現在、ICGCやTCGAを中心に世界中で多数のがんシークエンスデータの蓄積が進んでおり、大規模がんシークエンス解析を通じて数多くの新たな生物・医学的知見が獲得されることが期待されている。
一方でシークエンスデータの膨大化に伴い、各研究機関のスーパーコンピュータにシークエンスデータをダウンロードして個別に解析を行う研究モデルに限界が生じつつある。そのために、NCI Cancer Genomics Cloud Pilotによりシークエンスデータを備えたクラウドの整備が進むなど、ゲノム解析においてクラウドの利活用が必須のものになりつつある。
本発表においては、最初に、我々が開発しているがんゲノム解析プラットフォーム「Genomon2」による、約1万検体の大規模がんゲノム・トランスクリプトーム統合解析について紹介し、大規模ゲノム解析の有用性について論じる。
また近年、研究成果の多くに再現性がないという問題が指摘されており、「reproducible research」として、解析結果を様々に再現可能な形にする研究スタイルの確立の機運が高まっているが、「Genomon2」においてゲノム解析結果を再現可能な形にするために、我々が工夫している点、困難を感じている点などについて議論する。
最後に、Microsoft Azureに移植されたGenomon2について、Azureでの実行時間、コストなどについて評価した結果について紹介し、さらにreproducible researchとの関連、クラウドにおけるゲノム解析の有用性について論じる。

 

株式会社Preferred Networks
日時:10/1(土)10:00-11:30
会場:プラザ平成 国際会議場

・Preferred Networksの取り組みの紹介
演者:ハムザウィ カリーム(Preferred Networks)

PFNは深層学習を中心とした機械学習技術やリアルタイム分散協調型コンピューティング技術などを活用して、産業ロボット、自動車産業、バイオヘルスケアの3つの分野に取り組んでいるベンチャー企業である。深層学習技術を最大に活かせるためにはいかに適切な課題に取り組んでいるかが非常に大事だ。そのために、トヨタ、ファナック、京都大学iPS細胞研究所を始めとする各業界のトップ企業・研究機関と一緒に社会にとって重要な課題に取り組んでいる。本講演ではPFNが各分野においてどのようにパートナー企業と取り組んでいるかを例として紹介した上で、バイオヘルスケア分野での新しい医療の実現に向けたアプローチを説明する。

 
・深層学習のバイオロジーへの応用
演者:大野健太(Preferred Networks)

深層学習が広く認知されたのは、2012年の画像認識コンテスト(ILSVRC)で既存手法を大きく超える精度を達成した事がきっかけの1つであったと言われている。それ以来、深層学習の主に画像認識・音声認識・自然言語処理に多く利用されてきた。それら成功に刺激され、深層学習をバイオロジー分野の様々なデータに適用する研究がこの1,2年で急速に増えている。本講演では、深層学習のがバイオロジーの分野でどのように適用されているかを、医療画像解析・タンパク質立体構造予測・モチーフ解析・バーチャルスクリーニングなどを例に紹介する。また、それぞれの例で利用された要素技術もあわせて解説する。

 
・深層学習フレームワークChainerの紹介
演者:奥田遼介(Preferred Networks)

今日の深層学習の発展には、その開発を容易にするソフトウェア(深層学習フレームワーク)の発達が大きく貢献している。数多く深層学習のフレームワークが存在し、それぞれが独自のコンセプトで開発されている。ChainerはPreferred Networksが開発している、オープンソースの深層学習フレームワークである。プログラミング言語Pythonで記述され、複雑なニューラルネットを直感的に記述するフレキシビリティとデバッグの容易さを特徴とし、研究での試行錯誤を容易に進めることを目的として設計されている。本講演では、Chainerのコンセプトを紹介し、Chainerの使い方・利用例を紹介する。

 
・Preferred Networksによるバイオヘルスケアプロジェクト
演者:堂田丈明(Preferred Networks)

従来のバイオロジーは、その膨大な研究成果の解析が困難であり、研究成果を実際に実用化するまで長い時間がかかっていた。そこで我々は、深層学習技術を使った新たなアプローチによって、バイオ分野の様々な研究成果をより早く実用化させます。具体的には、深層学習を使って、膨大なデータをマルチオミクス解析し、その成果を様々な形で実用化させていきます。本講演では、いくつかの具体例をご紹介します。