第5回生命医薬情報学連合大会(IIBMP2016)

BoF

BoF

 

開催日時 セッションタイトル
9/29(木)13:30-15:00 「ゲノムは個人情報?どのように扱うのが適切か?part 2」
-個人情報保護改正法の対象となった遺伝情報をどのように扱っていくのか-
9/29(木)13:30-15:00 GalaxyによるNGSデータ解析
9/29(木)13:30-15:00 薬のタネ発見のための計算技術と創薬知 ― 人智と計算の融合の可能性を探る
9/29(木)15:15-16:45 生命科学におけるセマンティックデータの高度利活用に向けた課題と展望
9/30(金)9:45-11:15 質量分析インフォマティクス
9/30(金)15:45-17:15 バイオイメージインフォマティクス:
大規模生命画像データの情報解析に基づく生物学
9/30(金)17:30-19:00 数理・情報解析が牽引する新しいがん研究
9/30(金)17:30-19:00 バイオインフォマティクスにブレイクスルーをもたらしうる大規模測定技術
10/1(土)10:00-11:30 遺伝統計学が切り拓く新たなゲノム・エピゲノムデータ解析の地平線
10/1(土)10:00-11:30 Museomicsが開く新時代

 

セッション概要

 

「ゲノムは個人情報?どのように扱うのが適切か?part 2」
-個人情報保護改正法の対象となった遺伝情報をどのように扱っていくのか-
日時:9/29(木)13:30-15:00
会場:プラザ平成 国際会議場
オーガナイザー:清水佳奈(早稲田大学)、片山俊明(DBCLS)、荻島創一(東北大学)

個人情報保護法改正法案の成立から約一年が経過しました.遺伝情報が改正法の対象となり,遺伝情報の取り扱いをめぐる様々なルールの運用について大きな関心が寄せられています.昨年のIIBMPでも類似の話題を扱いましたが,今回の企画はそのフォローアップとなります.法改正によって研究の現場にどのような影響があったのか(あるいはなかったのか)を確認し,関連分野に携わる研究者の間で情報を共有します.また,前回は改正法について理解を深めることを中心に議論が行われましたが,今回はそれをさらに一歩進めて,現時点では詳細が定められていない「個人識別符号」や「要配慮情報」の適用範囲について,ゲノム法の必要性,遺伝子差別の問題など,より具体的な内容について各々の専門家と共に議論します.セッションの進行に関しては,一部の参加者による議論にとどまらぬよう,テーマごとに小グループに分かれて議論をする等の工夫をする予定です.本セッションでは講演というスタイルではなく、以下の先生方をお招きしてパネルセッションを中心に参加者の皆様と議論をしたいと考えています(敬称略)。

山本 奈津子(大坂大学)
鈴木 正朝(新潟大学)
高木 利久(東京大学)
堤 正好(株式会社エスアールエル)

 

GalaxyによるNGSデータ解析
日時:9/29(木)13:30-15:00
会場:プラザ平成 メディアホール
オーガナイザー:鈴木治夫(慶應義塾大学)、山中遼太(日本オラクル)

Galaxyシステムは,無償で利用できる統合データ解析環境である.公開されている様々なツールを組み合わせた解析ワークフローの構築が可能であり,ワークフローの再実行や結果の共有が簡単に行えるため,NGSデータの解析システムとして広く利用されてきた実績がある.しかし,このシステムが目指す再利用性や再現性の向上のためにはまだ課題がある.その一つとして,各研究機関がGalaxyシステム上で利用しているツールやワークフローの情報が乏しく,十分に知識が共有されているとは言い難い.また,手作業で構築したシステムの環境は一度変更されてしまうと全く同一の環境を再構築することが難しいため,過去に実行されたワークフローの再現性を保つのは容易ではない.本セッションでは,Galaxyをはじめとした既存システムの課題を整理し,ワークフローを再利用するための枠組みや解析の再現性を保つためのシステムの運用方法について議論する.

 
・データ解析環境 Galaxy とは
演者:鈴木治夫(慶應義塾大学)

 
・今すぐ使える Galaxy VM
演者:山中遼太(日本オラクル)

 
・Galaxy の活用事例 (1)
演者:新海典夫(産業技術総合研究所)

 
・Galaxy の活用事例 (2)
演者:望月孝子(国立遺伝学研究所)

 
・Galaxy七転び八起き (1)
演者:池田誠(パーシピア)

 
・Galaxy七転び八起き (2)
演者:小笠原理(国立遺伝学研究所)

 
・Galaxy七転び八起き (3)
演者:那須野淳(アスケイド)

 
・Galaxy七転び八起き (4)
演者:石井学(理化学研究所)

 

薬のタネ発見のための計算技術と創薬知 ― 人智と計算の融合の可能性を探る
日時:9/29(木)13:30-15:00
会場:プラザ平成 会議室1
オーガナイザー:大上雅史(東京工業大学)、山本一樹(東京大学)

創薬プロセスの加速を目指した計算による薬の候補化合物選別技術(バーチャルスクリーニング; VS)の研究が進んでいる.標的タンパク質の構造情報を活用するSBVS,複数のタンパク質と化合物の相互作用情報を活用するCGBVSなど様々な方法論が提案されているが,今なお研究者がしのぎを削ってスクリーニング性能の改善を目指している.一方で創薬科学者,メドケム研究者の目利き (visual inspection) のような,人手による要素も創薬過程においては無くてはならないものであるが,情報科学との融合,VS の方法論への反映のための手段は,必ずしも整備されているとは言い難い.本セッションでは,既存の VS 手法を俯瞰した上で,人間がどのような視点を創薬プロセスで使うのかという「創薬知」に迫り,人間と計算の融合(ヒューマンコンピュテーション),ひいては創薬と citizen science との連携の実現可能性について,多様な観点から議論したい.

 
・薬のタネ発見のための計算技術と創薬知BoF
演者:大上雅史(東京工業大学)

1997年にvirtual screeningという言葉が初めて登場して以来、創薬支援計算の事例は加速度的に増え続けている(PubMed検索 “virtual screening”より)。一方で、創薬にはメディシナルケミストの視点、目利き (visual inspection) が現在においてもきわめて重要であり、人手による要素は無くてはならない。我々はこの人間の能力を「創薬知」と定義し、人間がどのような視点を創薬プロセスで使うのかということの明文化を目指している。本BoFセッションでは、計算と創薬をキーワードに、多様な分野の研究者から最先端の研究事例を紹介頂く。人間と計算の融合可能性について議論のきっかけとなれば幸いである。

 
・リガンド情報に基づくバーチャルスクリーニング
演者:山西芳裕(九州大学)

医薬品候補化合物と標的タンパク質の間の相互作用の同定は、医薬品開発過程において最重要課題である。探索空間を狭めて実験コストを抑制するためにも、計算機によるバーチャルスクリーニングが期待されている。近年の生命科学や創薬科学では、膨大な数の化合物に関する生理活性情報だけでなく、ゲノム、トランスクリプトーム、プロテオーム、フェノームなどの大量のデータが得られるようになってきた。当日は、それらの様々な膨大なデータを有効活用したバーチャルスクリーニング手法を紹介する。

 
・タンパク質構造を利用したバーチャルスクリーニングとその周辺
演者:千見寺浄慈(名古屋大学)

薬のタネを発見するために必要なことは、標的タンパク質に強く結合する分子を探すことである。よって、物理化学の観点から計算機を用いて薬のタネを発見するのに最も理にかなった方法は、タンパク質立体構造を利用したドッキングシミュレーションであろう。現在、Glideなどのような優秀なドッキングシミュレーションソフトが開発されてきており、それらを用いた成功例も幾つか報告されている。しかしながら、既存のドッキングシミュレーションをナイーブに使うだけでは、必ずしも任意の標的タンパク質に対して良好な結果を得られるとは限らないこともよく知られている。そのため、より成績をあげるために、ドッキングシミュレーションと機械学習の組み合わせなどのような複合的な戦略が用いられている。本講演ではこのような手法を概観し、さらなるドッキングシミュレーションと人智の融合の可能性を議論したい。

 
・新規薬剤候補の発見に向けたタンパク質MDシミュレーション
演者:森脇由隆(分子科学研究所,JSPS特別研究員)

分子動力学(MD)シミュレーションを用いたタンパク質の構造変化サンプリングは、結晶構造からだけでは発見することのできない隠れたタンパク質のコンフォメーションを発見することが可能である。こうして発見された結晶構造以外のコンフォメーションを用いた計算機による化合物バーチャルスクリーニングからは、既知の結合化合物骨格から大きく異なる新規骨格を有する化合物の発見率が高いことが報告されている。また、構造が未知のタンパク質でも、類縁の構造が報告されている場合にはホモロジーモデリングによって構造を創りだすことが可能である。本講演ではホモロジーモデリングとMDシミュレーションを用いた構造サンプリングの手法を、特にこれまで計算科学に取り組んだことがない方でも取り組みやすいように手法を紹介したい。

 
・バーチャルスクリーニングを支える機械学習技術
演者:田部井靖生(東京工業大学,JSTさきがけ)

本講演では、大規模なバーチャルスクリーニング(VS)のための機械学習技術について紹介する。スケーラビリティーを上げるための技術や、学習結果を観測するための技術、最近の深層学習を用いたVSなどを紹介した後に、将来に必要とされる技術について論ずる。

 
・ヒューマンコンピュテーションとクラウドソーシング
演者:馬場雪乃(京都大学)

ヒューマンコンピュテーションは、計算機の演算能力と人間の認知・判断能力を組み合わせて大規模かつ困難な問題を解決するための方法論である。インターネット上で不特定多数の人に仕事を依頼する場であるクラウドソーシング市場の登場により、人間の労働力へのアクセスが効率化されたことに伴い、様々な分野の問題解決にヒューマンコンピュテーションが活用されている。本講演ではヒューマンコンピュテーションとクラウドソーシングの概要を解説するとともに、有機化合物の合成可能性判定への応用事例を紹介する。

 
・化合物選抜におけるメディシナルケミストの着眼点
演者:中野浩史(東京大学)

低分子創薬の成功確率を上げるためには、将来性のある適切な化合物から研究をスタートすることが極めて重要である。適切な化合物とは、合成展開性が高く、安定性が高く、生物学的利用能が高いものであり、リピンスキーのルール・オブ・ファイブに代表される化合物選抜基準が現在まで提案されている。しかしながら化合物選抜基準についてはスクリーニング担当者とメディシナルケミストの間で捉え方に相違があるのが現状である。本演題では適切な化合物から研究をスタートさせるための、メディシナルケミストの着眼点について議論したい。

 
・ligand pose に関する visual inspection の有効性検証
演者:山本一樹(東京大学)

構造に基づくバーチャルスクリーニングにおいて、ドッキングシミュレーションで予測されたリガンド結合ポーズを科学者が目視によって確認する作業は visual inspection と称され、アッセイを実施できる化合物数が現実的に限られている中で可能な限り有望なアッセイ対象化合物群を選りすぐるために、ほぼ必ず行われている。しかしながら、目視による判断基準は暗黙知的で体系化されておらず、そもそもアッセイにおけるヒット率向上に本当に目視が有効であったかどうかについても検証されていない。本講演では、まず人間が視覚的に認知可能なリガンド結合様式の情報について概観し、さらに、実際に創薬標的を題材として実施した目視評価のパイロット実験の結果も交えつつ、「人力」と IT 創薬との融合に関する feasibility を検証したい。

 

生命科学におけるセマンティックデータの高度利活用に向けた課題と展望
日時:9/29(木)15:15-16:45
会場:プラザ平成 会議室1
オーガナイザー:小林紀郎(理化学研究所)、古崎晃司(大阪大学)

生命科学において、セマンティックウェブに準拠したデータ(セマンティックデータ)の公開が国際的に進み、主要な研究機関がデータ統合の核となるデータセットや、標準オントロジーを付与したデータセットが公開されている。これらのデータは機械可読であることから、探索、推論、機械学習等の人工知能技術による利用が期待されている。例えば、大規模実験データから抽出された結果への参照知識としての利用や、統合されたセマンティックデータを解析することによる新たな知見の発見といった応用が考えられる。しかし、セマンティックデータの作成、公開、利用を円滑に進めるには、生物学者の解析ニーズと情報科学者の技術シーズを融合した情報処理基盤の構築が課題となっている。本セッションは、生命科学におけるセマンティックデータの産出、公開、解析の実例を通して議論することで、これらの課題の解決やデータの高度利用に向けた今後の展望へとつなげる。

 
・生物表現型のRDFデータ作成とそのメリット
演者:桝屋啓志(理化学研究所)

生物が遺伝や環境の結果として示す表現型は、極めて多様なデータとなるためにデータベース化が困難とされていた。しかし近年では、オントロジーやセマンティックウェブの技術を用いることで、特に疾患との関係性を示すデータベースが作成されるようになってきた。我々は国内で作成されたマウス、ラット、メダカ、ゼブラフィッシュ等の実験動物の表現型データを統合するデータベースJ-Phenome(http://jphenome.info)を作成し、生物種横断的な表現型データの統合と、国際的な研究コミュニティに向けてデータの利用拡大を狙っている。J-Phenomeの開発にあたっては、Resource Description Framework (RDF)とセマンティックウェブ技術に基づくデータ公開基盤として、理研メタデータベース(http://metadb.riken.jp)を利用した。本発表では、表現型およびその関連情報のRDFデータ作成の実際と、そのメリットについて述べる。

 
・微生物統合データベースMicrobeDB.jp 2.0のデータ統合の実際
演者:森宙史(東京工業大学)

微生物は発酵や感染症など人間活動と密接に関わっているため研究の歴史も古く、蓄積されたデータや知識は膨大かつ多様である。さらにゲノムやメタゲノムなどの大規模オミックスデータも多数産出されているため、これらを横断的かつ簡便に利用出来れば、新たな仮説の創出がより容易になると期待できる。我々は、国内外に散在する細菌の各種オミックス情報を広く収集し、遺伝子、ゲノム、環境の3つの軸に沿って様々な知識を整理し、ゲノム情報を核としてセマンティックウェブ技術により統合した統合データベース「MicrobeDB.jp」をこれまで開発してきた。本発表では、ゲノムやメタゲノム等のデータを、適切なオントロジーを開発しつつ対応付けて大幅に追加すると共に、統合DBを用いた様々な解析結果を提示するアプリケーション群を開発すること等によって超高度化されたMicrobeDB.jp 2.0のデータ統合の詳細について発表する。

 
・セマンティックウェブを用いた生命科学データベース統合と利用技術開発
演者:山口敦子(ライフサイエンス統合データベースセンター)

ライフサイエンス統合データベースセンター(DBCLS)では、生命科学の多種多様かつ膨大なデータを統合的に扱うために、セマンティックウェブ技術に基づいたデータの記述や公開を推進してきた。さらに、これらのデータを効果的に利用するための基盤技術開発も並行して行ってきている。本発表では、DBCLSで行われている技術開発、中でもデータ利用の観点から行っているものに焦点を当てて紹介する。特に、ユーザに対象データを理解させ、セマンティックな検索をより容易とする技術である SPARQL Builder と YummyData について述べ、これらの技術開発における現状と課題、そして今後の展望について述べる。

 
・生体分子とその機能のオントロジー構築と利用
演者:小寺正明(東京工業大学)

生体を構成する分子とその機能には様々なものがあるが、それをどのような語彙で表現するかは、分子という概念が生まれた時代から存在する大問題である。語彙の統一がなされないと科学者同士はお互い何について話しているかも分からない。それ以前に、その概念を表す語彙が存在しない場合はその概念を文章で説明する必要が生じるし、従来の分類体系に従わない概念を含む場合はさらに取り扱いに注意を要する。生命情報学(バイオインフォマティクス)分野では遺伝子オントロジーを用いたエンリッチメント解析がよく行われるが、その解釈が難しいのはそのためである。本講演では、生体分子のうち低分子化合物とそれを代謝する酵素タンパク質を中心に、既存オントロジーの利用と新規オントロジーの構築について概論し、今後の発展について考察する。

 

質量分析インフォマティクス
日時:9/30(金)9:45-11:15
会場:プラザ平成 会議室1
オーガナイザー:有田正規(国立遺伝学研究所)

質量分析データの解析は敷居が高く、ゲノム解析などの配列情報に比して、興味を持つバイオインフォマティシャンが少ない。この企画の目的は、マススペクトルデータを扱える研究者の人口を増やすことにある。
具体的にはメタボロームとプロテオームデータに焦点をあて、データの取得法からマススペクトルの意味を解説する。またフォーマットとデータベースを説明し、大量データの取得先を理解してもらう。最後に一般的な解析と現在の問題点を、初心者向けに解説する。同時に国内研究者が取り組んでいる最新動向も紹介してもらうことで、質量分析インフォマティクスの現状と進むべき方向性を明らかにできる。

 
・実はタンパク質は測定していない ~プロテオミクスと質量分析法~
演者:吉沢明康(京都大学)

ゲノムやトランスクリプトームの研究者からはしばしば、「プロテオーム研究は感覚が違っていて判りにくい」との感想が聞かれる。例えば、一つの生物種のゲノムからタンパク質コード領域を収集したデータは、プロテオーム研究者の目からは『プロテオームのデータ』とは言えない。このようなプロテオーム独特の考え方・研究目標以外にも、「判りにくい」原因として
○研究の方法論としての質量分析法の原理に馴染みがないこと
○タンパク質はアミノ酸の1次元配列であり、化合物や糖鎖のような分岐がないことから、タンパク質の同定ではメタボロミクスや分析化学などとは異なった方法論が用いられていること
などが挙げられる。これらの事実を踏まえ、本講演ではタンパク質の同定方法を中心に、プロテオミクスでの質量分析法の利用の現状について概説する。

 
・質量分析による化合物同定のための情報処理
演者:櫻井望(かずさDNA研究所)

ゲノム配列情報を活用してmRNAやタンパク質を同定できるトランスクリプトームやプロテオームと比較すると、元素の結合からなる化学物質を検出しようとするメタボローム解析では、成分の同定がなかなか難しい。化学物質は、性状、水への溶解度、光吸収特性などの多様性が大きいだけでなく、いまだ構造が未知の物質も多数存在することが主な原因である。メタボロミクスでは、全ての物質に共通する「質量」を計測する質量分析装置が、主要な分析装置のひとつとして用いられている。質量分析装置からは、分子そのものの質量だけでなく、分子にエネルギーを加えることで弱い化学結合を切断した部分構造の質量情報なども得られる。これらのヒントをたよりに、検出された物質をいかに同定・推定するかが、メタボロミクス最大の課題の一つである。本講演では、この分野で繰り広げられている情報処理の熱い研究開発を紹介したい。

 
・経験的な開裂ルールを適用した化合物同定システムの開発
演者:秋元奈弓(かずさDNA研究所)

質量分析におけるメタボロミクスの課題の一つは、数百~数千の代謝物を迅速かつ正確に同定・推定することである。代謝物には異性体も多く、より正確な構造情報を得るためには多段階質量分析で特異的に起こる結合開裂により得られた断片化構造のm/z値から代謝物構造を推測していく必要がある。しかし、多様な代謝物の構造とその断片化構造の関連性を機械学習などによりルール化することは難しく、既存のソフトウェアでは十分な推定結果を提示できているとはいえない。我々は異性体が多いフラボノイドについて、多大な手作業により経験的な開裂ルールの構築を行った。すなわち、標品の実測データからすべての断片化構造の帰属を行い、その出現パターンと構造を注意深く関連性付けた。その結果、既存の代謝物推定ソフトウェアに比べて良好な結果を得た。こういった経験的なルールの構築というアプローチは、より良いルール化が可能な計算手法の開発に役立つだろう。

 
・エコロジーとヘルスケアにおける代謝物データベースの構築
演者:金谷重彦(奈良先端科学技術大学院大学)、代理発表:小野直亮(奈良先端科学技術大学院大学)

生物種と代謝物の関係を文献情報から網羅したKNApSAcKデータベースにより、生物サンプルの質量分析結果から精密分子量によって分子式を推定し、生体内の二次代謝物の候補を列挙できる。生物種数と地球上の顕花植物数の割合から、地球上に存在する代謝物種の数は106万と推定できた。地球上の顕花植物が生合成できる代謝物の約1割が構造決定されており、KNApSAcK Coreにはその半数が登録されたことになる。そして、新規バイオデータベースの開発ならびにバイオインフォマティクス研究、ファンクショナルゲノミクス、生物学相互作用のメタボロミクスなど、多岐にわたる分野で活用されている。本発表では,エコロジーならびにヘルスケアに焦点をあてた代謝物と生物活性の関係に関するデータベースについて紹介する。

 

バイオイメージインフォマティクス:
大規模生命画像データの情報解析に基づく生物学
日時:9/30(金)15:45-17:15
会場:プラザ平成 メディアホール
オーガナイザー:岩崎渉(東京大学)、福永津嵩(早稲田大学、日本学術振興会特別研究員)

バイオイメージング技術の発展により、多量の生物画像データが生み出されつつある。こうした多量の生物画像データを情報解析するための新たな学問領域として「バイオイメージインフォマティクス」が注目を集めており、Bioinformatics誌においても新しくカテゴリーが設けられるなど、既にバイオインフォマティクスの中でも主要な分野のひとつになりつつある。本セッションでは、細胞から個体まで、あるいは基礎生物学から医学まで、様々な対象や目的にわたって実際に生物画像データの解析を行っている方々にご講演いただき、バイオイメージインフォマティクスの現状と今後について議論したい。

 
・バイオインフォマティクスからバイオイメージインフォマティクスへ
演者:岩崎渉(東京大学)

 
・模様特徴量とグラフカットを利用した生体骨組織の骨髄腔の領域分割
演者:繁田浩功(大阪大学)

 
・全脳イメージングの自動解析に向けたバイオイメージインフォマティクスについて
演者:豊島有(東京大学)

近年、線虫など微小な生物について、全神経活動を1細胞レベルで同時に観察する顕微鏡技術が活発に開発されている。この活動データを神経ネットワークと対応付けるためには、撮影した画像中にある全ての細胞を漏らさず認識して名前をつけ、経時的に追跡する必要がある。線虫の頭部には180個以上の神経細胞が存在するが、細胞同士が3次元的に密集しており、一般的な画像解析手法では近接した細胞核をうまく分離できない。そこで我々は、蛍光画像の輝度分布の曲率に注目して、細胞核の高精度な自動認識技術を新たに開発した(Ref)。あわせて、全脳イメージングの自動解析に向けた様々な技術の開発を進めている。
Reference: Toyoshima et al, PLoS Computational Biology, (2016).

 
・Computational Ethology:バイオイメージインフォマティクスと動物行動学の融合
演者:福永津嵩(早稲田大学、日本学術振興会特別研究員)

動物行動学は、動物が示す行動を総合的に理解することをめざす学問分野である。その新たな周辺領域としていま、ビデオカメラを用いて動画データを大規模に取得し、情報科学的な手法を活用して行動の特徴や群れの社会構造などにせまる“Computational Ethology”が現われつつある。これまで我々は、メダカや線虫といったモデル生物を対象に、動画データから行動情報を抽出するトラッキングソフトウェアの開発(Fukunaga et al., 2015)や、変異体の行動データをバイアスなく解析する手法(Fukunaga et al., under review)について研究を行ってきた。本発表では、我々が取り組んできた研究成果も交えながら領域の現状を紹介するとともに、今後の展開を議論したい。

 
・BDML/SSBD: 生命動態情報と画像情報の統合データベースの開発
演者:遠里由佳子(理化学研究所)

顕微鏡画像データを画像処理した結果として、分子から個体に至る生命現象の時空間動態を数値として有する定量データが産出されている。産出されたデータは、表現型解析や数理モデル構築において有益な情報となり得る。しかし、データが独自の形式で記述されインターネット上に散在していることが、データや、データを解析するツールの再利用を困難にしていた。そこで我々は、定量データを統一的に記述するための言語BDML(Kyoda et al., 2015)と、BDML形式の定量データと元となる画像データ、関連するツールを格納・共有する統合データベースSSBD(http://ssbd.qbic.riken.jp; Tohsato et al., 2016)を開発した。さらに2015年4月より、定量化が求められる画像データの格納と共有も開始している。本発表はそれらBDML/SSBDの現状と今後の課題を紹介する。

 

数理・情報解析が牽引する新しいがん研究
日時:9/30(金)17:30-19:00
会場:プラザ平成 メディアホール
オーガナイザー:島村徹平(名古屋大学)、新井田厚司(東京大学)

次世代シークエンサーの発展により、がんに生じているゲノム変異を網羅的に検出することが可能となり、これまで実験生物学が中心であったがん研究分野においてここ数年で急速なパラダイムシフトが起こっている。例えば、TCGA等の大規模がんゲノムプロジェクトによって数万人単位での膨大なオミックスデータが産出され、それらを統合的に解析することで、がん細胞のシステム異常の多様性を俯瞰することが可能となった。更にそのようなシステム異常の多様性を生み出す進化原理を数理モデリングにより探求する試みもなされている。このように今後のがん研究では数理・情報解析が中心的役割を果たしていくと期待されているが、特に国内では数理・情報解析技術を備えたがん研究者が不足しているのが現状である。本セッションでは、国内で数理・情報解析を武器にがん研究分野を牽引している研究者が当該分野の魅力を紹介することで、当該分野の活性化及び数理・情報研究者のがん研究への新規参入のきっかけ提供を試みる。

 
・マルチオミックス情報に基づくがんのモジュレーター因子の網羅的探索
演者:島村徹平(名古屋大学)

次世代シークエンサーや質量分析器を始めとする最先端技術の発達により、生命医科学分野においても膨大かつヘテロなビッグデータが集積しており、それらの解析技術基盤が課題となっている。本講演では、ゲノム、エピゲノム、トランスクリプトームといった多階層オミックス情報に基づき、遺伝子発現制御に影響を及ぼすモジュレーター因子(ゲノム変異、コピー数異常、DNAメチル化など)を網羅的に探索する手法を提案する。また、実データを用いて、転写因子とターゲット遺伝子間の依存関係に影響を与えるモジュレーター因子を探索した研究について紹介する。

 
・大規模がんゲノム変異データマイニングのための統計学的手法
演者:白石友一(東京大学)

がんの変異には、がんの種類に応じて明らかな傾向があることが知られていた。例として、喫煙歴のある肺がんについては、C>Aの変異が多く観察されること、また皮膚がんにおいてはC>T、CC>TTの変異が多く観察されることが知られていた。近年のシークエンス技術の発展により、新規がん原因遺伝子の同定だけではなく、個々のがんゲノムにおける変異プロファイルの違いをこれまでにない精度で検出することが可能になった。今後新たな変異パターンの発見、またそれに付随する発がん物質を同定することにより、新規発がん物質の発見や評価につながり、がんの予防に繋がることが多いに期待されている。本発表では、変異の特徴的プロファイルを抽出する新しい統計的手法 (Shiraishi et al., PLoS Genetics, 2015)を紹介する。提案手法は、変異の因子数を増やしても、首尾よく推定が可能であることなどの利点がある。さらに、機械学習分野で文書分類に利用されるトピックモデルと類似性についても議論する。

 
・ロングリード技術を駆使したregulatory SNVsの転写領域へのフェージング
演者:鈴木絢子(国立がん研究センター)

近年、ロングリードシークエンスや分子バーコーディングをもとにした合成ロングリードを用いたゲノムフェージング解析が行われている。本研究は、 これらロングリード技術とマルチオミクスシークエンスデータを用いて、転写制御領域における変異アリル特異的なエピゲノム状態と、アリル特異的遺 伝子発現の関係性をシングルアリルレベルで評価することで、がん細胞の転写制御に影響すると考えられるregulatory SNVsを探索することを目指している。先行研究でゲノム、エピゲノム、トランスクリプトームのショートリードシークエンスデータがすでに取得済みである26種類の肺腺癌細胞株をモデルとして、合成ロングリードデータを中心に実際の解析状況について紹介する。

 
・がんの進化シミュレーションによる腫瘍内不均一性生成原理の探索
演者:新井田厚司(東京大学)

ひとつの腫瘍のなかにはゲノムの異なる複数のクローンの存在することが知られており、この現象は腫瘍内不均一性とよばれている。腫瘍内不均一性はさまざまなタイプのがんにおいて観察されており、がんの治療抵抗性の一因になっていると考えられる。演者は九大別府病院との共同研究で一人の患者からの大腸がんの複数の部位から得たDNAをシークエンスすることにより大腸がんに広汎な腫瘍内不均一性が存在するのを見出した。さらに演者は、がんの進化シミュレーションを用いてこの実験結果を再現する条件を探索することで、腫瘍内不均一性を生み出す原理の解明を試みた。本講演ではそれらの結果について紹介する。

 
・膵がん進行の数理モデル解析
演者:波江野洋(九州大学)

次世代シークエンサーの登場による急激なコスト減少によってがんゲノム解読研究は近年大きな発展を遂げ、多くのがんで特徴的な突然変異が知られるようになってきた。正常な細胞から突然変異によって生まれたがん細胞は、組織の中で増殖し腫瘍を形成する。このようながん進展の動態に関して、数理モデルを用いた研究が近年活発に行われている。本講演では、 増殖しているがん細胞集団内に2つの突然変異を持った細胞が存在する確率に関する理論研究を紹介し、その応用として、膵癌の進展に関する臨床データと比較した数理モデル研究を紹介する。

 

バイオインフォマティクスにブレイクスルーをもたらしうる大規模測定技術
日時:9/30(金)17:30-19:00
会場:産総研別館 会議室A,B
オーガナイザー:尾崎遼(理化学研究所)

バイオテクノロジーとバイオインフォマティクスは生命科学を駆動する両輪である。特に、革新的な測定技術の登場は量・質的に異なるタイプの生命科学データを産み出し、その度に新たな課題を突きつけ、バイオインフォマティクスの発展を促してきた。そのため、現在および将来登場しうる測定技術について理解することで、今後求められるバイオインフォマティクスの展開を予測できると考えられる。本セッションでは、特に分子生物学、細胞生物学分野において大規模測定技術開発の最前線で活躍する方々にご講演いただき、将来の大規模測定技術と今後必要となるアルゴリズム開発や可能となるデータ解析の方向性について議論する。

 
・オミクス計測限界の破壊-超マルチプレクス化、AI、ロボティクス­-
演者:谷内江望(東京大学)

超並列DNAシークエンシングとDNAタグという概念は様々な生命科学実験のマルチプレクス化を可能にし、様々な高速スクリーニングを実現した。一方で例えば、約20,000あるヒト遺伝子について、網羅的にそれらの2つの組み合わせ(200,000,000ペア)の細胞内動態やフェノタイプに与える影響を計測することは「組合せ爆発」により困難であった。今回の発表の前半では、複数の因子が関わる細胞のフェノタイピングを高速に測定するために私達が開発した「バーコードフュージョン法」を紹介する。これを酵母ツーハイブリッド法のシステムに持ち込むことによって、これまでに約2,500,000ペアのヒトタンパク質間の相互作用を1人の研究者が2週間程度で測定できるようになった。後半では、AIによる計測空間の効果的な予測、ロボティクスによる計測自動化と仮説モデルの進化を組合せて現代生命科学が到達できなかったレベルで有効大量データを取得するアプローチについて話す。

 
・高出力1細胞トランスクリプトーム解析の現状と展開
演者:團野宏樹(理化学研究所)

近年, 1細胞ごとに全遺伝子レベルでRNA発現量を測定する1細胞トランスクリプトーム技術の開発が盛んである。我々は2013年に検出感度の最も高い方法としてQuartz-Seq法を開発した。開発初期では数十サンプルを対象にしていた1細胞トランスクリプトーム技術は, 液滴形成技術やロボット技術と組み合わさることで高出力化し, 現在では数千から数万サンプルについての定量が数日以内にできるようになってきた。本発表では液滴形成技術を用いたDrop-seq法や半自動化高出力RNA-seq法と, それらが出力するデータのもつ性質について説明する。また, これらデータをどのような戦略で解析することで生物学的理解へ繋げることが可能かを, 動物の胚発生過程の細胞集団の解析を例として紹介し, 発生の単位たる原基が生まれる機序にアプローチする。最後に, 将来の1細胞オミックスの技術の発展を議論する。

 
・高速高分解能広視野顕微鏡法の開発と応用
演者:岡田康志(理化学研究所、東京大学)

超解像顕微鏡技術の登場により、光学顕微鏡の分解能は使用する光の波長の制約を超え、電子顕微鏡に匹敵する分解能に到達しつつある。しかし、細胞の極一部を詳細に観察できるだけでは片手落ちである。また、固定標本しか観察できないのでは、電子顕微鏡で十分である。細胞全体あるいは更に隣接する細胞まで一つの視野に収めつつ、生きた細胞の動態を高い分解能で観察することが、次世代光学顕微鏡技術として求められている。私たちは、1ピクセル50nm、2048×2048ピクセルで100㎛四方を一視野に収め、空間分解能100nmの超解像蛍光画像を100フレーム毎秒で撮影できる高速超解像蛍光顕微鏡を開発した。このとき、データストリームは蛍光色素1色あたり800MB/sとなり、現在の2色同時撮影システムでは1.6GB/sである。こうして得られる大量の高分解能画像データを利用した定量解析やマルチオミックス解析の可能性について議論したい。

 

遺伝統計学が切り拓く新たなゲノム・エピゲノムデータ解析の地平線
日時:10/1(土)10:00-11:30
会場:プラザ平成 メディアホール
オーガナイザー:鎌谷洋一郎(理化学研究所)、岡田随象(大阪大学)

遺伝統計学(Statistical Genetics)とは、遺伝情報と形質情報の関わりを統計学の観点から研究する学問分野である。次世代シークエンサーに代表されるゲノム配列解読技術の著しい発達により、膨大なゲノム・エピゲノムデータが得られる時代が到来している。一方で、一次的に処理されたゲノム情報を適切に解釈し、社会還元するためのデータ解析学問へのニーズが高まっており、遺伝統計学の重要性が認識されている。例えば、大規模ヒト疾患ゲノム解析により同定された数多くの疾患感受性遺伝子の情報を、遺伝統計解析を通じて多彩な生物学・医学データベースと分野横断的に統合することにより、新たな疾患病態の解明や、疾患バイオマーカーの同定、ドラッグ・リポジショニングを通じた新規ゲノム創薬、疾患疫学の謎の解明、個別化医療の推進などに貢献できることが明らかになりつつある。本セミナーでは、遺伝統計学における最新ゲノム・エピゲノム解析手法や成果の紹介と共に、重要性に比較して専門家が不足している(と考えられている)遺伝統計学分野における人材育成についても議論したい。
キーワード:遺伝統計学、大規模ヒト疾患ゲノム解析、ゲノム創薬、疾患疫学、個別化医療
連携する学会:新学術領域研究「システム癌新次元」

 
・ゲノムワイド関連解析のいま
演者:鎌谷洋一郎(理化学研究所)

ヒトゲノムの連鎖不平衡構造を元に選択された30万~100万程度の一塩基多型(SNP)をマーカーとして用いるゲノムワイド関連解析(GWAS)は、多因子疾患の生殖細胞系列遺伝子変異の関連を多数発見した。サンプルサイズを増やせば増やすほど効果サイズは小さいが有意で再現性の高いSNPが発見され続けている。最近報告が増えてきている10万人レベルを超えるGWASの中で、我々が携わっているものを発表する。また、遺伝子制御領域を解析する手法を紹介する。
一方、次世代シークエンサーを用いた全ゲノム解析を行うことも可能になってきた。多因子疾患の生殖細胞系列変異について、SNPアレイではなく次世代シークエンサーを用いることで新たにわかることは、レアバリアントの寄与と、機能的原因変異に関するより強い考察であろうと思われる。数千人レベルの全ゲノムシークエンス関連解析の展望についても報告する。

 
・大規模ゲノムコホートの遺伝統計学
演者:田宮元(東北大学)

ヒトの定常小集団としての長い進化の歴史は、ヒト疾患の遺伝的構成について、SNPによるGWASの根拠となるCDCV(common disease/common variant)仮説をサポートするが、過去数百年の爆発的な人口増加からは、レアな突然変異の寄与を重視するCDRV(common disease/rare variant)仮説が妥当とされている。更に、遺伝子と遺伝子や遺伝子と環境の相互作用も疾患負荷に寄与すると期待され、これらを含めた多くの仮説を検証できるように大規模ゲノムコホート研究がデザインされているが、いくつかの問題点が明らかである。比較的少数の標本に対して多数のデータが取得されすぎる小標本高次元問題や、多くの異質な表現型が取得されすぎる問題である。これらの問題を柔軟に解決しながら、大規模ゲノムコホートから新しい知見を取得するカギは遺伝統計学にある。特に、古典的な遺伝学に立脚した上で、これらの難問に対して、統計的機械学習・深層学習のような最新の人工知能技術を適用することで、新たな展開が期待される。

 
・遺伝統計解析による疾患病態解明と創薬
演者:岡田随象(大阪大学)

「いかに、早く、安く、正確にゲノム配列を解読するか」がこれまでのゲノム科学の目標であった。しかしNGS技術でその目標が達成されつつある今、研究のボトルネックは「どうやって、早く、安く、確実に解読したゲノム配列の意味を解釈するか」へとシフトしつつある。遺伝統計学は、一次的に処理されたゲノム情報を適切に解釈し、社会還元するためのデータ解析学問として注目されている。我々は、大規模ヒト疾患ゲノム解析により同定された数多くの疾患感受性遺伝子の情報を、多彩な生物学・医学データベースと分野横断的に統合することにより、新たな疾患病態の解明や、疾患バイオマーカーの同定(HLA imputation法によるHLA遺伝子バイオマーカーやMIGWASによるマイクロRNAスクリーニング)、ドラッグ・リポジショニングを通じた新規ゲノム創薬、疾患疫学の謎の解明(統合失調症を関節リウマチの低合併率)、等に取り組んできた。本講演ではその成果と共に、人材育成への取り組みを報告したい。

 
・全ゲノムシークエンスによる肝癌の変異の包括的解析
演者:藤本明洋(京都大学)

近年のDNAシークエンス技術の著しい発展により、全ゲノムや全エクソンを対象とした変異探索が可能となり、肝癌においても発がんメカニズム解明と治療標的の発見を目指した網羅的変異解析が行われている。我々は、国立がん研究センターや東京大学と共に国際がんゲノムコンソーシアムに参加し、300例の肝癌の全ゲノムシークエンスを行い、点突然変異、挿入・欠失、コピー数変異、構造異常、ウイルスゲノムの挿入を検出した。その結果、多数のドライバー遺伝子候補に加えて、変異が集積している非コードRNAやプロモーターが検出された。また、構造異常の数がDNA複製タイミングと相関することを見出すとともに、構造異常が集積している遺伝子を検出した。本講演では、我々の解析で明らかになった肝癌の変異の全体像について発表する。

 

Museomicsが開く新時代
日時:10/1(土)10:00-11:30
会場:プラザ平成 会議室1
オーガナイザー:細矢剛(国立科学博物館)

Museomicsをはじめよう。Museomicsとは、博物館等に収められている標本のメタデータと、標本由来のオミックスデータの融合を目指す新分野である。地理的分布や表現型など生態学・分類学的情報は、標本そのものや観察記録として博物館等に蓄積されており、データベース化する動きが世界的に進められている。こうした分野はBiodiversity Informatics(生物多様性情報学)と呼ばれているが、分子データとの紐付はバーコード配列などのごく一部に限られている。”二つのバイオインフォ”の融合が進めば「ある希少種について、生体試料や標本を用いて時代・地域・表現型毎にリシーケンスし、近親度を調査して保護活動に役立てたり環境変動に対する生態系の予測をしよう」といったことが可能になる。そこで本セッションでは、Museomicsの実現により描ける未来と解決すべき技術的・制度的問題点を、生物多様性情報学や博物館学の専門家と共に議論したい。

 
・イントロダクション
演者:細矢剛(国立科学博物館)

本シンポジウムの演者は、博物館資料とインフォマティクスが融合した新しい分野である“Museomics”に興味を持ち、情報・意見交換を行ってきた。Museomicsがどのようなことを扱うのか、どのような可能性を持っているのかなどについて紹介する。

 
・生物多様性情報と生物多様性情報学
演者:神保宇嗣(国立科学博物館)

種レベルの生物多様性情報を扱う分野である生物多様性情報学について、その概要、GBIFをはじめとする各種プロジェクト、研究や保全への利用例を紹介する。また生物分類学、バイオインフォ、エコインフォ等、周辺分野との位置づけについても簡単に述べる。

 
・Bioinformaticsから眺めたmuseomics ~その類似性と相違性
演者:仲里猛留(ライフサイエンス統合データベースセンター)

膨大な表現型データ(と分類学的な知見)や地理情報がバイオインフォのデータや手法と結びついた時、新たなフロンティアが拓けるのではないか。その醍醐味の一端を紹介する。

 
・Museomicsの実践例(1)
演者:鈴木誉保(農研機構)

標本の画像情報、生物系統の情報を利用した研究の最前線を紹介する。例えば、ベイズ統計モデリングなどと組み合わせることで、複雑なかたちが生じる進化プロセスを明らかにすることができる。また、生物地理的な情報やゲノム配列情報と融合することで、さらにどのような展開があるのかも紹介する。多種多様な情報を相互に紐付けることにより、動的で多層的な進化ダイナミクスがあぶりだされる新たな研究領域の可能性を提案したい。

 
・Museomicsの実践例(2)
演者:武藤愛(奈良先端科学技術大学院大学)

図鑑に収録された蝶の寄主植物情報のデータベース化による、生物間相互作用研究への新たなアプローチを紹介する。また、博物館資料からの分子情報抽出を推し進める海外の取り組みについて紹介するとともに、博物館とバイオインフォマティクスの連携がもたらす展望について述べる。

 
・意見交換
演者全員によるパネルディスカッションと会場との意見交換