第8回システムバイオロジー研究会のお知らせ理化学研究所横浜研究所交流棟ホール
|
|||||||||||
|
|
|||||||||||
|
生物系システムにおける遺伝子機能解析
ポストゲノム時代においては、今までに経験したことのないような大量のデータ情報から、如何に個々の遺伝子の機能を特定していくかが大きな問題となっています。その問題解決のため、システムバイオロジーの分野では、大きく2つに分けてmodel-drivenなアプローチとdata-drivenなアプローチがあります。今回の研究会では、マイクロアレイなどを用いた網羅的解析データからどのようにしてシステムモデルを構築し、そこから遺伝子の機能を推定していくか、また、そのための必要なデータ収集、数理解析手法などを中心に討論したいと思います。さらに、遺伝子発現後の実機能、すなわちタンパク質の修飾・相互作用についても同様に討論できればと思います。このような目的や問題を一緒に考えていただけるような演題を広く募ります。
世話人 |
|||||||||||
|
|
|||||||||||
|
一般講演募集
一般講演の申し込みの受付を行います。8月15日までに、400-800字程度の講演要旨を畠山(marikoh@gsc.riken.jp)へお送りください。人数に限りがありますので、多数の応募がありました場合は研究会の方で、選択させていただくことになります。 |
|||||||||||
|
|
|||||||||||
スケジュールの予定1.話題提供 招待講演 13:00-13:45 「Number to the models」 生体分子ネットワークのモデル化には、構成要素の同定、相互作用の解明、そしてその動態の理解が欠かせない。我々は出芽酵母を材料にGCN経路による代謝ストレス応答のモデル化を目指している。この経路は昔より活発に研究されてきたために、その定性的な理解はかなり進んでいる。しかし、挙動の定量的予測を目指してモデリングするには基礎データが欠落している。したがって文献に頼らず自前で、キイとなる代謝物の変動、蛋白質のリン酸化、そして相互作用を計測していかねばならない。と同時に、その生理学的意義の全体像を理解する為には、この応答に伴うトランスクリプトームやプロテオームの変動の全貌を捉える必要もある。こうした考えに基づき、我々は、代謝物、遺伝子発現、蛋白質の翻訳後修飾と相互作用を対象に、それぞれ実時間性、絶対定量性、網羅性を特徴とする計測技術の開発を進めている。これらの技術を紹介しながら、モデル化における定量的データの重要性を考察してみたい。 13:45-14:30 「階層クラスタリングやネットワーク推定におけるマルチスケール・ブートストラップ解析」 データから推定した樹形図やネットワークがどれほど信用できるのか?という問題に定量的に答えるのがブートストラップ解析である.データのランダムネスが分析結果に与える影響を評価するために,データからリサンプリングによって多数の複製データを生成してバラツキを調べる.樹形図のクラスタやネットワークの枝が複製データに何回出現したか頻度を数えて信頼度(ブートストラップ確率)を計算するだけなので,実装が容易で広範な応用が可能である.しかし従来法にはバイアスがありfalse positiveによって誤りの「発見」が得られやすい.そこで提案されたマルチスケール・ブートストラップ法では,「くりこみ理論」と類似のアイデアによって,問題をスケール変換したときの信頼度の変化率から高精度の信頼度(3次の精度の近似的に不偏な確率値)を計算する.この方法はDNA配列から系統樹を推定する分野ですでに普及しつつあり,他の問題へも容易に実装できる.マイクロアレイデータによる腫瘍タイプ分類や遺伝子ネットワーク推定の数値例を紹介する. 2.一般講演 「システムバイオロジーの毒性予測への応用」 システムバイオロジーを毒性影響のメカニズム解明やその影響を体系的に評価してゆく研究に応用するシステムトキシコロジーやコンピュータートキシコロジーなどの研究が盛んになってきた。特に遺伝子ネットワークの適応は、毒性影響のメカニズムの解明に重要になると考えられ、毒性の分野だけでなく、創薬の分野においてもその適用が広く求められている。この分野における目標の一つは、毒性影響による化学物質の分類である。ネットワーク構造の定量的な比較が出来れば、化学物質の分類が可能となり、さらに毒性影響のメカニズムの解明も可能になるであろう。本件では、比較的少ないアレイ数でも既知の情報を使うことで解析可能なベイズ推定法を採用した。MCMC(マルコフチェイン モンテ−カルロ)方や、ギブスサンプリングを適用してネットワークのパスの確率を定量的に求め、確率マトリックスで表す方法を試みた。実際のデータを使った解析例も紹介しながら、ネットワークの構造を確率的に定量化することによる毒性分野へのシステムバイオロジーの適応について考察したい。 「時系列遺伝子発現データからのネットワーク予測」 マイクロアレイで測定された時系列遺伝子発現データを用いて遺伝子ネットワークを同定することにより、遺伝子欠損・阻害による影響や未知の遺伝子機能を推定しようとする研究が医療分野等で期待されている。そこで、工業プラントのモデリング技術であるWinmuSeTMの遺伝子ネットワーク予測問題への応用を試みた。これまでに、ニューラルネットワークを用いて仮想の遺伝子発現データを学習し、遺伝子発現をモデリングすることで遺伝子ネットワークを予測した例があるが、ニューラルネットワークをWinmuSeTMに変更することで更なるパフォーマンス向上を確認することができた。一方で、:10実際に測定された遺伝子発現データを効率的に学習するためには有意に発現する遺伝子の選択・分類等、解決しなければならない課題も多い。今回は(1)ニューラルネットワークやWinmuSeTM等のモデリング技術による遺伝子ネットワーク推定手法、(2)WinmuSeTMによる実施例、(3)遺伝子の選択・分類に関する一考察を紹介する。
「タンパク質間相互作用を用いた協調的転写因子の推定」 広く真核生物において 総遺伝子数に対して転写因子となる遺伝子は少数にすぎない。さらに極めて多数のスプライスヴァリアントが存在することを考慮すればシステマティックな遺伝子の発現制御において複数の転写因子による組み合わせ転写制御が広く行われていることが期待される。複数の転写因子による協調的転写制御は 真核生物にみられる複雑な転写制御機構において重要な役割を果たす。先行研究ではこの協調的転写制御解明のため 遺伝子発現データを主に利用し発現プロファイルの類似性を遺伝子制御の協調性を判断する基準としてきた。本研究ではタンパク質間相互作用を利用して 転写因子の協調的結合を推定する。本研究は 類似したバイオプロセスに関与する遺伝子は同一の転写制御を受けるという仮定に基づく。この仮定に基づき 遺伝子が関与するバイオプロセスの類似性をタンパク質間相互作用ネットワークにおけるタンパク質間の距離として表現する。そして この距離で表現される類似性とクロマチン免疫沈降法(ChIP)データを統合し 協調的転写因子を推定する。出芽酵母(S. cerevisiae)のデータを用いた計算機実験により 提案手法は従来手法では発見できなかった文献で確認されている8つの協調的転写因子ペアの発見に成功した。さらに新たに12個の協調的転写因子ペアを推定し その生物学的妥当性を検証した。本手法で用いるタンパク質間相互作用データには擬陽性が高いという問題点が広く知られている。この点を克服し推定の性能を向上させるため いくつかの生物学的データを統合させた手法も提案する。 「3次元構造モデル評価を付加したヒトゲノムタンパク質立体構造データベース」 本研究では、全自動タンパク質立体構造のホモロジーモデリングのソフト「FAMS」を用いてインターネットを通じて取得できるヒト遺伝子(含cDNA)約7万の遺伝子について、立体構造モデル座標の算出を試み、RDB化した。国際コンテスト「CASP6」にも出場した全自動のプログラムを用い、ほぼ全遺伝子について立体構造モデル作成を試み、「ヒト遺伝子FAMSBASE」として構築した。「CASP6」では、実験で算出された構造に比べて、アミノ酸中Cα原子の距離的な一致の度合いを示すGDT_TSと呼ばれる指標が高いことが重要視される。本データベースの作成は国際コンテスト「CASP6」に出場した「famd」チームと同じ手法を用いており、GDT_TSと呼ばれる指標が高い値を示すよう統計処理された関数を用いた。「famd」が同コンテストの中での位置づけは、主鎖および側鎖の二面角等の面からも評価を行い、国際競争力のある手法であることを示してきている。このことからモデルデータベース構築の可能なハイスループットな方法論であると同時に特に側鎖χ1の確度レベルが高いモデルを構築できることが特徴であると言える。結果遺伝子7万はその98%相当の遺伝子がモデル構築され、真核生物に特徴的な複数領域に渡って構築されていることから、モデル数の合計は56万個となった。従来のモデルデータベースと大きく異なる点は全てのモデルについて立体構造の指標である GDT_TSが推定され(相関係数0.95)、実際に利用するときに、モデルの正確度がおおよそ推定できることである。3次元構造モデル評価を付加したことにより、現在ヒト遺伝子としては量的ばかりでなく質的にも充実した立体構造モデルデータベースが構築されたと考えられる。 16:25-16:50 「超高速分子動力学専用計算機のタンパク質機能解析への応用」 タンパク質の構造と機能の関連性を明らかにすることは、ポストゲノム研究として重要なテーマである。タンパク質は、水溶液中では揺らいでおり、その構造は動的である。それらタンパク質の動態を解析する方法として、計算機シミュレーション、特に分子動力学シミュレーションは、非常に高い空間・時間分解能を持つため有効である。しかしながら、分子動力学シミュレーションは膨大な計算量を要するため、系の大きさ、計算時間等に制限がある。我々は、それら問題を分子動力学シミュレーションに特化した超高速分子動力学専用計算機を開発することで克服した。専用計算機により、大規模系、もしくは長時間の生体高分子シミュレーションを非常に高速かつ精密に行うことができ、これからのタンパク質の機能研究に大いに貢献すると期待される。本研究会では、専用計算機の概要と、そのタンパク質機能解析への応用例について紹介する。 3.ディスカッション |
|||||||||||
|
|
|||||||||||
|
参加の方法:事前登録の必要はありません。 |
|||||||||||
|
|
|||||||||||
|
問い合わせ |
|||||||||||