平成16年度 夏の学校 講義内容

日時 7月21日(水)  14:10〜15:50
講師 伊藤 隆司 (東京大学)
演題 定量オーミックスと知識発見
要旨 我々の目的は、出芽酵母をモデルに細胞の挙動を分子レベルで定量的に予測できるところまで理解を深めることである。その為には、構成要素の網羅的同定、相互関係の解明、そして定量的計測と系の撹乱が必要であると考えていろんなことをやっている。トランスクリプトームに関しては、絶対定量、転写因子の恒常活性化による撹乱、そして転写開始点の網羅的決定に取り組んでいる。プロテオームに関しては、相互作用の網羅的解析、翻訳後修飾(ユビキチン化)の網羅的解析を行い、更にそれらの定量化を目指している。こうした我々のアクティビティを紹介しながら、随所で必要とされるバイオインフォマティクス、特に網羅的データからの知識発見支援、に対する現場からの勝手な要望を述べてみたい。

日時 7月21日(水)  16:00〜16:40
講師 五斗 進 (京都大学)
演題 糖鎖構造データベースの構築と解析
要旨 ゲノム配列データや発現データを始めとするハイスループットに得られるデータが蓄積してきたことにより、大規模なデータベースの構築が進んでいる。一方で、それ以外のデータは文献や教科書の情報を地道に収集してデータベース化することが重要となる。バイオインフォマティクスでは、両者のデータをうまく統合して知識発見などに結びつける必要がある。ここでは、まずバイオインフォマティクスの分野で応用されるデータベースの構築について簡単に紹介する。さらに、後者のデータベースの例として、我々の最近の試みである糖鎖構造データベースの構築について述べ、それをハイスループットデータと組み合わせて解析するための応用について紹介する。

日時 7月21日(水)  16:40〜17:40
講師 馬見塚 拓 (京都大学)
演題 バイオインフォマティクスへの機械学習応用
要旨 実験技術の進歩による分子生物情報DBの充実とともに、蓄積されたデータからの知識発見への期待が増大するのは衆目の一致する所であろう。一方、知識発見に関係する機械学習(やデータマイニング)分野では、バイオインフォマティクスはウェブやテキストと並んで非常に魅力的な応用対象である。本講演では、バイオインフォマティクスへの機械学習手法応用の現在の概要を説明した後、演者の最近の研究を1つ紹介する。紹介する演者の研究は、糖鎖のための新しい確率モデルおよびそのパラメータ学習手法である。まだバイオインフォマティクスの未踏の領域と言える糖鎖科学に対して、このモデルの優位性と限界を説明する。

日時 7月22日(木)  09:30〜11:30
講師 辻本 豪三 (京都大学)
演題 トランスクリプトーム解析に基づくゲノム創薬
要旨 ヒトゲノム塩基配列が明らかにされ、まさに遺伝暗号の意味の解読(機能解析)が系統的になされる基盤が出来ようとしており、世界の研究者の関心ば構造から塩基配列の機能をゲノムスケールで解釈するゲノム機能科学(functional genomics)ヘと移行を示している。ゲノム科学がもたらした大きな科学方法論の変化は、『体系的、綱羅的』ということであり、ゲノム機能解析も体系的、網羅的(”ゲノムスケール”)なアブローチが求められる。論理的発展としては、ゲノム→トランスクリプトーム→プロテオーム、という道筋は明らかであり、各相の探索解析法の開発が行われてきているが、遺伝子機能を体系的に”ゲノムスケール”で解析する標準的アプローチとしてマイクロアレイ解析がある。ここではマイクロアレイ、DNAチップ情報のゲノム創薬応用につき、疾患動物モデルの解析、薬物作用メカニズム解析につき概説する。

日時 7月22日(木)  13:30〜14:10
講師 浦本 直彦 (日本IBM)
演題 ライフサイエンス分野における知識発見と統合
要旨 創薬やタンパク質の構造・機能予測に代表される、ライフサイエンス分野における研究開発においては、様々な形式のデータが、その各過程で大量に生成される。これらのデータを如何に統合し、知識として活用するかが、研究プロセスを最適化するための鍵を握っている。本講義では、テキストマイニングによる文献情報からの知識発見とマイクロアレイデータへの適用技術を中心に、データマイニング、情報統合に関するいくつかのプロジェクトを紹介する。

日時 7月22日(木)  14:20〜16:20
講師 田中 穂積 (東京工業大学)
演題 自然言語処理入門
要旨 自然言語処理のアルゴリズムを中心に入門的な講義を行うとともに、現状の問題点と、応用の観点から自然言語処理技術の将来を展望する。

日時 7月22日(木)  16:30〜17:10
講師 建石 由佳 (CREST/JST・東京大学)
演題 MEDLINEからの情報抽出と自然言語処理 −GENIA プロジェクト−
要旨 ポストゲノムシークエンス時代を迎えた今日、実験室では解析機器の進歩も伴って日々大量の実験データが量産されている。そのデータを解析・評価していくためには、関連する多数の文献に記述されている情報を統合していく必要があるが、その量は膨大であり、これを自動化あるいは補助する技術が熱望されている。GENIAプロジェクトでは、生命科学分野の論文から、タンパク質・遺伝子の相互作用などの高次情報を抽出することを目的とした自然言語処理システムの研究開発を進めている。これまでに、MEDLINE データベース上の論文アブストラクトから統計学習的手法を用いて反応に関わる物質名を自動的に抽出するシステムを開発し、構文解析を用いてこれらの物質名の相互関係を抽出するシステムの開発に着手している。また、情報抽出プログラムの評価データ及び統計学習プログラムの学習データとするため、MEDLINE上の論文アブストラクトに対して人手で専門用語とその意味クラス、品詞・構文などの言語情報をタグ付けした文書(GENIAコーパス)、タグ付けのために意味クラスを体系化したオントロジー(GENIAオントロジー)を作成し公開している。本講演ではGENIAプロジェクトの概観を述べる。

日時 7月22日(木)  17:10〜17:50
講師 有田 正規 (東京大学)
演題 バイオインフォマティクスの泉 −恐るべきムダ知識−
要旨 たかがバイオインフォマティクス、されどバイオインフォマティクス。小さな業界の中に存在する「全く知らなくても困らないけれど、知っておくと役に立つかもしれない」ドラマを、「その時歴史が動いた」編から「白い巨塔」編まで紹介する。

日時 7月23日(金)  09:30〜10:30
講師 高井 貴子 (東京大学)
演題 生物学における"解釈"を探究する
要旨 細胞のどのような現象も連鎖した化学反応に他ならない。ところが生物学では代謝、シグナル伝達、転写翻訳と区別している。この区別は化学反応をその連鎖がもたらす結果と結び付けて解釈することから生じる。講義ではこの "解釈"を探究し計算機に教える手段であるオントロジーについて紹介する。

日時 7月23日(金)  10:40〜12:20
講師 久原 哲 (九州大学)
演題 遺伝子発現データを基盤とする遺伝子発現ネットワーク構築
要旨 ゲノムシーケンスプロジェクトの進展、及び、DNAチップ・マイクロアレイ技術の確立は、細胞内の全遺伝子を対象としたトランスクリプトーム解析を可能にし、さらに、従来からの単一の遺伝子やタンパク質の解析を積み上げて全体のシステムを構築するボトムアップ法とは異なるトップダウン方式のシステム論的なアプローチを可能にしている。現在、特にシステム科学、数理科学的アプローチを取り入れたバイオインフォマティクス領域が創生され、発現プロファイルデータからの遺伝子の発現制御ネットワーク構築を目指した新しい生物学分野が開拓されつつある。この講義ではトランスクリプトーム実験から解析までを概説し、今後のポストゲノム解析への手がかりを探す。