第5回生命医薬情報学連合大会(IIBMP2016)

招待講演

招待講演

 

岡野原 大輔(株式会社 Preferred Infrastructure / Preferred Networks)
日時:9/29(木)10:30-11:30
会場:プラザ平成 国際会議場

keynote_okanohara

深層生成モデルによる表現学習 〜半教師あり学習、弱教師あり学習、教師なし学習〜

深層学習は画像認識、音声認識、自然文の理解など様々な分野で大きな成功をおさめ、現在も進化し続けている。本講演では深層学習の中でも生成モデルを使った表現学習、およびそれを利用した半教師あり学習、弱教師あり学習、教師なし学習を中心に紹介をする。学習で最も重要な問題は、データをどのように表現するかという問題であり、学習が成功するかどうかはデータをうまく表現できるかにかかっている。例えば遺伝子発現スコアや、塩基配列といった情報は見かけ上は高次元で複雑なデータであるが、それを低次元で単純な表現に変換することができれば少量のラベルありデータと組み合わせた教師あり学習や、事前知識と組み合わせた分析が可能となる。従来、こうしたデータ表現の獲得は人が特徴設計をするか、主成分分析に代表されるような単純な変換を利用するだけであった。深層学習を使った表現学習では、データのみからデータの最適な表現を獲得することができ、元の表現の非線形でかつ階層的な変換後の表現を獲得できる。特に、生成モデルを利用した表現学習はデータの生成過程の学習を通じてデータの最適な表現を獲得するため、事前知識を組み込みやすく、モデルを拡張しやすく、モデルの正しさも評価しやすい。これらの学習は逆誤差伝播法に帰着されデータ数、次元数に対しスケーラブルであり数千万サンプル、数百万次元といったデータに対しても適用可能である。ベイズ法と融合した変分自己符号化器、最尤推定を回避し二つのモデルを協調して学習する敵対的生成モデル、構造を持ったデータを逐次的に生成する深層自己回帰モデルなどを例に、その理論および応用事例を紹介する。

 

金井 昭夫(慶應義塾大学 先端生命科学研究所 / 同・環境情報学部)
日時:9/30(金)11:30-12:30
会場:プラザ平成 国際会議場

keynote_kanai

実験生物学者は生命情報科学者に何を求めるだろうか?

私たちのグループはこれまでに生命情報科学と実験科学を融合する形で幾つかの仕事をしてきました。その結果、マウスのトランスクリプトームに膨大な数の長鎖non-coding RNAがあることや(理化学研究所との共同研究)、アーキア(古細菌)のゲノムなどには高度に分断化されたtRNA遺伝子があることを見出すことができました。また、最近では主に線虫類が有している変則型のtRNAに着目し、このtRNAはアンチコドンがグリシンやイソロイシンに対応するにも関わらず、ロイシンを付加することから、普遍暗号表の例外として議論することができました。今回の講演では、これら個々の発見を説明しながら、その度に問題となり、かつ役だった情報科学の立ち位置に関してお話しできればと考えています。特に、以下の点にふれ、議論したく思っています。

(1)生命情報科学を理論生物学に
(2)公共のデータベースで勝負するべき
(3)数学的に最適の解空間を生物は必ずしも選ばない
(4)生物学がわかってない
(5)アルゴリズムは新しくなくて良い
(6)犯人を捜す
(7)世界はもともと不平等である