一般化学物質の長期毒性評価の計算予測をめざして

オーガナイザー:福西快文 (産業技術総合研究所 創薬分子プロファイリング研究センター)

【背景】 電気・電子材料、半導体、洗剤等工業原料など一般化学物質は、日本では新規な物質も含め年間3万物質が上市されている。PCBやDDTなどに見られた深刻な環境や人の健康影響問題を未然に防ぐため、一般化学物質の安全性評価と規制はOECD加盟国等先進国ではほぼ必須となっている。しかし、哺乳動物を用いた28日~90日間反復投与などの亜急性毒性試験は1件1000~3000万円と極めて高価である。化合物を扱うすべての業種で高リスクの物質を、より安全な物質に代替し、日本が世界的に機能性化学物質の開発を促進するには、計算予測手法を中心としたin silicoでの実験の代替手法が必須である。本年最先端の人工知能技術を活用した、産業界の共通基盤としての化学物質の安全性予測手法の開発を目指し、経済産業省委託事業「次世代型安全性予測手法開発」(AI-SHIPS)が発足した。


【問題】 長期での肝臓等の毒性は、創薬よりもメカニズムが複雑で、マイクロアレイ、パスウェイ解析など様々な試みがなされている。現在では、化合物の代謝での反応、各種タンパク質と化合物との相互作用、遺伝子の発現やパスウェイの動きなどを階層的に理解し、毒性発現とその影響を紐解く(AOPベースでのアプローチ)流れとなっている。理解を深めるため、1万種類もの化合物のHTSアッセイや、300化合物程度に限定はされるが、500種類以上にも及ぶ薬物の影響の観察結果が集積され、計算予測の土台となりつつある。しかし、一般化学物質の毒性を的確かつ高精度に予測できるソフトウェアはまだ存在しない。


【趣旨】 当セッションでは、毒性予測分野の第一線の研究者による、毒性予測や評価についての計算手法や、その成果と限界についてご紹介を願う。


核内受容体およびストレス応答パスウェイを介した肝毒性予測における人工知能技術の適用
植沢芳広 (明治薬科大学 臨床薬剤学研究室)

インビボ毒性試験データベースを用いたラット肝毒性のインシリコ予測手法の開発
竹下潤一 (産業技術総合研究所 安全科学研究部門 リスク評価戦略グループ)
 現在、化学物質のヒト健康影響評価は、ラットなどの実験動物を用いた毒性試験に依存して行われている。しかし、動物実験にかかる費用や期間、また動物愛護の問題から、動物実験によらない評価予測手法(動物実験代替法)の需要が増している。しかし、化学物質のヒト健康影響評価に重要な毒性のひとつである反復投与毒性に関しては、その動物実験代替法の開発はほとんど進んでいないと言える。一方で、評価予測手法の開発に有用と思われる評価支援システム“HESS”が、近年、(独)製品表技術基盤機構を中心として開発された。そこで、私たちはHESSに搭載されているデータを学習データとして用いることで、ラット肝毒性のインシリコ予測手法の研究を進めている。
 HESSに搭載されている化学物質審査規制法(化審法)既存点検等のデータである28日間反復投与毒性試験データを有する176化合物を、学習データとして抽出した。次に、分子記述子演算ソフトDRAGON6を用いて、計算可能な全分子記述子の計算を行った。インシリコ予測手法の開発例として、主要な肝毒性マーカーである血中ALT上昇の有無を判別する統計モデルを、ロジスティクス回帰モデルをベースとして構築した。しかし、構築するにあたり大きく2つ克服すべき点があった。(1)統計モデルの説明変数の候補である分子記述子の数が膨大で、学習データの化合物数よりかなり多い。(2)毒性を示す化合物数が毒性を示さない化合物数に比べてかなり少ない。すなわち、学習データが不均衡である。そこで、私たちは(1)の問題を解決するために、非階層的クラスタリング技法のひとつであるk-medoids法を用いることで、統計的に代表的な分子記述子の選択を行った。また、(2)の問題を解決するために、SMOTEアルゴリズムを適用することで、毒性を示す化合物群のサンプルサイズを人工的に増やし、学習データを均衡データにした。その結果、説明変数が10個以下のシンプルな判別モデルを構築することができ、その感度、特異度、一致率はそれぞれ75%程度を達成できた。
 一方で、本研究を通じて反復投与毒性をインシリコ予測するためには、克服すべき困難な点や、インビボ毒性試験データベースを用いる際に注意すべき点が明らかになってきた。本研究で得られた知見をベースに、今後は、経済産業省プロジェクトAI-SHIPSなどにおいて、反復投与毒性に対するインシリコ予測手法の高精度化を目指していく予定である。
 本発表では、HESSを用いた私たちのこれまでの取り組みを紹介するとともに、抽出された今後の課題を共有したい。なお、本研究は静岡県立大学薬学部衛生分子毒性学分野の吉成先生、佐々木先生及びその学生たちとの共同研究である。

NGSデータから当たりを引き出す
緒方 法親 (株式会社日本バイオデータ代表取締役,次世代バイオ医薬品製造技術研究組合事務局顧問(ゲノム技術))
次世代シークエンサー(NGS)などのハイスループット測定装置を用いた網羅的分析手法は,生物を研究するツールとして普及してきている.複数の試験区を設定し,例えばゲノム上の多型や,メッセンジャーRNA(mRNA)といった因子を網羅的に測定・比較することによって,現象を説明できる因子を取得しようとする試みが続けられている.そういった方法で取得された因子によって様々な生命現象が説明され,制御が可能になってきている,と言うことはできるだろうか.演者はこれを言うことができないと考えている.例えば,ある化合物が生体に与える影響を調べるために,その化合物を細胞に与えてmRNAの発現量の変動を網羅的に分析しようとする場合,どういった濃度で化合物を細胞に与えれば現象を説明できる因子を取得できるのであろうか.実際に細胞に対して複数の濃度で化合物を与えると,それぞれの濃度で得られる「統計的に有意に変動した因子」は異なってくるが,どの濃度が適切だろうか.mRNAの発現量を網羅的に分析する手法をトランスクリプトーム解析(Transcriptome analyses)と言うが,該キーワードでPubMed等の論文データベースを検索すると,何かしらの比較をして有意差を持つ因子をリストアップすることに終始した文献が目立つ.得られた因子を検証する代わりに,機能から選び出した因子の変動グラフを追加したりすることも多い.どんな比較でも必ず有意差が得られてしまう網羅的分析手法を用いる際には,比較の正当性を確認する必要があるのではないだろうか.過去の議論を探索すると,Goetheが1820年に比較解剖学の文脈で比較の正当性について持論を展開している.比較の正当性を議論するため,そこでは「解剖学的原型」が定義され,一定の同一性が比較の前提に求められた.では,トランスクリプトーム比較における原型は定義できるだろうか.現時点でトランスクリプトームの原型を定義できるほどトランスクリプトームの全体像は把握されていないため,要約値を用いてサンプル間の同一性を確認する方法が提案されている.本発表では,生物学上の意味が説明可能である要約値として,情報エントロピーを紹介する.また,トランスクリプトームの情報エントロピーがヒステリシスを示すことから観測できる多極安定性の解釈や,ヒステリシスループの面積を応用した解析手法にも触れる.