14.1K Views
February 29, 24
スライド概要
東京科学大学 情報理工学院 情報工学系 大上研究室の説明資料です。 https://www.li.c.titech.ac.jp
研究室紹介 2025/1/20
基礎情報 大上研究室 PI (主宰):大上 雅史(おおうえ まさひと) 准教授 所属:情報理工学院 情報工学系 知能情報コース/情報工学コース 場所:すずかけ台キャンパス G3棟10階 1017号室, 1021号室 〒226-8501 横浜市緑区長津田町4259 G3-56 (G3棟1021号室) TEL: 045-924-5522 FAX: 045-924-5523 Email: ohue@comp.isct.ac.jp Web: http://www.li.c.titech.ac.jp 2
自己紹介 3 「大上ってどんな人?」 略歴 2007年 石川工業高等専門学校 電子情報工学科 卒業 2009年 東京工業大学 工学部 情報工学科 卒業 2011年 同 大学院情報理工学研究科 計算工学専攻 修士課程修了 2014年 同 博士後期課程修了,博士(工学)(2014年3月26日) 日本学術振興会 特別研究員 DC1(2011年4月~2014年3月) 2014年4月~2015年3月 日本学術振興会 特別研究員 PD 2015年4月~2016年3月 東京工業大学 大学院情報理工学研究科 計算工学専攻 助教 2016年4月~2020年3月 情報理工学院 情報工学系 知能情報コース 助教 2020年4月~2023年12月 同 テニュアトラック助教、大上研究室立ち上げ 2024年1月~現在 同 准教授 2024年10月 東京科学大学 (Science Tokyo) に改称
4 バイオインフォマティクス、創薬分野 •生物学、化学、創薬に関する計算手法開発を主軸とします •秋山研、石田研、関嶋研と “だいたい” 同じ分野です •機械学習・人工知能と、シミュレーションを組合せた 研究面 最先端研究を目指しています 研究成果の発信を重視しています •論文を書く(英語で) 「どんな研究室なの?」 •学会で発表する(日本語や英語で) •若手の会に参加する(成果発信というよりは交流メイン) •研究に関わる全ての出張は研究室から規定旅費を支給します。 学外活動の積極的な参加を期待します。
5 場所:すずかけ台G3棟10階 1017号室, 1021号室 2025年度の人数:B4 1~2、M1 2、M2 5、D 4 研究員 2、技術支援員 1、特任助教1、秘書 1 生活面 「縛りとかあるの?」 テレワーク:一部OK コアタイム:なし(ゼミの時間帯は物理参加必須) 土日:休んでください(論文締切前等、忙しい時期は頑張ってください) ゼミ:週3コマ分程度 大岡山 秋山研/石田研(W8 E507)と一部合同 ※Zoomで拠点間接続で実施しています アルバイト:禁止はしませんが、ほどほどに RA:学生はRA雇用が可能です (一定の給与を払います。自身の論文研究+αの貢献を求めます)
大上研究室(すずかけ台G3棟10階 1021号室)の様子 6 「どんな環境なの?」 フリーなブーススペース(3名分) 学生室G3-1021(リビングルーム) 10階なので景色が良いです
大上研究室(すずかけ台G3棟10階 1017号室)の様子 「どんな環境なの?」 学生室G3-1017(ワークスペース) 学生室G3-1017(ワークスペース) 7
就活 8 「こんな新しい研究室に入って就活は大丈夫?」 「バイオの研究室でIT系の就活は大丈夫?」 大上研は新しめの研究室のため情報が少ない(まだ就職3名・内定5名)ですが、秋山研や石田研、 G3 9階/10階の各研究室の教員や学生と協力することが可能です。秋山研OBの紹介も可能です。 残念ながら大上の紹介パスで入社できるような企業はほとんどありません。 (ベンチャー企業でちょっとだけありますが、期待しないでください。) 生命情報分野の研究室の出身でも、ふつうのIT系企業に就職する学生が多いです。 (秋山研や石田研も含む過去の実績より。ヘルスケアなどを手掛ける企業に就職する学生もいます。) 就活も進学も応援します。(もちろん博士課程進学も) 博士課程進学を目指す場合は、早期の成果創出や、学振DCなどの金銭的支援を獲得できるようサポートします。 修士からの博士内部進学者 2名
9 関連のある学会-日本 「どういう学会に行くの?」 国内会議 CBI学会 情報処理学会 バイオ情報学研究会(年4回) 情報処理学会 全国大会 日本生物物理学会 日本バイオインフォマティクス学会 日本蛋白質科学会 日本薬学会 日本分子生物学会 人工知能学会 10月ごろ 年会 3月 9月 9月ごろ 6月ごろ 3月ごろ 12月ごろ 5月ごろ 概要や日本語原稿(数ページ)を書いて 投稿して発表します。 現地参加が増えてきました。 2020年度B4(1期生) 杉田駿也, 情報処理学会全国大会, 2021. (学生奨励賞 受賞) 2021年度B4(2期生) 兒嶋佑季、古井海里 情報処理学会全国大会, 2022. (古井、学生奨励賞 受賞) 2022年度B4(3期生) 内河、植木 情報処理学会全国大会, 2023. (内河、学生奨励賞 受賞) 2023年度B4(4期生) 青木、坂野 情報処理学会全国大会, 2024. (坂野、学生奨励賞、大会奨励賞 受賞)
関連のある学会-海外 「どういう学会に行くの?」 海外(国際会議) ISMB, ECCB (バイオインフォ系の最難関国際会議) IEEE BIBM, IEEE BIBE, IEEE CIBCB, ACM BCB, PDPTA, InCoB, GIW, APBC, …(バイオインフォ系の国際会議) SC, ISC, ICPP(スパコン系の国際会議) NeurIPS, ICML, AAAI, ICLR, KDD, …(AI系の国際会議) Biophysical Society(生物物理の国際会議、論文無し) ACS Annual Meeting(化学の国際会議、論文無し) Pacifichem(化学の5年に1度の大国際会議、2025年12月開催、ホノルル) 2022年度M1(2期生進学) 古井海里, IEEE CIBCB 2022, 採択 論文を書いて審査を経て参加するタイプと、 アブストラクト(概要)のみで審査なしで 参加するタイプがあります。 10 卒論レベルでも国際会議で発表できます。 (国際会議で発表しても恥ずかしくないレベルの研究を目指します) 2022年以降、ほぼ現地参加です。 2021年度M1(1期生進学) 杉田駿也, IEEE CIBCB 2021, 採択
標準的な特課研(B4)の1年 11 4月 研究室配属、テーマ探し、生命輪講の準備/発表(~7月までに数回) 5月 テーマに関する研究調査、論文輪講の準備/発表(半年に1回ペース)、ラボBBQ 6月 学会に聴講参加(SIGBIO研究会、学術変革シンポジウム、など) 7月 研究を進める、コロキウムの準備/発表(半年に1回ペース)、大学院入試 A日程 8月 大学院入試 B日程 9月 学会に聴講参加、研究室合宿するかも 10月 CBI学会参加(進捗があればポスター発表も)、Tokyo Bioinformatics Meeting(3分発表) 11月 (あまりイベントは無いかも) 12月 情報処理学会全国大会発表申し込み、原稿準備、卒論執筆開始、忘年会 1月 情報処理学会原稿提出、卒論執筆 2月 卒論提出、卒論発表スライド提出、特課研発表会、先輩の発表会の聴講 3月 情報処理学会全国大会口頭発表、卒業式、その他学会聴講 or 発表
お金の話 12 「偉くない先生のようだけどお金はあるの?」 大上研は(比較的若い研究室・30代の教員にしては) 研究資金がそれなりにありますので、お金の心配はあまりありません。 競争的研究資金のプロジェクト 科研費 学術変革領域研究(A) (~2028.3)、6000万円 JST 創発的研究支援事業 (~2029.3)、5420万円 科研費 基盤研究(B) (~2026.3)、1450万円 JST ACT-X (~2024.3)、1300万円 AMED BINDS (~2027.3) (分担) 民間企業との共同研究費 数件あります ほか
13 研究内容の紹介(一例です)
情報理工学院でバイオインフォマティクスをするということ ゲノム情報 遺伝子発現情報 14 タンパク質立体構造情報 タンパク質間相互作用情報 PPIネットワーク情報 アミノ酸情報 画像情報 化合物構造情報 化合物結合情報 薬物動態情報
大上研のテーマ 15 大規模データ AI・機械学習 超並列計算 シミュレーション ライフ分野の知識発見
創薬モダリティ(治療手段)の多様化 創薬モダリティの多様化と新しいモダリティの探求 16 ※創薬分野では、「モダリティ」を分子の種類とか治療手段の種類という意味合いで使います。 (ニューモダリティ) 標的の多様性 細胞療法 beyond rule-of-five bRO5化合物 天然物医薬 抗体医薬 核酸医薬 遺伝子治療 ペプチド医薬 デジタル医療 TPD (PROTAC等) 低分子医薬 500 マイクロバイオーム医療 ファージ治療 分子量
大上研の研究テーマ例 Target Identification Small-Molecules Middle/Large-Molecules タンパク質間相互作用(PPI)予測 機械学習による低分子スクリーニング 環状ペプチド細胞膜透過性予測 (Ohue+, Bioinformatics 2014 他) 超並列計算 (Aoyama+, SFCA 2020 他) (Ohue+, JMGM 2019; Furui & Ohue, IEEE CIBCB 2022) (Sugita+, J Chem Inf Model 2021; 2022) 予測モデルの適用範囲推定と解釈 (Sugita & Ohue, IEEE CIBCB 2021) (Kengkanna & Ohue, Commun Chem 2023) 標的結合ペプチドデザイン (Kosugi & Ohue, Biomedicines 2022; Int J Mol Sci 2023) タンパク質分解誘導分子設計 (Ishizawa & Ohue, in prep) 自由エネルギー計算 (Furui & Ohue, J Supercomput 2024) 未知PPIの予測と実験 (Kami+, PLoS ONE 2018 他) PPIをターゲットとした分子設計 (Kosugi & Ohue, Int J Mol Sci, 2021; Ohue, Kosugi & Kojima, Molecules 2023) 抗体医薬デザイン (Ueki & Ohue, J Supercomputing, 2024) 17
GPUスパコンによるタンパク質間相互作用の網羅的な予測 タンパク質間相互作用 (PPI) の解明は、疾病メカニズムの理解や新規創薬標的の探索に重要な情報をもたらします。我々は計算機に よるタンパク質間相互作用の予測を大規模に行うMEGADOCKと呼ばれる独自技術を開発しました。東京科学大学のTSUBAME スーパーコンピューターに代表されるGPUスパコンをフル活用した網羅的なタンパク質間相互作用の予測が可能です。 大量のタンパク質構造情報 (Protein Data Bank) 東京科学大学TSUBAME 網羅的なタンパク質間相互作用予測 スパコンでの並列計算が可能なMEGADOCKは、学術利用向けにオープンソースで公開し ています。そのほか、AWSなどのクラウド向け実装、Dockerコンテナ、ウェブアーカイブの MEGADOCK-Webなども提供しています。 • MEGADOCK並列計算実装 Ohue M, et al. Bioinformatics, 30, 2014. • MEGADOCK-Web Hayashi T, et al. BMC Bioinform, 19(S4): 62, 2018. • DDX6-RO60 PPIの発見 Kami D, et al. PLoS ONE,13(10): e0203708, 2018. • コンテナ仮想化 Aoyama K, et al. In Proc SCFA2020, 12082, 2020. 18
日本のスパコン(2025年版) • 富岳 (理研) – 世界性能ランキング 6位 (Top500, 442.0 Petaflops, Nov 2024) – 7,630,848 CPU コア (48 CPU コア × 158,976 ノード) – Mem 32 GB/node 日本のスパコン (2024年) • TSUBAME 4.0 (Science Tokyo) – 世界性能ランキング 36位 (Top500, 39.62 Petaflops, Nov 2024) – 960枚のNVIDIA H100 GPU – Mem 768 GB/node • ABCI 2.0 (産総研) – 世界性能ランキング 39位 (Top500, 22.21 Petaflops, Jun 2024) – 52,160 CPUコア – 5,312枚のNVIDIA V100/A100 GPU – Mem 384 GB/node 19
ABCI Grand Challenge (medium class, 512 nodes, 2019-Autumn) 超高速タンパク質間相互作用予測システムM EGADOCK 5. 0による 細胞内タンパク質間相互作用の網羅的解明 東工大 秋山研 青山 建人さん 1,322,500 PPI predictions on ABCI strong scaling = 0.964 (strong scaling test) 東工大 秋山研 渡辺 紘生さん (当時) on Singularity containers 32 51,131 time (sec) ideal scale 48,000 36,000 8 25,581 24,000 4 12,801 12,000 0 16 70-million PPIs/day 6,419 16 32 64 128 #rt_F nodes 3,247 1,657 256 512 xSpeedup Time (sec) 60,000 2 1 Aoyama K, et al. In Proc SCFA2020, 12082, 2020. 20 Ohue M, et al. (in prep)
細胞初期化に関わる因子PPIの発見 Kami D, Nakamura A, Wakui N, Mizutani R, Ohue M, Kametani F, Akimitsu N, Gojo S. PLoS ONE, 2018. • • mR NAクリアランス ( R NA decay ) が細胞リプログラミングに必須 Co-IPとM EGADOCK で候補を探り、DDX 6-R O60複合体がiPSC化におけるR NA decay に必須であることをつきとめた R NA分解制御メカニ ズムの解明 KD=620 nM the proposed model to explain the molecular mechanism for RNA decay at the early reprogramming stage DDX6 RNY1 ( DDX 6-R O60相互作用の発見) RO60 21
創薬のためのバーチャルスクリーニング技術開発 医薬品開発に用いられる計算機技術 ? N N N NH N SH N SH N N N N NH2 ? ? 薬剤標的タンパク質 バーチャル スクリーニング N N N NH N N N N N SH N SH ⋮ NH2 ⋮ 活性予測値を用いて 化合物を並び替え 化合物 ライブラリ 薬剤標的タンパク質に対する 化合物の活性を計算機を用いて予測 e.g. 機械学習, ドッキング,… アッセイ 92% 73% 64% e.g. 阻害率, Kd, IC50, … 22
タンパク質言語モデル・化学言語モデルの応用 タンパク質言語モデル (PLM) 化学言語モデル (CLM) ESM-2 MolBART (Chemformer) 言語モデルを活用した高性能予測 23
抗体の製造条件の最適化 タンパク質言語モ デル( PLM)を活用して 最適な抗体製造条件を予測する。 AbLang 抗体言語モデル ESMFold 構造予測AI 富士フイルム株式会社との共同研究 Tsutaoka T, et al. In Proc IEEE BIBM 2024, 240-243, 2024. 24
AIの予測の「ワケ」を知りたい Kengkanna A, Ohue M. Commun Chem, 7: 74, 2024. 25
AI創薬の「理解」を導く 潜在空間学習・AI予測と、解釈性を両立させる技術 創薬のためのバーチャルスクリーニング技術開発 グラフニューラルネットワークで化合物の部分構造をデータ表現に保持 グラフアテンションを用いて部分構造の「重要度」を算出 26
環状ペプチドのヒト血清アルブミンに対する結合様式を解明 ヒト血清アルブミンとの結合メカニズムの解明は医薬品の体内安定性の制御のために重要な情報となりますが、 環状ペプチドがどのようにヒト血清アルブミンに結合しているかは未解明でした。本研究では、環状ペプチド医薬品の一種である ダルババンシン(dalbavancin、商品名dalvance)のヒト血清アルブミンに対する結合様式を明らかにしました。 今後、複合体結晶構造から明らかになった相互作用に基づく環状ペプチドの設計などが期待されます。 ダルババンシン※ (dalbavancin) ダルババンシン (dalbavancin) 東工大ニュース掲載(2020.11.13) ダルババンシンの環状部はHASに覆いかぶさる ように、炭化水素鎖はHSAの疎水性ポケットに 深く挿さるように結合します。 X線結晶構造解析により2箇所の結合が確認されましたが、 左上(※)のダルババンシンは結晶中のとなりあうアルブミン の影響を受けたことによるもので、溶液中では左上の結合が 起こらないことがITC(等温滴定型カロリメーター)および SAXS(X線小角散乱)実験から明らかとなりました。 ヒト血清アルブミン (human serum albumin) Ito S, et al. J Med Chem, 63(22): 14045-14053, 2020. doi:10.1021/acs.jmedchem.0c01578 創薬化学トップジャーナル J Med Chem掲載 27
まとめ 情報工学の応用としての生命/化学は、チャレンジングな課題が多く、 応用分野としての魅力が非常に大きいです。 大上研は2020年4月にスタートしました。 人が増えてきて賑やかになりましたが、まだまだ黎明期です。 研究室の文化を新たに創っていくという楽しみもあります。 研究環境に不自由があれば、お金で解決できるものは お金がある限り解決します。 産業界・生命医薬分野などの異分野連携も積極的に行っています。 医科歯科大とも統合され、医療応用も盛んです。 充実した研究生活にしていきましょう。 28
FAQ 29 よくある質問 Q. 入学前/配属前にバイオの勉強をしておく必要はありますか? A. 入ってから本読みをやるので不要です。興味があれば「バイオインフォマティクス入門」(日本バイオインフォマティクス学会 編)を。 Q. 研究テーマはどうやって決めますか?(学部・修士課程) A. 個々人のバックグラウンド、得意分野などを考慮して一緒に決めます。競プロが得意ならアルゴリズム系、など。 Q. ゼミは週に何回くらいありますか? A. 定期は週3~4(研究発表、論文読み、本読み)です。その他、月1の全体報告会、不定期(月2程度)の研究ミーティングがあります。 Q. どんな学生が大上研に向いてますか? A. 学会発表などで実績を作りたい人、自由な雰囲気で自由に研究を進めたい人。博士進学だけでなく就職にも有利にはたらきます。 Q. 秋山研・石田研・関嶋研との大きな違いはなんですか? A. (どちらかと言えば)大上研は「PPI(タンパク質間相互作用)」「さまざまな創薬治療手段」をテーマに研究の方向性を決めています。 Q. 所属学生はどんな研究をしていますか? A. PPI薬設計(D)PPI予測(D)ΔG計算(D/B)分子設計(M)環状ペプチド(M)抗体(D/M)言語モデル(M)説明可能AI(M/B)、など 29