MACCS Keyとは何か

>100 Views

May 01, 26

スライド概要

Zennで記事も書いています。

https://zenn.dev/poclab_techblog/articles/what_is_maccs_key

https://zenn.dev/poclabweb/books/chemoinfomatics_theory_descriptor/viewer/lesson05_011_chemicaldescriptor

profile-image

横浜国立大学化学生命系学科にて、化学と情報科学に関わる研究(ケモインフォマティクス)を行っています。 無料で読めるケモインフォマティクス入門書を執筆中です。 https://zenn.dev/poclabweb?tab=books データ駆動型のアプローチを通じて、新しい分子と材料の発見と設計を加速することを目指し、化学構造の情報を整理し世界中の人々がアクセスして使えるようにしていきます。

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

各ページのテキスト
1.

1 MACCS Keyとは何か 構造キーの中で、最も有名なMACCS Keyについて説明 Hiroaki Gotoh

2.

構造キー(Structural Keys) 2 構造記述子(Structural Descriptors)とも呼ばれるこのような構造的特徴 の典型的な例としては、以下のようなものがある(1.1と1.2で例示済み)。 1. 特定の元素の有無とその数、例えば "少なくとも4つの窒素原子" 2. ベンゼン、シクロヘキサン、ナフタレンなどの環の存在。 3. 一般的な官能基(アミン、ヒドロキシ基など) MDL keys (MACCS Keys) • MDLでは長年、2次元記述子を用いた166ビット(無料)と960ビット(有料)のキーセット を公開。 • Molecular ACCess Systemを(MACCSと略している) • これらのキーセットは、もともと部分構造検索用に構築され、3234ビットから最適化さ れたもの • 原子特性、結合特性、およびさまざまな位相的分離における原子近傍の組み合わせとして 記述子を定義できる。

3.

創薬のためのMACCS Keysの最適化 原子や、結合など様々なKeyに選出 表1 原子ベース の特性 表2.単一原子の 原子ベースの特性 医薬品の分類データを使用して削減 表3.原子環境 Q 表4.原子-結合-原子 の特性 表5.その他の特性 3 A: any atom Q: Hetero atom 3234ビット から 166ビット アセチルコリンエステラーゼ阻害剤 まで検討 脂質過酸化抑制剤 など10種類 charge 徐々に減らし166ビットでも良好な分類 性能を示すことを見出した 166ビットは無料のソフトでも計算可能 from rdkit.Chem import AllChem AllChem.GetMACCSKeysFingerprint(mol) 957化合物からなるテストの分類性能(1.0に近いほどよい)​ 166ビットキーセットの0.65であり、 960ビットキーセットの0.67​であった。 1000ビット以上のキーセットでは、性能にはほとんど影響がない Reoptimization of MDL Keys for Use in Drug Discovery J. Chem. Inf. Comput. Sci. 2002, 42, 6, 1273–1280 https://doi.org /10.1021/ci010132r

4.

MACCS keyで選ばれた166ビットについて Description of public MACCS keys MayaChemToolsの説明 https://list.indiana.edu/sympa/arc/chminf-l/2007-11/msg00058.html http://www.mayachemtools.org/docs/scripts/html/MACCSKeysFingerprints.html 4

5.

構造Keyの視点と課題 5 最小の情報量で、医薬品の検索、分類などに用いることができるが。。。 53と89 は酸素(ヘテロ原子) の位置関係を認識 53, 89, 113, 127, 131, 139, 143, 152, 157, 159, 162, 163, 164, 165 パラ位を認識 するものはない 10種類の医薬品 162, 芳香族 163, 6員環 165, 環状 93, QCH3 (Qはヘテロ原子) 139, OH 157, C-O 160, CH3 164, O 113, 127, 131, 139, 143, 152, 157, 159, 162, 163, 164, 165 認識されていない 部分もある。 重複している 部分もある。 医薬品の分類データで削減 →他の特性に対応できるのか?