清華大のAI「DrugCLIP」全ゲノム薬剤スクリーニングを100万倍高速化
AIが創薬の“探索速度”を一段引き上げるニュースです。清華大学と北京智源人工智能研究院(BAAI)の研究チームが、ヒトゲノム全体を対象に薬と標的タンパク質の対応関係を高速に探索できるプラットフォーム「DrugCLIP」を開発し、1月9日付で科学誌Scienceに発表しました。
DrugCLIPとは何か:狙いは「全ゲノム規模」の薬剤探索
研究の焦点は「ケミカル・ゲノミクス(chemical genomics)」です。これは、ヒトゲノムがコードする多数のタンパク質(約2万)それぞれに対して、作用し得る小分子化合物(薬候補)を体系的に見つけようとする考え方です。
ただ現実には、病気と関わるタンパク質が多い一方で、技術面・計算面の制約から「薬が効く形で狙いにくい標的(いわゆるundruggableと呼ばれる領域)」が残りやすく、探索そのものが難しい状況が続いてきました。
何がすごい?「100万倍の高速化」で“何百年”の計算を現実時間へ
従来のバーチャルスクリーニング(計算機上での候補探索)は、標的タンパク質の数と化合物の候補数が膨大なため、全ゲノム規模に広げると計算量が爆発しがちでした。入力情報によれば、最先端の分子ドッキング(タンパク質のくぼみに分子がどうはまるかを計算する手法)でも、ゲノム規模での探索は“何世紀もかかり得る”とされています。
DrugCLIPはこのボトルネックに対し、スクリーニング速度を100万倍に高め、全ゲノム規模の薬剤―標的マッピングを完了したとされています。
仕組みのポイント:「結合」を“ベクトル検索問題”に変える
DrugCLIPの特徴は、分子がタンパク質ポケット(結合部位)に“どう動的にはまり込むか”を逐次シミュレーションするアプローチから一歩引き、タンパク質ポケットと小分子を数学的なベクトルとして表現する点にあります。
- 「ベクトル化された結合空間」で、タンパク質側・化合物側を同じ土俵に写像
- 深層コントラスト学習で、複雑な生化学的相互作用を“近い・遠い”の関係として学習
- 最終的には、計算機科学で最適化が進んだ大規模検索(検索・推薦に近い計算)として扱える
要するに、化学結合の精密シミュレーションを“毎回ゼロから重く回す”のではなく、学習済み表現を使って“高速にあたりをつける”設計へ寄せた、という見取り図です。
公開と利用状況:2025年6月に一般公開、世界の研究者が利用
入力情報によると、DrugCLIPは2025年6月に清華大学AIRとBAAIによって公開され、その後グローバルな研究コミュニティに無料で提供されてきました。これまでに世界で1,000人以上の研究者が利用し、数万件規模の大規模スクリーニングが実施されたとされています。
「ポストAlphaFold時代」の創薬とは:大規模・体系的・オープン協働
専門家のコメントとして、今回のScience掲載は「ポストAlphaFold時代」の創薬の到来を印象づける出来事だ、とされています。ここで言う“ポストAlphaFold”は、タンパク質構造予測の進展を土台に、次の段階として
- 全体像を俯瞰する大規模探索
- 仮説を広く試す体系的アプローチ
- データとツールを共有するオープン協働
へ研究スタイルが寄っていく、という文脈です。
期待と同時に見ておきたい点:速さの先にある「確からしさ」
スクリーニングが高速化すると、候補の“母数”が一気に増えます。そこで次の論点が重要になりそうです。
- 実験での検証(wet lab):計算上の有望候補を、どれだけ確実に実験で絞り込めるか
- データの偏り:学習に使う既知データが偏っている場合、探索の視野に影響が出ないか
- 新規標的の解釈:“新しい標的が見つかった”ことと“薬になり得る”ことの間をどう埋めるか
中国科学院の研究者として紹介されている王暁東氏は、DrugCLIPが創薬を加速するだけでなく、候補化合物の化学空間を広げ、医薬品イノベーションのハードルを下げる可能性があると述べています。とりわけ意義が大きい用途として「まったく新しい“薬で狙える標的”の同定」を挙げています。
計算が速くなると、探索の仕方そのものが変わります。DrugCLIPの発表は、創薬が“少数の当たりを狙う”から、“体系的に広く当たりを探す”へと重心を移す流れを、もう一段押し進めるのかもしれません。
Reference(s):
Chinese scientists use AI to boost drug screening by a millionfold
cgtn.com








