千倍の失敗例で誤りが百分の1以下に、創薬AIの精度向上

関西医科大学と摂南大学の研究チームは、創薬研究におけるAI（人工知能）の活用について検討。活性化合物を効率的に見つけるためには、生物活性を示す化合物だけでなく、生物活性を示さない化合物もAIの学習に重要であることを明らかにした。

創薬の成功確率は低く、生産性の向上が求められている。近年では、AIの活用による化合物探索の効率化が試みられている。ディープラーニングをはじめとした多くの方法論が提案されているが、AIの学習データに着目した研究はほとんど行われていなかった。また、一般の創薬手法で用いられる「ハイスループットスクリーニング（HTS）※」ではヒット率が0.1%以下にとどまると言われている。これまでの創薬では数少ないHit化合物のみに着目し、数多く得られる“失敗したデータ”群については十分に活用されておらず、ただ捨てられるだけとなっている。

研究チームは、この創薬分野におけるデータの特徴、すなわち化合物の大部分が活性を示さないという特徴に着目。AIの学習において、活性を示す化合物（正例）に対して、活性を示さない化合物データ（負例）の割合を1,000倍増やすと、AIの誤分類が100分の1以下になり、識別能力が格段に向上した。

この知見を利用することで、より少ない検証回数や薬剤リソースでスクリーニングを行うことが可能となり、創薬研究における大幅なコストダウンにつながる幅広い応用が期待できるとしている。研究論文は、3月18日（木）に学術誌の「molecular informatics」（インパクトファクター：2.741）に掲載された。

※ハイスループットスクリーニング（High Throughput Screening）は大量の化合物から有用な化合物を高効率で特定する技術。

論文情報：

【molecular informatics】Effect of Learning Dataset for Identification of Active Molecules: A Case Study of Integrin αIIbβ3 Inhibitors

投稿千倍の失敗例で誤りが百分の1以下に、創薬AIの精度向上は大学ジャーナルオンラインに最初に表示されました。