特徴ベクトルへの摂動によるグラフデータ拡張⼿法の開発

Abstract

創薬や材料開発では, 所望の性質を持つ新規有機分子の効率的な探索手法が求められている. 定量的構造物性相関モデルとしてグラフニューラルネットワーク (GNN) と呼ばれる深層モデルを用いることで, 既存の特徴抽出手法を用いるよりも良い予測性能で, 候補構造のバーチャルスクリーニングができる. しかし, 先行研究では学習に多量の化学構造データを利用しており, 興味のある構造・物性データが多量に集まりにくい分子設計の現場では, 十分な予測性能が得られない可能性がある. 本研究では, Message Passing Neural Network (MPNN) と呼ばれるGNNモデルの中で特徴ベクトルに摂動を加えることでグラフデータの拡張を行うPerturbating MPNN (PMPNN) を設計した. QM9データセットでMPNNとの比較を行い, 提案手法の有効性を検証し, 予測に対する摂動の効果を考察した. また, データ拡張により約半数のデータセットでも元と同等の予測性能が得られ, 少量のグラフデータでもうまく特徴抽出できると示唆された.

Related