AI新モデル「MLEC-iGeneCombo」が個別細胞の遺伝子組み合わせ効果を予測し、個別化医療への道を開く

AI新モデル「MLEC-iGeneCombo」が個別細胞の遺伝子組み合わせ効果を予測し、個別化医療への道を開く

テクノロジー遺伝子相互作用がん治療個別化医療機械学習バイオインフォマティクス

遺伝子ペアの相互作用を理解することは、遺伝性疾患やがん治療の複雑なメカニズムを解明する鍵となります。特に、2つの遺伝子が同時に破壊された場合に細胞生存に与える影響、「遺伝子組み合わせ効果(GCE)」の正確な測定は、この分野における長年の課題でした。従来、合成致死性(SL)スコアなどの間接的な指標が用いられてきましたが、実験ごとの結果の一貫性に欠けるという問題がありました。この度、この課題を克服するため、CRISPR-cas9二重遺伝子ノックアウト(CDKO)実験において、より直接的で一貫性のあるGCEの測定方法として、CRISPR-cas9二重RNA(sgRNA)発現量の変化率(log-fold change, LFC)が提案されています。このLFCは、実験間で一貫した測定値を示し、遺伝子組み合わせ効果を直接的に反映することが示されました。

MLEC-iGeneCombo:個別細胞に特化したGCE予測モデル

個別細胞の遺伝子組み合わせ効果を予測する新モデル

本研究では、提案されたLFCをGCEの主要な指標として採用し、それを予測するための革新的なモデル「MLEC-iGeneCombo(Multi-Layer Encoder for individual sample specific Gene COMBO effect prediction)」が開発されました。この深層学習ベースのシステム生物学モデルは、細胞固有のマルチオミクスデータ、ネットワーク情報、および細胞株の特徴をエンコードする複数の層から構成されています。特筆すべきは、これまで不可能であった「新しい細胞」に対するGCE予測を初めて実現した点です。18件のCDKO実験データを用いた評価では、MLEC-iGeneComboは平均71.9%のGCE予測精度を達成しました。この成果は、細胞固有のマルチオミクスエンコーダー、ネットワークエンコーダー、および細胞株エンコーダーの全ての組み合わせによって最大限に引き出されることが示されました。

モデルの構成要素と予測性能

MLEC-iGeneComboは、以下の3つの主要なエンコーダーによって構成されています。

  • マルチオミクスエンコーダー: 各細胞株の遺伝子発現量(GE)や遺伝子必須度(ES)などのオミクスデータを入力とし、遺伝子ペアのGCEに寄与する特徴を抽出します。
  • ネットワークエンコーダー: タンパク質間相互作用(PPI)ネットワークなどの生物学的ネットワーク情報を利用し、遺伝子間の関連性や機能的文脈を捉えます。GraphSAGEアルゴリズムを用いて、遺伝子の局所的なネットワーク構造から特徴を学習します。
  • 細胞株エンコーダー: 個々の細胞株が持つ全体的な特徴を学習し、細胞固有のGCE予測に貢献します。

これらのエンコーダーからの出力を統合することで、最終的なGCEスコアを回帰タスクとして予測します。モデルの評価では、遺伝子必須度がGCE予測において最も強力な予測因子であり、次いで遺伝子発現量であることが示されました。3つのエンコーダーすべてを組み合わせたMLEC-iGeneComboは、平均71.9%の予測精度を達成し、個別のエンコーダーのみを使用した場合や、2つのエンコーダーを組み合わせた場合と比較して、大幅に優れた性能を示しました。

考察:個別化医療への道を開く

GCE予測の個別化と応用可能性

MLEC-iGeneComboは、従来の合成致死性予測モデルとは一線を画します。その最大の特徴は、GCEの直接的かつ一貫した指標であるLFCを予測対象としている点、そして「新しい細胞」に対するGCE予測を可能にした点にあります。この個別細胞特異的な予測能力は、がん治療や遺伝性疾患の研究において、患者一人ひとりの遺伝的背景や細胞の状態に合わせた、より精密な治療戦略の立案に貢献する可能性を秘めています。

今後の課題と展望

MLEC-iGeneComboは高い予測精度を示しましたが、特に未知の遺伝子ペアやネットワーク構造を持つ細胞株に対する予測には依然として課題が残されています。ネットワークエンコーダーが、学習データに含まれていない遺伝子やその関連性に対して、効果的な特徴抽出を行うことが難しい場合があることが示唆されました。これは、グラフ構造に依存するモデルの一般的な限界であり、今後の研究では、より汎用的なグラフ表現学習手法の導入や、異なるタイプの遺伝子間相互作用の考慮など、さらなる改良が期待されます。また、一部の細胞株で予測性能が低かった原因として、ノックアウト実験で非必須遺伝子のみが選択された可能性が指摘されており、遺伝子必須度とGCEの関係性についてのさらなる探求も興味深いテーマとなるでしょう。これらの課題を克服することで、MLEC-iGeneComboは、個別化医療の実現に向けた強力なツールとなることが期待されます。

画像: AIによる生成