超音波画像とAIで乳がんHER2陽性率を予測:新たな診断支援ツールの可能性

超音波画像とAIで乳がんHER2陽性率を予測:新たな診断支援ツールの可能性

テクノロジー乳がんHER2超音波ラジオミクス機械学習

乳がんは世界的に女性の罹患率が高いがんであり、その中でもHER2陽性乳がんは悪性度が高く予後不良とされることがあります。しかし、近年登場したHER2標的薬により、HER2陽性乳がんの予後は大幅に改善しています。そのため、早期のHER2発現状況の正確な予測は、個別化治療戦略の鍵となります。従来、HER2発現状況の診断には、免疫組織化学(IHC)検査や蛍光in situハイブリダイゼーション(FISH)検査などの組織生検が用いられてきましたが、これらは侵襲的で時間もコストもかかるという課題がありました。また、腫瘍内のHER2発現の不均一性も診断の複雑さを増す要因となっています。このような背景から、非侵襲的かつ高精度にHER2発現状況を予測する手法の開発が求められてきました。

超音波画像とAIによるHER2陽性予測の可能性

本研究は、従来の超音波画像から抽出される「ラジオミクス特徴量」と機械学習モデルを組み合わせることで、乳がんのHER2陽性状態を非侵襲的に予測するモデルの実現可能性と臨床的価値を探求することを目的としています。

研究の背景と目的

超音波検査は、安全で簡便、かつ非侵襲的な画像診断技術であり、乳がんの診断に広く用いられています。しかし、その診断には主観性や術者依存性が伴うという限界がありました。近年発展が著しいラジオミクス技術は、医用画像から大量の定量的データを抽出し、腫瘍の形状、テクスチャ、内部特性などを解析します。さらに、機械学習は、ラジオミクスによって抽出された画像特徴量と腫瘍の分子生物学的特徴との間の潜在的な関連性を学習する強力なツールとなります。本研究では、このラジオミクスと機械学習を組み合わせることで、画像特徴量とHER2発現状況との複雑な関係を包括的に分析し、高精度な予測モデルを構築することを目指しました。

研究方法

本研究では、3つの異なる医療機関から収集された合計525例の乳がん患者のデータを対象としました。まず、2つの医療機関から得られた437例(HER2陽性144例、HER2陰性293例)のデータを用いて、トレーニングおよび内部検証用データセットを構築しました。次に、患者の超音波画像からラジオミクス特徴量を抽出し、LASSO回帰、t検定、主成分分析(PCA)といった手法を用いて、HER2陽性状態と強く相関する特徴量を選択しました。最終的に、選択された5つの主要なラジオミクス特徴量(LRHGLE、LAHGLE、SVR、RE、MAL)に基づき、ランダムフォレスト(RF)を含む10種類の機械学習モデルを構築し、その性能を比較評価しました。さらに、別の医療機関から収集された88例(HER2陽性35例、HER2陰性53例)のデータを用いて、外部検証を行い、モデルの一般化性能を評価しました。

研究結果

5つの主要なラジオミクス特徴量を用いて構築された機械学習モデルのうち、ランダムフォレスト(RF)ベースのモデルが最も優れた予測性能を示しました。トレーニングおよび内部検証データセットにおけるROC曲線下面積(AUC)は0.893(95%信頼区間 [CI]、0.860–0.920)を達成し、外部検証データセットにおいても0.854(95% CI、0.775–0.927)という高いAUC値を示しました。これらの結果は、本研究で開発されたモデルが、異なる施設から得られたデータに対しても高い精度でHER2陽性状態を予測できることを示唆しています。SHAP(Shapley Additive exPlanations)分析により、LAHGLE(large area high gray level emphasis)とSVR(surface to volume ratio)が予測に最も寄与する特徴量であることが明らかになりました。これらの特徴量は、HER2陽性乳がんにおいて、より複雑なテクスチャや不整形な形態的構造と関連していることが示唆されました。

今後の展望と考察

乳がん診断におけるAI活用の意義

本研究で開発された超音波ラジオミクスと機械学習を組み合わせた予測モデルは、乳がんのHER2陽性状態を非侵襲的かつ高精度に予測する新たな可能性を示しました。従来、HER2陽性乳がんは予後不良とされることが多かったものの、標的薬の登場により治療成績は向上しており、早期かつ正確な診断が極めて重要となっています。本モデルは、組織生検に代わる、あるいはそれを補完する診断支援ツールとして、個別化治療戦略の立案に大きく貢献することが期待されます。

限界と将来的な研究の方向性

本研究は、その有用性を示した一方で、いくつかの限界も抱えています。第一に、さらなる代表性と一般化能力の向上のためには、より大規模なデータセットでの検証が必要です。第二に、本研究では2次元超音波画像のみを用いたため、多重モダリティ超音波画像(例:カラードップラー、エラストグラフィなど)の特徴量との相関や、それらを統合したモデルの開発も今後の重要な研究課題となるでしょう。これらの限界を克服し、さらなる改良を加えることで、本モデルは臨床現場における乳がん診断の精度向上と、患者一人ひとりに最適化された治療法の提供に一層貢献していくと考えられます。

画像: AIによる生成