血液中のDNAメチル化データを機械学習させ、統合失調症患者を判別するモデルを開発

提供元:AJ Advisers LLCヘルスデージャパン

血液中のDNAメチル化データを機械学習させて構築した疾患・対照判別モデルを使用すると、統合失調症患者を高精度で判別できることが、「Translational Psychiatry」に2021年8月3日掲載された論文1で報告された。

米ベイラー医科大学のChathura J. Gunasekara氏らは、CoRSIVs(correlated regions of systemic interindividual epigenetic variation;CpGメチル化レベル変動の組織依存性が比較的低く、個人間の変動が大きい領域)に着目し、血液中のDNAメチル化データに基づいて、統合失調症を対照から判別するモデルを、スパース判別分析(SPLS-DA)と呼ばれるアルゴリズムを用いた機械学習により構築した。CoRSIVsのメチル化パターンのサブセットは、イルミナ社のHuman Methylation 450K(HM450)アレイで認識できる。研究グループは、統合失調症患者414人と精神疾患のない対照者433人におけるHM450アレイでのDNAメチル化データを、機械学習の分類アルゴリズムのトレーニングデータとして使用した。また、SPLS-DAの正則化(変数選択)と次元削減機能を利用して、データの分散を最もよく説明するような2つの次元により構成される平面上での「リスク距離」を個々のテストケースで案出し、これにより統合失調症のリスクが高い人々を識別できるようにした。その後、この分類モデルを、353人の統合失調症患者と322人の対照者を対象として、別のHM450アレイのデータセットにより評価した。

CoRSIVsに基づく最終的な分類モデルは、統合失調症患者353人中303人(85%)を症例と分類し、陽性的中率(PPV)は80%であった。この85%という結果は、ゲノムワイド関連解析(GWAS)の一塩基多型(SNPs)データに基づく、ポリジェニック・リスクスコア(PRS)モデル単独の分類能力(353人中115人、32%)を大きく上回っていた。抗精神病薬がDNAメチル化に影響を与えた可能性も検討したが、リスク距離と薬の使用との間に関連は認められなかった。

最終的な分類モデルにPRSの情報を加えても、モデルの分類能が大きく向上することはなかった(353人中306人、PPV 80%)。リスク距離とPRSとの間には弱い正の相関(Pearson相関係数r=0.28、P=1.28×10−12)しかなかったが、リスク距離の中央値を超えた人の大半は、PRSの50パーセンタイルも超えており、これがPRSをモデルに加えても分類能が向上しなかった原因と考えられた。遺伝子変異がCoRSIVsメチル化に影響を与える例があることから、媒介分析を行った結果、PRSと統合失調症症例・対照との間の関連に、CoRSIVsメチル化パターンの間接効果が27%(P<1×10−16)あることが示された。

著者の一人は、ベイラー医科大学のリリースの中で、「われわれは、CoRSIVsを解析することでエピジェネティック疫学研究が可能になることが、本研究により証明されたと考えている」と述べている。(HealthDay News 2021年8月9日)

Copyright © 2021 HealthDay. All rights reserved.

※本コーナーの情報は、AJ Advisers LLCヘルスデージャパン提供の情報を元に掲載しており、著作権法により保護されております。個人的な利用以外の目的に使用すること等は禁止されていますのでご注意ください。

参考文献

  1. Gunasekara CJ, et al. Translational Psychiatry. Published online August 3, 2021. doi: 10.1038/s41398-021-01496-3