NEC,生成AIを活用し医療等データの二次利用に向けた実証を実施
15万人規模の医療合成データの作成と,国際共通規格への変換を効率的に実現

2026-3-25

AI

NEC


NECは,医療等データの二次利用の推進に向け,生成AIと医療情報の知見を活用して15万人規模の「医療合成データ」(注1)を作成した。「医療合成データ」は日本人の統計的特徴を反映した架空の患者データの集合である。本データを国際的な医療データ分析向けの共通規格「OMOP」(注2)に沿う形式に変換し,協力団体やパートナー企業とともに評価することで,将来の医療等データの二次利用に向けたデータ活用のプロセスを実証するとともに,「医療合成データ」の研究過程における有用性を確認することができた。

実証の概要図

実証の概要図

 

(※1)ETL(Extract, Transform, Load):複数の情報システム等からデータを抽出し,分析や利活用に適した形式へ変換・加工した上で,データベース等に格納する一連の処理工程
(※2)ATLAS:OMOPに準拠した医療データを対象に,研究対象定義や解析設計等を行うために国際的な研究者コミュニティが提供しているオープンソースのWebベース分析支援ツール

背景と課題

検査結果,処方内容,レセプト(診療報酬明細書)などの医療等データの活用には,個人の治療・健康管理に用いる「一次利用」と,医学研究や創薬に用いる「二次利用」がある。欧州では「欧州医療健康データスペース規則(EHDS)」が制定され,統一データ流通・活用基盤の構築も進んでおり,日本においても政府や研究機関での国際的な動向を踏まえた医療等データの二次利用にむけた検討が加速している。
しかし国内では,以前より様々な二次利用研究は行われていたものの,医療機関ごとにデータ形式やコード体系が異なることがあり,分析可能な状態に整備する「前処理」に多大な工数を要することが課題となっている。また,医療機関・研究ごとにサイロ化したまま進んだため,国際連携によるデータ利活用が進みにくい環境であることも課題である。さらに,実データの利用には厳格なプライバシー保護と許諾プロセスが必要であり,研究開発の迅速化を阻む要因となっていた。

実証の概要

NECは今回,将来的な二次利用データプラットフォームの構築に向け,大規模な医療合成データの生成,データの国際共通規格「OMOP」への変換,実際の研究プロセスを模したシミュレーションに関する実証を実施した。

1. 日本人の統計的特性を高度に再現した15万人規模の医療合成データを生成
AIによる学習と生成AIによる妥当性チェックを組み合わせることで,実際の患者情報を用いることなく,日本人の統計的特性(年齢構成,男女比,疾病履歴など)を再現した15万人規模の疑似的な医療データを短期間で合成した。

2. 異なる形式の合成データを統合して解析
レセプトデータ,DPCデータ(注3),処方FHIRデータ(注4)など,異なる形式のソースを模した合成データを生成した上で,さらにこれらのデータをOMOPに統合変換し,複数のデータソースを横断した解析が可能であることを確認した。

3. 研究現場での有用性検証
3つのリサーチクエスチョン(研究上の問い)に基づき,OMOPに変換されたデータが実際の研究プロセスに活用可能か,有識者と評価した。
(1) 都道府県自治体職員ユースケース:終末期のがん患者における在宅療養支援の介入が,病院死の減少や自宅での看取りに与える影響の分析。
(2) 救急医学研究者ユースケース:急性心筋梗塞(AMI)で入院しPCIを実施した患者において,PCI実施日が土日祝日である場合,平日と比較した心不全再入院リスクの差異の検証。
(3) 医療政策効果分析担当者ユースケース:高齢者への睡眠薬・抗不安薬の長期処方や多剤併用における適正使用動向の把握。

実証の成果

今回,15万人規模の大量の医療合成データをOMOPへ変換し,3つのリサーチクエスチョンに適用した。また,愛媛大学および一般社団法人医療データ連携分析基盤協会の各有識者の知見ならびにパートナー企業の協力を得て評価した。
その結果,本研究の変換データはOMOP適合率98%(注5)を達成したこと,各研究で有効な解析環境の構築が実現できたことを確認した。また,将来想定される実際の医療等データの共通規格への変換プロセスを先行して実証することができた。また医療合成データを用いたデータ連結解析(注6)および研究者のニーズの先行検証の有効性を示すことができた。

今後の展望

NECは本実証で得られたスキームを,様々な医療データ二次利用基盤へ実装することを検討していく。これにより,安全かつ高度な医療データの利活用を促進し,医学研究の発展と国民の健康増進に貢献する。

なお,本件に対する各者のコメントは以下のとおり。

医療データの二次利用をさらに発展させる,素晴らしいマイルストーンです。異なるデータ形式を統合し,現場のニーズに即した複数のユースケースでその有用性を証明した意義は小さくありません。また,研究者が最も苦心する実データ利用までのタイムラグを,高精度な合成データによる先行開発で解決することで,臨床研究の生産性は飛躍的に向上するでしょう。さらに統計的正確性と生成AIによる臨床的リアリティを両立させた疑似データの追求は,まさに次世代のデータ利活用の姿です。これが将来,多様な医療シナリオを検証可能なシミュレーターへと進化し,OMOP CDM等の分析用医療データ標準の普及とともに,日本の創薬や医療政策の意思決定を支える強力な手段になることを期待しています。
一般社団法人医療データ連携分析基盤協会 代表理事 平松達雄氏

リアルワールドデータ(RWD)を用いた研究においては,仮説構築の段階で実データへのアクセスが制限されることが多く,解析プロトタイプの作成が困難である点や,倫理審査等のプロセスに多大な時間を要すること,分析手法の再現性の確保が長年の課題として指摘されてきました。
本取り組みによる合成データの生成,および国際的な共通データモデルへの変換は,仮説検証や解析工程の事前検討を大幅に効率化し,分析手法の標準化・再利用に貢献するものです。また,審査プロセスの迅速化と研究サイクル全体の加速が期待されます。本技術が研究基盤として定着し,エビデンス創出の加速に貢献することを強く期待いたします。
愛媛大学大学院 医学系研究科 医療情報学講座 教授 木村映善氏

本プロジェクトでは,NECおよびYuimediが保有する技術およびノウハウによりNDB合成データおよびFHIRデータから高品質なOMOPへの変換を実施できること,各リサーチクエスチョンを解析するコホート定義の作成および特徴量の可視化が実証されました。NDB等のオープンデータや情報連携基盤で提供されるデータをOMOPとして研究者が利用できるように統合することで,死亡情報や診療報酬制度などのデータ理解や前処理が削減されることに加え,OHDSIが用意しているGUIツールや解析パッケージを利用することで,解像度の高いデータを用いた効率よく再現性のある研究が実施可能となり,研究がより活発化されることを期待しています。
株式会社Yuimedi CTO 井上真吾氏

(注1)医療合成データ:実在の患者情報をもとに,AIが統計的特徴を再現した「架空のデータ」。実データ活用時に生じるプライバシー保護や利用許諾に伴う高コスト・長期間の課題を解消する。NECの知見と生成AIによる妥当性検証により,形式の異なるレセプトやFHIRデータの連結解析(突合)を短納期で実現。個人の特定リスクを排除しつつ,実際の研究プロセスを精密にシミュレーションできる高い統計的有用性を備えている。
 (注2)OMOP:電子カルテやレセプトなどの異なる形式の医療等データを共通化した国際的な規格であり,本規格へのデータ変換は国内の医療研究の促進だけでなく,国際的な共同研究への参加にも有効とされる。
 (注3)DPCデータ:DPC(診断群分類)制度の対象病院(主に急性期病院)が厚生労働省に提出する入院医療に関するデータ。入退院情報,診断名,手術・処置,使用された薬剤や検査,診療報酬点数等が含まれ,医療の質評価や医療提供体制の分析,医療政策立案に加え,医療ビッグデータとして研究分野での活用が行われている。
 (注4)処方FHIRデータ:医療情報交換のための国際標準規格「HL7 FHIR」に基づき,処方情報を構造化して表現した電子データ。FHIRは,厚生労働省が推進する電子処方箋管理サービスや電子カルテ情報共有サービスにおいて,医療情報連携の標準仕様として採用されている。
 (注5)本研究におけるOMOPへの変換データは,OHDSI(Observational Health Data Sciences and Informatics)が開発したData Quality Dashboardによる品質評価において,適合率98%を達成した。Data Quality Dashboardとは(1)構造的適合性,(2)完全性,(3)臨床的妥当性の3カテゴリにわたる24種類・約2,000項目以上のチェックを自動実行し,違反件数と割合を定量的に可視化するツールである。
 (注6)データ連結解析:データ連結解析とは,同一の個人や事象に対応する複数のデータセットを,共通の識別子や連結キーを用いて結合し,統合的に分析する手法を指す。

 

●問い合わせ先
NEC 官公インテグレーション統括部 BluStellar推進グループ,第六営業グループ
E-Mail:contact_si@gov.jp.nec.com

AI

NEC


TOP