・「生物情報学分野における公開データベースや医療文献データベースを用いた学 習データとナレッジグラフ」を利用し、関係性が部分的にしか知られていないよ うな事象に関して、裏付けとなる根拠を探し出し、紐づけ可能であるかを検証。
・当該技術は、以下2つの技術から構成される。
1.推定結果の【理由】を説明する推定因子特定技術<DeepTensor> ・変異と疾患の関連性を推定
・あわせて推定因子を出力し、推定した関連性の理由を説明
−ゲノム医療応用のケースでは、18万件の疾患系変異データから学習
2.推定結果の【根拠】を説明する根拠構成技術<ナレッジグラフ> ・入力から推定結果に至る「根拠」をナレッジグラフで構成。
(変異から疾患に至る、医学的に裏づけされた根拠を構成)
−ゲノム医療応用のケースでは、医学論文1,700万件等から100億を超える知識を構築。
・推定対象の遺伝子変異(図W.4)に関して、推定結果に大きく影響した複数の因子とナレッジグラフから取り出した医療文献などからなる学術的な裏付けとなる根拠および疾患の候補を同時に確認。
・上記技術を活用することにより、がんのゲノム医療判断期間を、2週間から1日に。

出典:「G検定公式テキスト第2版」読者WEB特典(翔泳社・2021年)より