CTCのライフサイエンス情報サイト LSTech

  • Home
  • 特集・コラム
  • ICH M7ガイドラインFAQ集
  • FDAの発表者は、(Sarah Nexusの)トレーニングセットには、(Derek Nexusの)Alertには関連性がないが、Ames試験で陽性を示すExample化合物が含まれている可能性があることに言及していました。そこで、これらを除外してからSarah Nexusで2回目の予測を実行することは可能ですか?また、Sarah Nexusで最も明らかに関連性のないAlertを除外することは可能でしょうか? 例えば、関連性のないAlertを含む5つのトレーニングセットのExample化合物が含まれているが(つまり5つの関連Example化合物がある)、これら5つのExample化合物を除外できる場合、予測にどのような影響があるかが分かりません。

ICH M7ガイドラインFAQ集 ~Lhasa社のエキスパートがあなたの疑問に答えます!~

FDAの発表者は、(Sarah Nexusの)トレーニングセットには、(Derek Nexusの)Alertには関連性がないが、Ames試験で陽性を示すExample化合物が含まれている可能性があることに言及していました。そこで、これらを除外してからSarah Nexusで2回目の予測を実行することは可能ですか?また、Sarah Nexusで最も明らかに関連性のないAlertを除外することは可能でしょうか? 例えば、関連性のないAlertを含む5つのトレーニングセットのExample化合物が含まれているが(つまり5つの関連Example化合物がある)、これら5つのExample化合物を除外できる場合、予測にどのような影響があるかが分かりません。

原文:
https://www.lhasalimited.org/Default.aspx.ShortcutID-574939.faq_id-1236.htm

回答

毒性に関与しないフラグメントでも、予測結果が陽性となってしまう可能性があることは、統計的アプローチのリスクとして広く認識されております。そのためFDAの発表者は、このような予測が起こる領域では、専門家の知見が、異議申し立てしルールを乗り越えられると認識していました。

この問題は良く知られているため、Sarah Nexusを設計する際に、モデル構築に再帰分割ステップを組み込んでいます。このプロセスでは、トレーニングデータセット中の最も強い突然変異誘発性フラグメントが同定されると、そのフラグメントを含む陽性化合物は、他のフラグメントへの活性の関連付けには使用されなくなります。最も活性が強いグループからスタートし、全てのフラグメントが考慮されるまでこのプロセスが繰り返される前に、サポート化合物が除外されます。このアプローチは、モデルがフラグメントが活性があると誤った判断をしてしまう潜在的リスクを有意に減少させます。

しかしながら、最終的にこのアプローチがどれほど成功するかはトレーニングデータセットにより決まります。例えば、2つのフラグメントが常に一緒に存在し、陽性化合物でのみ見られる場合、モデルはこれらフラグメントの一方または両方が活性の原因になっているかどうかを判別することはできません。このような問題を解決できる統計モデル構築のアプローチは存在しませんが、エキスパートシステムでは、追加のナレッジを適用することで、妥当な判断を下せるようになります。

統計モデル構築のアプローチに再帰分割ステップが含まれていない場合は、トレーニングセットからExample化合物を手動で削除し、モデルを再構築して再度予測することも可能です。 最近、我々は「ブラックボックス」な統計モデルの解釈をサポートする類似アプローチについて記述した論文を発表しました。

Sarah Nexusは、偽陽性のフラグメントが学習されてしまう可能性を大幅に低減し、化合物分子のどの部分が活性と予測された原因であるかを示し、手動による検証に役立つトレーニングExample化合物を提供しています。しかし、手動によりトレーニングExample化合物を除外し、モデルを再構築・再実行する機能は装備しておりません。これを許可してしまうと、もはや検証済みモデルが使用されていることにはならず、どのトレーニング化合物が除外されたか否かにより、異なるユーザーが異なる回答を得る可能性が出てしまうからです。

より望ましいアプローチ(及びFDAの発表者によって推奨されるアプローチ)は、モデルによる予測とサポート化合物を提示し、トレーニング化合物のいくつかがなぜモデルを誤解させたのか、なぜオーバープレディクトになってしまったかについて、エキスパート分析が表示されることです。

これに近づける方法の1つとして、Sarah NexusからDerek Nexusにトレーニング化合物を予測実行することです。それにより、Sarah Nexusが陽性を呈したのとは異なるAlert(根拠)が得られれば、それらのExample化合物を除外して予測することが合理的となります。

関連ドキュメント
https://jcheminf.springeropen.com/articles/10.1186/1758-2946-6-8

免責事項

PageTop