イベントレポート2019/11/28

AIによる情報発見エンジンセミナー

- 情報を本当の意味で活用するためのコグニティブ検索とは? - <パート2>

AIによる情報発見エンジンセミナー~情報を本当の意味で活用するためのコグニティブ検索とは?~

[読了時間:10分]

伊藤忠テクノソリューションズ株式会社(以下、CTC)は、2019年9月19日(木)、東京都千代田区のフクラシア丸の内オアゾにて、「AIによる情報発見エンジンセミナー~情報を本当の意味で活用するためのコグニティブ検索とは?~」を開催しました。

今回来日したSinequa社からは、コグニティブ検索・エンタープライズサーチプラットフォームSinequa プラットフォームの開発経緯から目指しているコンセプトについて発表がありました。アプリケーションのアーキテクチャについて、開発元ならではの厚みのある解説により、コグニティブ検索の魅力が存分に伝わってくる内容でした。そして、ライフサイエンス向けにセマンティック・ソリューションを提供するSciBite社からは、Sinequaとの連携ソリューションが披露されました。ライフサイエンス分野の用語認識を支援する連携ソリューションには、企業のお客様からの注目が集まりました。

今回は、上記2つの発表についてハイライトをお届けします。ぜひ、最後までお読みください!

コグニティブ検索・エンタープライズサーチプラットフォーム

「Sinequaプラットフォーム」のご紹介

Sinequa社創業当時からシステム開発を手掛けてきた、Manigot氏より、Sinequaプラットフォームの仕組みや特長、ビジネスでの活用シーンについて紹介がありました。

Manigot氏は、Sinequa の詳しい解説に入る前に、聴衆に向けて、企業におけるデータ活用の課題について問題提起しました。

昨今「データドリブン経営」や「データドリブンマーケティング」など、「データドリブン」つまりデータに基づいた意志決定のアプローチとして、多くの企業が取り組んでいます。

AIによる情報発見エンジンセミナー~情報を本当の意味で活用するためのコグニティブ検索とは?~

Sinequa
VP Global Operations
Luc Manigot氏

しかし、データドリブンのパラダイムには、課題があると考えています。
検索エンジンに、ユーザーが解決したい疑問に関するクエリを入力すると、大量のデータがヒットします。その後、データの解釈は全て人が行います。しかしこの解釈では、データの取捨選択や意味の考察などを行っていくため、疑問解決には多くの時間を費やすことになります。

また世の中のデータの大半を占めるのは、構造化されていない、非構造化データです。一般的に、データドリブンなアプローチで扱えるのは、構造化されたデータと考えられています。しかし、非構造化データも構造化して解釈できるようになれば、データそのものだけでなく、文脈も含めてより深い知見が得られるーこれはデータドリブンから進化した「インフォメーションドリブン」なアプローチです。

インフォメーションドリブンのパラダイムで独特なのは、事前に情報を処理してからユーザーに提示するということです。

AIによる情報発見エンジンセミナー~情報を本当の意味で活用するためのコグニティブ検索とは?~

Sinequaプラットフォームは、インフォメーションドリブンを具現化する仕組みとして開発されました。様々な情報ソースからデータを収集(①)、SinequaプラットフォームのAI(コグニティブエンジン)が情報を解読し、ユーザーが目的とする情報を分類(②)してから、ユーザーに提示します。単純なキーワード検索ではなく、ユーザーが求めるデータを類推して表示させるのは大きな特長となっています。そして最後はやはり人が意思決定をしますが、②の事前処理のおかげで、情報の認知(③)の負担がかなり軽減します。このように、データ解釈のスピードアップで生産性が向上し、また非構造化データに隠された知見を活用することで、よりよい意思決定に繋がります。

Sinequa社はSinequaプラットフォームのシステム構築を通じて、インフォメーションドリブンな組織への変革に貢献してきました。
それでは、Sinequaプラットフォームの内部構造まで詳しく解説します。
「Content(コンテンツ)」「Meaning(解釈)」「Learning(学習)」「Presentation(表示)」の主に4つの要素で構成されています。

AIによる情報発見エンジンセミナー~情報を本当の意味で活用するためのコグニティブ検索とは?~

先ずContent(コンテンツ)について、網羅的にデータ収集するためには、組織内外のあらゆるデータソースに接続しなければなりません。IT化が進むにつれ、各企業ではデータレポジトリや企業ソーシャルネットワーク、データレイク、社内ポータルCMS、メールシステムなど多種多様なシステムが運用されています。Sinequaプラットフォームは、180種類以上のデータソースに対応したコネクターを提供しています。このため対応しているシステムには、開発を必要とせず、容易にデータソースに接続できます。これはSinequaが持つエンタープライズサーチの機能に該当します。

次にMeaning(解釈)では、自然言語処理(NLP)を中心とした情報の処理を行いますが、なぜこれが必要になるのでしょうか。

自然言語処理(NLP)は、最初に言語を特定すると、文章の中で単語の品詞をタグ付けし、文章中で各単語がどのような役割をしているか分類していくことで、人の知能に近い解釈を行います。これにより、検索でユーザーは高精度なデータが得られます。

また自然言語処理(NLP)を用いる2つめのメリットは、非構造化ドキュメントを構造化できる点にあります。非構造化データの概念を抽出し、そのドキュメント固有に含まれる表現から、ドキュメントを特徴付けします。「このドキュメントでは何がいいたいのか?」「このドキュメントしか含まれない特徴的な情報ななにか?」「ユーザーが意図したクエリは含まないが、このドキュメントも恐らく役立つのではないか。」といった解釈が加わるので、ユーザーが欲しい情報を類推して提示することができるのです。
Sinequaプラットフォームの強みである“コグニティブエンジン”の中枢ともいえる、自然言語処理(NLP)のアルゴリズムには、長い年月を掛けて開発し続けてきました。

「Learning(学習)」では、機械学習と深層学習を組み合わせたアルゴリズムを活用しています。これは各コンテンツのデータをインデックス化し、コンテンツを整理することで、アクセス・検出しやすくなります。

「Presentation(表示)」は、文字通り、ユーザーが見やすい形でデータを表示させる機能です。Sinequaには、画面を構成するためのフレームワークが用意されており、ユーザーのニーズや好みに応じて画面を設計できます。

AIによる情報発見エンジンセミナー~情報を本当の意味で活用するためのコグニティブ検索とは?~

更に、外部サービスへのエンハンスメント機能があります。「Speech to Text」の活用では、音声をテキスト化することでSinequaプラットフォーム内で音声ファイルの検索を可能にします。SciBite社ライフサイエンス向けセマンティック技術の組み込みにより、ライフサイエンス用語の辞書として利用が可能です。

10年前、Sinequa社はニーズが熱かった「エンタープライズサーチ」市場に参入してみたものの、元来目指していたのは検索プラットフォームにとどまらない、企業のビジネスに重要なアプリケーションの提供です。

豊富なビジネスアプリケーションから、いくつか事例をご紹介します。
製薬大手AstraZenecaでは、医療文書と社内コンテンツを横断して検索する仕組みとしてSinequaを利用し、研究開発のイノベーションを加速させ、大きなROIを獲得しました。また国際法律事務所Skaddenでは、自社内の特定分野の専門家を探すという、エキスパート検索に活用しています。また携帯電話事業者SFRでは、全顧客データの360°ビューを参照できる仕組みを立ち上げ、コールセンター業務に掛かるコストを、3年間で$60M節減することに成功しました。

Sinequaプラットフォームのエンタープライズサーチを起点とした、コグニティブ検索の応用により、Sinequa社はまさに目指しいる、企業の課題を解決するアプリケーションへと発展を遂げ、運用されています。

Sinequa連携ソリューション「SciBiteのご紹介」

AIによる情報発見エンジンセミナー~情報を本当の意味で活用するためのコグニティブ検索とは?~

SciBite Japan
General Manager
John Bolger氏

AIによる情報発見エンジンセミナー~情報を本当の意味で活用するためのコグニティブ検索とは?~

SciBite Japan
Technical Sales Manager
Partrick Rummler氏

ライフサイエンス分野向けにセマンティック・テキストマイニング技術を提供するSciBite社より、SinequaプラットフォームとSciBiteプラットフォームとの連携ソリューションをご紹介しました。
SciBite社は、英国ケンブリッジに本拠地を置く企業です。近年日本でのビジネス拡大を図るため、国内にオフィスを構えて活動しています。また過去3~4年にわたり、全世界の製薬企業でSciBiteプラットフォームの導入が進み、テキストデータを活用しようという動きが活発になっています。このような活動の成果が評価され、今年、英国のビジネス分野で最も栄誉あるといわれるQuees’s Awardを受賞しました。

なぜライフサイエンスにテキストマイニングが重要になるか。製薬始めライフサイエンス分野で扱う用語には、シノニム(同音異義語)の種類が多いのが特徴です。人が文書を解読する際には、前後の文脈を理解することでシノニムを判別できます。しかし、文字をそのままデータとして処理するコンピュータが、意味を正しく理解するのは容易ではありません。そのため特定のキーワードで検索する際に、コンピュータがシノニムを理解して網羅的にデータを拾わなければ、不十分な結果しか得られません。

この問題を解決するために、SciBite社は、セマンティック技術によりライフサイエンスのオントロジーが定義された、ライフサイエンス向けのデジタル辞書を開発しています。例えば、ある遺伝子に対して効果を持つ薬剤、ターゲットなど、セマンティック技術で用語同士が関連付けられて格納されています。この技術は、一般的なテキストマイニングとは一線を画しています。テキストマイニング単体ではシノニムを認識できても、用語の関連性までは把握できません。しかしSciBiteのセマンティック技術をベースとしたソリューションでは、コンテキストを理解した検索が行えるため、より確実な情報を得ることができます。

AIによる情報発見エンジンセミナー~情報を本当の意味で活用するためのコグニティブ検索とは?~

ライフサイエンス用語のオントロジーと、Sinequaプラットフォームを連携させることで、製薬企業のユーザーは、独力で辞書を作成する労力が軽減するとともに、論文データベースや社内研究文書など複数のデータソースに対する網羅的な一括検索が実現します。更に多くのシノニムのなかから興味ある一つの用語に対して、とことん情報を掘り下げて知見を深めることができます。

このセミナーのイベントレポートはまだまだ続きます。ぜひ次回をご期待ください!

  • 記載されている商品名などの固有名詞は、各社の商標または登録商標です。
  • 掲載されている情報は、発表日現在の情報です。最新の情報と異なる場合がありますのでご了承ください。
  • 部署名、役職名、その他データは、イベント開催当時のものです。

Sinequaの詳細説明・御見積もり依頼を承ります
お問い合わせください

03-6417-6600受付時間:平日9:00〜17:30

お問い合わせフォーム

© ITOCHU Techno-Solutions Corporation