• ホーム
  • AI(人工知能)
  • AIに必要とされる透明性と説明可能性【後編】 すべての組み合わせを網羅して特徴を見つける Wide Learning™

AIに必要とされる透明性と説明可能性【後編】 すべての組み合わせを網羅して特徴を見つける Wide Learning™

メインビジュアル : AIに必要とされる透明性と説明可能性【後編】 すべての組み合わせを網羅して特徴を見つける Wide Learning™

前回お伝えしたように、人工知能(AI)は2019年6月末に開催された20カ国・地域首脳会議(G20大阪サミット)でも話題になるほど、世界中で注目の技術です。まだまだ実際の業務にAIを取り入れているという企業は少ないでしょう。ただし近い将来、当たり前のようにAIに判断を任せるシーンが増えてくるのは間違いないといえそうです。

そしてよりAIが身近になるほどAIが下した判断に根拠が必要になります。第22代九州大学総長で発見科学の第一人者である有川 節夫教授はこのように語ります。「今までは、AIが話題性のある結果を出すことだけで満足していました。このような時代はもう終わりです。これからはAIが下した判断と同時に根拠を示さなくては、人々は納得しなくなるでしょう」。

有川教授の言葉を裏付けるように、AIが下した判断に対して説明を可能とする研究、すなわち「説明可能なAI(Explainable AI、XAI)」の研究が世界各国で盛んに行われています。今回は、「第3次AIブーム」の立役者である「ディープラーニング」とは全く異なる技術「Wide Learning™ (ワイドラーニング)(注1)」を紹介します。Wide Learning™ の最大の特徴は、判断の仕組みが分かる学習モデルを備えていることにあります。

(注1)Wide Learningは富士通株式会社の商標です

すべての組み合わせを検証するのがWide Learning™

全ての組み合わせを網羅し特徴を見つけるAI- Wide Learning™

ディープラーニングは、コンピューターが膨大なデータを自ら学習し、自律的に答えを導き出すというのが最大の特徴です。データがあれば、面倒な学習作業を自律的に実行できるため、世の中で広く使われ始めました。その一方で、コンピューターが、なぜその判断がされたのかが極めて分かりにくく、「ブラックボックス」の中で決定が下されている印象を与えていました。

一方、Wide Learning™ は、どのようにAIが判断したのか、その仕組みが明確に分かるという特徴を持ちます。どのようにして結論を導き出したのかが分かるので、そのプロセスをたどることで判断の根拠を人が説明できるのです。この特徴を持つため、ブラックボックスとの対比で、ホワイトボックスAIと呼ばれています。

では、Wide Learning™ はどのようにして判断を下しているのでしょう。

Wide Learning™ は、データが複数の項目を持つことを前提としています。そして、それらの項目をあらゆるパターンで組み合わせて、その中から関連の高い組み合わせを抽出することで、判断の根拠が明示されます。

図 : 図:Wide Learning™ とは

図:Wide Learning™ とは

例えば、ある商品の購入、未購入に関する顧客データが1000人分あったとします。一人ひとりの顧客に関しては、「性別」「免許の有無」「結婚の有無」の三つの項目が情報として設定されていたとします。このとき、パターンの組み合わせは、「性別×免許の有無」や「免許の有無×結婚の有無」といった二つの項目の掛け合わせもありますし、「性別×免許の有無×結婚の有無」といった三つの項目の掛け合わせもあります。このあらゆるパターンの組み合わせを考慮して、購入・未購入を支持する組み合わせを抽出するのがWide Learning™ です。

ここで「男性×免許所有」の組み合わせが100人いて、この100人のうち商品を購入した人が60人だったとします。この場合、購入に至った割合は60%です。さらにもう一つの項目を掛け合わせて「男性×免許所有×既婚」として、この組み合わせが10人いたとします。この10人のうち商品を購入した人が9人ならば、購入に至った割合は90%になります。

この一つひとつの組み合わせが「仮説」となり、このうち一定以上のヒット率があるような重要な仮説を「ナレッジチャンク」と呼びます。上記の例でいえば、「男性×免許所有」の60%と比較して、「男性×免許所有×既婚」の90%の方が重要な仮説となるわけです。また、仮説は未購入の顧客データにも当然あり、例えば「男性×免許未所有×未婚」の組み合わせの人が20人いて、このうち18人が未購入であれば、これも未購入という観点からは重要な仮説となります。

このようにWide Learning™ では、すべての仮説を漏れなく検討し、そしてナレッジチャンクをすべて抽出します。そしてその中からこれまで人間では想像できなかった新たな仮説を発見します。このような判断方法なので、どの組み合わせの影響が高かったのかを容易に人が説明できることになります。

Wide Learning™ の原点は「発見科学」

1980年代に訪れた「第2次AIブーム」は、専門家の知識をルールとして詰め込んで問題を解決していました。専門家の知識がルールですから説明はできますが、ルールを詰め込むのにコストと時間がかかり、それがハードルとなってブームは終えんを迎えました。一方、Wide Learning™ は判断が分かるという点で、ルールベースのAIと考え方は同じです。膨大な仮説を高速で計算する高度なアルゴリズムを開発したことが、Wide Learning™ を身近なケースに適用可能とするカギとなりました。

図 : 図:天文学的な組合せを超高速に計算

図:天文学的な組合せを超高速に計算

例えば、前に挙げた例のように項目が三つしかないのであれば、仮説の数は「2+4+8」通りしかありません。一方で、項目が100個あったとするとどうでしょう? 100項目の組み合わせを考えるとなると2の100乗、すなわち1000兆をはるかに超えた想像すらできない数字となってしまいます。このような組み合わせでも、富士通が開発したアルゴリズムであれば数秒で調べられます。

Wide Learning™ は「発見科学」といわれる研究分野を発展させたものです。科学的発見については1900年代と古くからから研究されており、コンピューターがない時代から学者の間では取り組まれていました。ただし、以前はすべての組み合わせを検討できるわけではなく、ある程度領域を限定して仮説を検討せざるを得ませんでした。

発見科学の提唱者である有川教授は、Wide Learning™ の効用について、以下のように語ります。「以前だったら、すべての仮説を検討できないので、どこかで仮説の検討を止めるしかありませんでした。捨てざるを得ない仮説があるので、研究者としてはためらいながらも捨てるしかありません。Wide Learning™ では、すべての仮説を検証できるので、そのようなストレスから解放されるのです」。

写真 : 放送大学学園理事長・九州大学名誉教授 有川 節夫教授

放送大学学園理事長・九州大学名誉教授 有川 節夫教授

データが少なくてもAIの導入を可能にする

Wide Learning™ の特徴は、説明が可能な点だけではありません。データが少なくてもそれなりの精度で判断できるのも特徴の1つです。前述したように、たとえデータが少なくてもデータに設定された項目が複数あれば、その項目同士をすべて掛け合わせて判断対象とするのがWide Learning™ 。このため、データが数十件程度しかなくても、判断が可能となります。

データが少なくても導入が可能であるために、特にAIの導入時にはそのハードルを下げてくれます。ディープラーニングは、自律的に答えを導き出すために、大量のデータを収集するというのが前提となります。このため、導入するためには、まずディープラーニングに必要とされる綺麗なデータを揃えるところから始めなくてはなりません。その点、Wide Learning™ はとりあえず手持ちのデータから始めることができます。

まずは手持ちのデータでAIによる検証を始める。そしてデータが溜まってくれば、より精度の高い検証ができる。そんな使い方ができるのも、Wide Learning™ の特徴です。

どうしたら購入してもらえるか? 次のアクションが考えられる

このようなWide Learning™ が活躍できるシーンにはどのようなものがあるのでしょう? まず考えられるのがマーケティング分野での活用です。ある商品に関して過去の購入の有無の実績データを分析すれば、高い確率で購入が見込めるセグメントを予測できます。先の例でいえば、購入に至った割合の高い「男性×免許所有×既婚」に合致するセグメントを狙うことが重要であるとわかります。

さらに一歩進めて、「予測」から「アクション」へと展開することもできます。例えば、先ほどの「男性×免許所有×既婚」(このセグメントの購入割合は90%)に加えて、「ダイレクトメールを送付」という項目が掛け合わさったナレッジチャンクが存在する場合、すなわち「男性×免許所有×既婚×ダイレクトメールを送付」の組み合わせの購入に至った割合がこれまでのデータでは100%だったとします。そうだとすれば、このセグメントには、ダイレクトメールを送付というアクションを積極的に行うことで、商品の購入割合はさらに高まることになります。

図 : 図:最適なアクションプランまで自動で抽出可能

図:最適なアクションプランまで自動で抽出可能

2019年9月にはWide Learning™ を拡張し、アクション抽出を自動化する技術を開発しました。上記のダイレクトメール送付の例は非常に単純ですが、実際には膨大な数のナレッジチャンクが存在するため、人間が一つ一つのナレッジチャンクからセグメントやアクションを考えることは現実的ではありません。本技術では、膨大なナレッジチャンクを自動で解析し、有望なセグメントを検出し、更にその有望なセグメントに対する最適なアクションの提示が可能になります。

このWide Learning™ は、マーケティングだけではなく、医療や製造の現場でも有効です。

これから先は医療の判断にもAIが多く利用されてくると考えられます。現在の医療では、治療の判断をAIに任せることはできませんが、AIの判断を参考にすることはできます。ただし、AIが判断した結果、例えばAIが「治療薬Aを飲みなさい」と判断したとしても、根拠がなければ患者はおろか、参考にしようとしている医師も、その判断を容易には受け入れられないでしょう。

Wide Learning™ では過去の治療の履歴から治療薬の分析ができます。例えば、「男性×喫煙×40代」で症状を患っている患者に、治療薬Aを投与することが飛躍的に症状を改善しているという実績があれば、医師は自信をもって進められますし、患者の理解を助けることができます。

加えて、製造現場では不良品の発生原因を探るのにも、Wide Learning™ の適用が有効です。製品は、いろいろな製造工程を経て、完成するのが一般的です。不良品は、生産初期ではどうしても発生してしまいますが、なるべく早くにその発生割合を少なくしたいところ。不良品が発生したときの各工程における項目をWide Learning™ で分析すれば、その要因を特定できる可能性があります。例えば、Aという工程の機械内の温度が50℃以上で作業し、続けてBという工程のプレス機の圧力が通常より5%以上高い状態で作業した場合には、不良品が多く発生する、といった発見ができるのです。

不良品は、発生するといっても、サンプルの数は少ないでしょう。その場合でも、いくつかのサンプルさえあれば、Wide Learning™ では不良品が発生する要因に迫ることができます。

図 : 図:Wide Learning™のマーケティング以外での活用例

図:Wide Learning™のマーケティング以外での活用例

2回に分けて、説明可能なAIに関して見てきました。AIが下した判断がブラックボックスではなく、根拠が示されることによって、AIのカバー領域は一層広がります。将来、多くの職業がAIに取って代わられるという論調が強く見られますが、そういった意味では説明可能なAIは、その動きを加速するものかもしれません。

ただし、いくら根拠が示されるといっても、AIが出した判断をそのまますっと受け入れられることばかりではないでしょう。先に紹介した医療判断のように命に関わるケースや、また多額の投資判断が必要なケースは、AIに「こういった理由だからこうしなさい」と指示されても、簡単には納得できないはず。そこには専門家の説明が必要となります。

そういった意味では、あくまでAIの判断は人間の判断を支援するものと割り切って考えた方がいいのかもしれません。例えば、これまで3人で相談して判断を下していたところに、4人目としてAIに参加してもらう。こんな形のAIの使い方が望ましいのかもしれませんし、このようなライトな使い方をWide Learning™ は可能とします。

著者情報
木村知史
日経BP総研 上席研究員

1990年慶應義塾大学理工学部機械工学科修士課程卒業、同年日経BPに入社。製造業のための総合情報誌「日経メカニカル」にて、主に先端の加工技術および生産管理システムの分野を取材・執筆。その後、CAD/CAMやSCMなど製造業におけるコンピューター技術の活用誌「日経デジタル・エンジニアリング」の創刊に参画。2008年1月、Webサイト「Tech-On!(現日経xTECH)」編集長。2012年7月、「日経ビジネス」編成長、2014年1月、同媒体のデジタル版「日経ビジネスDigital(現日経ビジネス電子版)」編集長。ビジネス関連のコンテンツを企画するとともにサイト運営やアプリ開発を先導。2019年1月、「日経ビジネス電子版」を企画・立ち上げ。2019年4月より現職。大手企業のコンテンツコンサルティングや「Beyond Health」等のメディアのコンテンツ企画を担当。