【イベントレポート】「水曜ワトソンカフェVOL.4 」

  • 2017/11/09

チャットボットや検索機能もWatsonで進化する。新たに追加されたWatson APIが切り開く可能性

「水曜ワトソンカフェ」vol.4  2017年10月23-24日開催

 

時には人間のクイズ王を打ち負かし、時には医者として新たな治療を提案、時にはシェフとしてレシピも考案する。様々な活躍をする「IBM Watson」は、日々のニュースに登場。実際のビジネスにおける課題解決のソリューションや、新たな事業創出を実現するツールとして、活躍の場を広げています。

IBM BlueHubとco-ba が共催する「水曜ワトソンカフェ」は、そんなWatsonのリアルな活用法を共有し合い、現状の課題や今後の可能性について議論し合うサロンイベントです。

毎月第4水曜日にco-ba shibuyaで開催していたイベントを、第4回目は10月23日から25日に開かれた「イノベーションリーダーズサミット」にて2日に分けて出張開催されました。

1日目の登壇者は、Watsonの企業導入支援を行っているITエンジニア兼ITコンサルタントの井上 研一さん。2日目の登壇者は、UXデザイナー兼エンジニアとして活躍されているインフォメーションアーキテクトの羽山 祥樹さんでした。

井上さんは企業へのWatsonの導入支援やセミナーを行い、羽山さんWatson APIを用いてウェブサービスの開発などに携わっています。日頃からWatson APIを使いこなすお二人が、最近Watsonに加わった機能とその可能性について語ってくださいました。

Watsonは「AI的機能をアプリに組み込むためのパーツ」

1日目に登壇したのは、第一回目のワトソンカフェにてコールセンターへの導入について話してくださった井上さん。まず、「AI」に関連するプロダクトの中で、Watsonのどこが特徴なのかを具体例とともに紐解いていきます。

井上さんは、Watson APIを「AI的機能をアプリに組み込むためのパーツ」と定義しているそう。”AI的”とは、具体的にどういうことなのでしょうか。

与えられた情報を『処理』するのではなく、情報を『理解』するのが大きな特徴です。例えば、WatsonのAPI『Speech to Text』では聞いた音がどのようなテキストであるかを、『Visual Recognition』では見えているものが何なのかを理解できます

コンピューターが「処理」のみを行う場合、人間は事細かな手引き書を用意し、手取り足取り何を行うべきか指示する必要がありました。Watsonでは、どのような処理が適切なのか、そのために注目すべき情報を自ら「理解」してくれるのです。

こうした「AI的」な特徴を備えた「多数の機能が単一のプラットフォーム上で提供されている」点も、Watson APIの魅力だと井上さんは語ります。利用できるAPIの数も増えており、IBMのアプリケーション開発プラットフォーム「IBM Bluemix」にユーザー登録すると、11月現在で12個のWatson APIが利用可能です。

新たに登場したWatson Discoveryで何ができるか

Watson APIでは定期的にラインアップが追加されています。通常、最新のAPIは英語のみで提供が開始され、日本語化への対応が行われます。井上さんは、新たに日本語化されたAPI「Watson Discovery」を挙げ、その「コグニティブ検索機能」について説明してくださいました。

コグニティブ検索とは、入力した文章の「意味」にもとづいてデータを取得するのための機能。通常のキーワード検索では、テキストの文面に合致するかをもとに情報を並び替えるため、人間はスペースで区切って適切なキーワードを入力する必要がありました。しかし、コグニティブ検索は、文面だけでなく「意味」を判断するため、人間が話し言葉で打った質問い適切な情報を返してくれるのです。

コグニティブ検索機能を持つWatson API「Watson Discovery」では、入力したデータを適切な形に変換し、「自然言語照会」機能でどのような質問なのかを抽出。そこから質問に合致する情報を返すために、デフォルトで設定されたデータセットに問い合わせを実施します。

「利用できるデータセットの一つが『Watson Discovery News』。英語のニュース記事やブログが毎日およそ300,000 件以上更新されているデータセットです。

例えば『この前の衆議院選の結果ってどういう結果になると思われてるのかな?』と会話形式で検索すると関連するニュースを返してくれます

井上さんは「Watson Discovery」をアプリやサービスに利用する場合、「自分たちで訓練データを準備するのが大切」だと強調します。

『この質問には次のような内容がマッチする』と覚えさせ、機械学習を繰り返すことで、より自分たちにとって使いやすい形に鍛えていけるんです。

これによりアプリやサービスを他社と差別化することも可能になるでしょう。例えば、特定の分野に関する検索が行われる場合は用語の定義を教える必要がありますし、サービスによってユーザーがよく使う言い回しも違うかもしれません。そうした独自のデータを元に適切な回答を学習させていくこともできるでしょう

コグニティブ検索で何ができるようになるのか

質疑応答では、「コグニティブ検索を行う『Watson Discovery』が検索の主流になるのか」など、その可能性に期待する声が挙がりました。井上さんは従来のキーワード検索に対する強みを説明します。

Googleのような強力な検索をDiscoeryが代替することはないでしょう。先ほど述べた通り、『Watson Discovery』は自社のデータをベースにカスタマイズするものだからです。

そのため、簡単な回答は一般的なキーワード検索で、より専門性の高い質問はコグニティブ検索といったように併用する仕組みが今後広がっていくかもしれませんね

また、「社内のシステムにWatson APIを導入するメリット」については、従来の方法に比べると少ないデータでも一定の結果を出せる点を挙げました。

「学習データの準備は重要ですが、ある程度のデータがあれば検証を始められるのは大きなメリットでしょう。通常、アルゴリズムを一から作る場合、大量のデータが必要ですから。

ただし、注意すべきなのは、Watson APIは基本的に従量課金制である点。検証を重ねた結果、大規模に導入することになった場合、その前にはどれくらいの成果が出そうかをシビアに検証する必要があるでしょう

日本語化したWatson APIでアイドルのかわいさを伝える?

2日目に登壇したのは、UXデザインやエンジニアリング分野の専門家として多数のウェブサイト制作に携わってきた羽山 祥樹さん。前回はTwitterの投稿文を元に奥様との相性を分析した際の経験を話してくださいました。

羽山さんが前回の登壇から今回までの間に新たにチャレンジしたのは、アイドルグループ「BiSH」のメンバーを「かわいい」とWatsonに認識させること。まず、羽山さんは試みのきっかけとなった、「Watson Knowledge Studio」と「Natural Language Understanding」について紹介してくださいました。

「Watson Knowledge Studio」とは、専門的な文章の解析に必要な学習データを作るアプリケーション。同アプリを利用することで、単語の属性や単語同士の関係性をコーディングなしで定義できます。「Natural Language Understanding」は、重要なキーワードを抽出し、どのような話題について語られているかを理解するAPIです。今年の9月に日本語版APIが提供開始されました。

「例えば『Natural Language Understanding』に、日本語で『ワトソンがIBMを創業』と入力すると、『ワトソン is 創業者 of IBM』というデータが得られます。『創業者』や『IBM』といった重要な単語を抽出し、『ワトソンがIBMの創業者である』という単語同士の関係を理解する。

『Watson Knowledge Studio』で専門的な単語を学習させた上で、そのデータを『Natural Language Understanding』に流し込めば、専門性の高い日本語からも重要な単語や単語同士の関係を読み解けるのではないかと考えています」

Watson APIを使って推しアイドルを認識させるまで

「Watson Knowledge Studio」と「Natural Language Understanding」で挑戦するのは、アイドルグループBiSHのメンバー「チッチ」が「かわいい」とWatsonに認識させること。あえて、チッチが人名だとあらかじめ学習させず理解させようと試みます。

まず、羽山さんは学習データの作成を行います。ファンのツイートのテキストデータ150件をインプットし、単語の種類、ラベルを追加していきます。

『Watson Knowledge Studio』では単語のラベルづけを自分で設定できます。今回はアイドルグループに特化した解析を行うため『HAIR_STYLE』や『SONG』といったラベルを設定、単語の意味に合わせてラベルを手動で加えていきました。この単語とラベルのセットを『エンティティー』と呼びます

ラベルづけが終わったら「Natural Language Understanding」にデータを流し込みます。まずは人名だと事前に学習させたBiSHのメンバーで検証します。「アユニがかわいい」という文章からは、「アユニ」と「かわいい」の二つの単語を正しく抽出し、前者が「PERSON」後者が「EMOTION_PRETTY」という情報を返してくれました。

しかし「チッチがかわいい」を認識させると「かわいい」は抽出される一方、「チッチ」という単語は認識されません。

(単語の意味を順に色でラベルづけをしていく)

 

そこで、羽山さんは「〇〇がかわいい」という構文において、「かわいい」の前に置かれる単語は人名だとラベルづけしたデータを大量に入力します。

「大量の入力をすると、猫や教えていない名前も人として認識するようになりました。一方、チッチだけは人名として認識してくれませんでした。

そこで『チッチちゃんが可愛い』と教えると、『チッチちゃん』が人名であると認識し、『かわいい』も正しく理解しました。おそらくチッチという単語が人名であると予測できなかったのだと思います」

しかし「ちゃん」がない状態で人名であると理解させたい羽山さん。「Watson Knowledge Studio」のリレーション機能を用いて、エンティティーの関係性を定義しました。今回であれば「isPretty」という関係を作成し、「チッチ」と「かわいい」の間に付け加えます。

リレーションを学習させた後に再度「チッチがかわいい」と入力すると「チッチ」が人名であり、「かわいい」という属性を持っていると認識しました。

羽山さんは「今回開発したWatsonは他の用途には全く使えないでしょうね」と笑顔で語りつつも、分野に特化した学習データを作れる点が「Watson Knowledge Studio」の大きな魅力であると締めくくりました。

Watson Knowledge Studioでよりパワフルなチャットボットへ

質疑応答では「Watson Knowledge Studio」をチャットボットの開発に作成できないかという質問も挙がりました。

羽山さん曰く、現在チャットボットの開発によく使われる Watson APIは「Natural Language Classifier」と「Retrieve and Rank(現在は非推奨)」だそうです。前者は短いテキストの大まかな意味を返し、後者は全文を検索して関連度の高い順にランクづけする機能。羽山さんはこの二つと「Natural Language Understanding」の違いについて次のように考えています。

例えば『Natural Language Classifier』の場合は短い文章を解析し、あらかじめ学習させた意味に対して関連度を返してくれる仕組みのため、質問を限定する必要があります。例えばピザを注文するチャットボットなら『サイズは?』や『具は?』と順番に一つ一つ聞くボットが多いはずです。

一方、「Natural Language Understanding」でピザに関する単語を大量に学習させれば、『Lサイズのピザをふかふかの記事でソーセージを載せてください』と最初の一文からテキストの意味を一気に取得できます。チャットボットでより高度なやり取りが可能になるでしょう

お二人のお話からは、新たに追加されたWatson APIが身近なアプリやサービスをより便利にアップデートする可能性を秘めている点、その性能を最大限に活用するには目的に合わせた学習が不可欠である点が伺えました。

「Watson Discovery」を用いた検索機能や「National Language Understanding」を使ったチャットボットでは、より複雑な文章から「意味」を読み取り、私たちにより精度の高い情報を返してくれるようになるでしょう。特定の目的に特化したデータ学習を行えばその精度はより向上していきます。

Watson APIのラインナップは常に変化を続けています。具体的に何が変わったのか、そしてどのような可能性があるのかを知ることから、新たなアプリやサービスのアイディアが広がっていくのかもしれません。

Text:Haruka Mukai


<登壇者>

■井上 研一 氏(aka inoccu)

東京都中野区に住むITCA認定ITコーディネータ、ITエンジニア。現在も開発の現場に立ち続けるほか、執筆・セミナー・研修など行っています。2016年10月に書籍「初めてのWatson APIの用例と実践プログラミング」、2017年7月に「ワトソンで体感する人工知能」を刊行。中野を中心としてIoT+AIもくもく会も主催。

 

■羽山 祥樹氏(インフォメーションアーキテクト)

使いやすいウェブサイトを作る専門家。担当したウェブサイトが、雑誌のユーザビリティランキングで国内トップクラスの評価を受ける。専門は人間中心設計(HCD)、ユーザーエクスペリエンス(UX)、情報アーキテクチャ(IA)、アクセシビリティ。HCD-Net認定 人間中心設計専門家。CNET Japanブロガー。また、大規模CMSや人工知能のエバンジェリストも努める。

 

次回「水曜ワトソンカフェ」は、2017年11/29(水) 19:30~開催

詳細▶︎https://www.facebook.com/events/510474619314060/

水曜ワトソンカフェとは

「IBM BlueHub」×「co-ba」で共催するサロンイベントです。

毎回、第一線で活躍する2名の登壇者をお呼びし、Watsonの活用方法や事例についてのプレゼンを行います。その後、参加者も加わったディスカッションの時間も設け、Watsonへの理解と多様な活用方法を共有していきます。Watsonについてまだ深く知らない人、すでに使っているユーザー、これから事業に活用していきたいCEO、CTOなどのスタートアップを率いるリーダーにとっても、Watsonの使い方や活用事例、新しいアイデアのためのヒントを得るができるイベントになっています。