新しいものづくりがわかるメディア

RSS


アジアのMakers by 高須正和

デザイナーが設計した振る舞いで、AIがコンテンツを作る——アリババの試み

TAG

AI

2019年3月7日~17日、アメリカのテキサス州オースティンで開かれたカルチャーフェス「SXSW」(サウス・バイ・サウス・ウェスト)において、中国でECサイトを運営するアリババのポール・フー博士は、「AIがコンテンツを自動生成する前提のUIデザイン」について語った。パソコンに比べ画面の小さいスマホや、そもそも画面の存在しない対面での利用者に対しては、パソコンよりも場面に合ったインターフェースを用意する必要があり、AIがさまざまな状況に応じてコンテンツを自動生成することで最適化ができる。デザイナーの役割はAIをディレクションすることに変わりつつあるという内容だ。実際にアリババのECサイトで行った実験では、14日間で1000万円を超える売り上げ増をもたらしたという。

パソコンを使えない人相手のデザイン

SXSWでは、さまざまなAIに関するセッションが行われたが、多くのセッションで語られるAIは、それぞれ定義の違うふわっとしたものが多かった。そのなかで、アリババのユーザーエクスペリエンス部門でシニアディレクターを務めるポール・フー博士の発表「ナチュラルユーザーインターフェースを再定義する(Redefine Natural User Interaction)」は、「AIと人間のデザイナーが協働することで、これまで対応できなかったより多くの利用者を相手にする」というSF的なテーマだが、紹介された事例は極めてテクニカルで具体的なものだ。

SXSWに登壇したポール氏。アリババのユーザーエクスペリエンス部門でシニアディレクターを務めている。 SXSWに登壇したポール氏。アリババのユーザーエクスペリエンス部門でシニアディレクターを務めている。

ナチュラルユーザーインターフェースとは、たとえば受付と音声で会話したり、メニューを指で選んだりなど、より「コンピューターっぽくない、自然な(人間らしい)」動作でコンピューターを操作する事を指す言葉だ。ポール氏はアメリカの大学で博士号を取得した研究者だが、SXSWは学会ではないので、まずビジネス上のゴールから話を始めた。

「アメリカに100万都市がいくつあるか知っていますか? そう、10都市。ここオースティンは95万人で、11番目の大きさですね。ところで、中国には167の100万都市があります」と、中国のサイズで開場をあぜんとさせたポール氏のトークは、「中国でキーボードやマウスでコンピューターを使えるユーザーは1.7億人、スマホを使えるユーザーは7億人、人間のように相手できれば、14億人すべてが市場になります」と、技術で商売できる相手が広がることの価値とゴールを、分かりやすく説明する。

コンピューターを自在に使える人は限られているが、スマホユーザーはより多く、ナチュラルユーザーインターフェースになるとほぼすべての人を対象にできる。だが、実際に機械の接客が人間の接客に取って代わるには、たとえば音声での受け答えや、顧客の反応に応じて出す情報を変える、専用の機械を設計するなど、さまざまな技術が必要になる。ポール氏の仕事は、そうした技術を統合してデザインし、パソコンが使えない利用者にも快適な体験を研究/提供することだ。

今回のトークでは「スマホユーザーにあった動画を製品ごとにAIが大規模に自動生成し、スマホサイトでの購買率を上げる」というプロジェクトを紹介した。動画そのものはAIが自動生成するが、どのようにAI自動生成の仕組みを駆使し、どういう体験をユーザーに与えるかという全体のディレクションをポール氏たちが行っている。

意思決定やデザインなどの人間側の技術と、ビッグデータや通信といった機械側の技術を統合してゴールに向かうことを示す、ポール氏の仕事範囲を示すスライド。 意思決定やデザインなどの人間側の技術と、ビッグデータや通信といった機械側の技術を統合してゴールに向かうことを示す、ポール氏の仕事範囲を示すスライド。

実験2週間で1000万円以上の利益を生む

具体的に行われた大規模なAIの活用実験として、アリババが運営するECプラットフォーム、タオバオ(淘宝)での試みを紹介した。タオバオの利用者はスマホからの利用が多い。スマホの画面はパソコンに比べて狭いので、たくさんの商品写真や説明文を何度もクリックして詳細に見るのには向かず、1分以下の短い動画で紙芝居のように見せるほうが購買率は高い。ところが、商品ごとに動画を人間が作るのはかなりの手間で、そこから得られる売り上げに見合わない。うまく情報を抽出し、整理して見せるのは、これまでは人間の仕事だったが、膨大な製品ごとに人間のデザイナーがその整理を行うのは、ソロバンに合わないのだ。もしも、人間が作るのと遜色ないクオリティの動画をAIで自動生成できれば利益につながる。そこでポール氏のチームは、AIにどうやって動画を作らせ、どうユーザーに見せるか、一連の実験を実際の顧客に対して行った。

AIを使って製品のサイトから動画を自動生成する。 AIを使って製品のサイトから動画を自動生成する。

実際に動画生成の手順こうだ。

  1. まず、商品ページの内容をアリババのAIプラットフォーム「Alibaba Wood」が読み取り、写真を収集し、説明のテキスト文や製品のカテゴリからなんとなくの雰囲気を取得する。同じ衣服でもスポーティなもの、男性用、女性用などはこれで取得できる。また、写真のサイズや位置から、写真ごとの重要性も把握できる。
  2. 取得した雰囲気に合わせて音楽データベースからBGMを取得する。併せてAIがBGMからテンポやビート、サビの情報などを解析する。
  3. BGMのビートにあわせて、写真を紙芝居的に差し替えることで動画を作成する。

1~3はコンピューターが自動的に行うので、複数の動画を作ることもできる。タオバオでの実験では実際に複数の動画を生成して、店舗主が差し替えることも可能にしている。いわゆる紙芝居のような動画だが、これまではそうやって自動生成された多くの動画が見るに堪えずユーザーがスキップするものばかりで、効果をもたらさなかった。今回の試みは、サイト内でのサイズや位置から画像の重み付けを行い、製品説明のテキスト文などから雰囲気を合わせて音楽をマッチングし、マッチングした音楽のビートに合わせて動画を生成することで、「スマホでスクロールしながら製品情報を細かく見るよりは、この動画の方が便利だ」とユーザーに支持されるところまでエクスペリエンスを高めているのが、今回の実験の価値だ。

実際の顧客を相手にタオバオで行われたこの実験では、運営側から見て、こうした動画を人間が作ることに比べて90%のコスト削減をもたらした。ユーザー側から見て、カートに入れる率が50%、最終的なコンバージョンレートも36%上がった。結果として、2週間の実験で70万人民元(1元16円として1120万円)の売上増をもたらしたという。

2週間の実験で1000万円以上の売り上げをもたらした 2週間の実験で1000万円以上の売り上げをもたらした

AIの仕事環境を作るのがデザイナーの役割

この事例以外にも、ポール氏は視覚障害者に対してAIがコンテンツを読み上げるインターフェースや、ファストフードの受付でタッチパネルとスマートスピーカーを組み合わせるなど、いくつもの事例を紹介した。

AIを利用したすべての事例で強調していたのは、AIは個別の最適化をスケーラブルに行えるので、AIが活躍できる場所をデザインするというアプローチの強調だ。コンテンツの抽出や再配置は人間のデザイナーが得意とする仕事だが、スケーラブルではない。手作業でやっているかぎり数に比例してコストもかかり、大規模サイトで全体に適用する今回のようなケースには向かなくなる。クラウド上で動くAIは、そうした作業をスケーラブルに行える。そのためにうまくAIが活用できる場所と条件を整理し、全体のユーザー体験を設計するディレクションを、ポール氏はデザイナーの新しい役割と呼んでいる。いわば、かつてデザイナーが行っていた仕事をAIが行い、AIがうまく働けるように全体をディレクションしていく役割が、新しいデザイナーの仕事になりつつある。

中国とAIというと、メディアでは監視社会的な側面が強調されることが多いが、民間企業でのAI活用はほとんどが今回の発表のように、これまで不可能だったことをコンピューターとデータの力で可能にし、価値を生んでお金に換えていく形で試行錯誤を重ねている。

SXSWでは毎年、世界的に有名なデザイナーのジョン・マエダ氏がデザインのトレンドを発表することに注目が集まる。2019年のトレンドでは「中国などで進んでいる、AIのデザインの活用は注目すべきだ。僕らが恐れがちなのはよくない」と、こうした取り組みについても触れられた。

これまで不可能だったことをどうやって可能にしていくか、開発する人や国にかかわらず、そうした技術の進歩についてこれからも注目していきたい。

ニュース

編集部のおすすめ

連載・シリーズ

注目のキーワード

もっと見る