Official Google Blog: A fall spring-clean
昨年Googleが買収した、機会学習を利用した「インテリジェントな人力検索」であるAardvarkはサービスシャットダウンされるそうだ。1年も経たないうちに終了とは、やっぱりGoogleはこのサービス自体に魅力があったわけではなく、あの開発チームに興味があっただけなんだね。
確かに最初は、機械学習と人の知識(キュレーションというバズワードが最近ついているが)を融合させるというアイディアは魅力的に思えたが、実際にAardvarkからくる回答依頼は、あまりにもばく然とした「コンピュータプログラミングを学ぶのに最適な本は何?」とか「1000mを泳げるようになるにはどうすればいいの?」とかで、それを見るたびに答える気をなくしていたからな。
要するに、あまりにばく然とした質問はコンテキストを共有できないので答えようがないんだよ。そして、そんなのは既存の質問サイトで十分だよな。AIとかデータマイニングとかの機械学習なんていらない。一方で、「このコードのバグが取れないんだけれど、どうして?」というような、Stackoverflowでよく見る高コンテキストの質問だって、全文検索があれば十分。機械学習などいらない。
結局、機械学習と人の知識の融合なんて、現状の技術では絵に描いた餅なんだよな。そこを割り切って、分野を狭く限定したエキスパートの人力検索だけに特化し、それをすごい勢いで横展開しているStackoverflowはやはりスゴイなということで。まとめると、「Aardvarkは機械学習の夢をみるか」は胡蝶の夢になりましたと。
(via kashino)
実はこういう「あまりにも漠然とした質問」を受ける機会が多いのでそういうものこそ自動化したいと前から思っていたのだった。その場合の問題がこの「コンテクストの共有」なのだな。質問が発せられる以前に質問者の持つコンテクストを回答者が共有していることが必要だ、と。腑に落ちる。
ということを考えると、上記のようなケースで機械学習にかけるべき元データは、「さまざまな人の発する質問と回答のパターン」ではなく、「ある特定人物の持っているコンテクストを読み取れるような何か」なのだろうな。その人が今やってる仕事の内容とか、日ごろから同僚にこぼしてる愚痴とか。そうやって特定人物にチューンしてコンテクストを学習していくことにより、「あれどうなってる?」というだけの質問にちゃんと答えてくれるマシーンが出来上がる… まあまだ数十年かかるか。
(via raurublock)
(via yaruo)