Googleは、Apple傘下の音楽認識アプリShazamに倣い、ハミングで歌った曲を認識する検索機能を導入しました。しかも、正確な音程でハミングする必要もないようです。上級副社長兼検索責任者のプラバカール・ラガヴァン氏が書いたブログによると、「Hum to Search」は他のいくつかの新機能とともに、GoogleがAI技術を使って検索機能を向上させる数少ない方法の一つだそうです。しかし、いくつか懸念点があります。「Hum to Search」の精度(ネタバレ注意:あまり正確ではありません)だけでなく、他の新機能についても懸念があります。検索結果に関連情報を直接表示することで、ウェブサイトのクリック数を減らす可能性があるように思われるからです。
木曜日に行われたGoogleのライブストリーミングイベントでは、Hum to Searchが、思い出したい曲の歌詞がわからない場合に使える素晴らしいツールのように見えました。しかし、実際に試してみたところ、結果はまちまちでした。実際にハミングしても「da」や「dum」と発音するのとほぼ同じ効果しかありませんでしたが、アデルの「Someone Like You」を「da」や「dum」で発音すると、スミス&マイヤーズの「Someone Like You」がヒットしました。同じ曲を口を閉じてハミングすると、さらに興味深い結果が得られました。ポリスの「Every Breath You Take」、シェヴェルの「Send The Pain Below」、モトリー・クルーの「You're All I Need」です。
GoogleはまずGleeのキャストによる「Rumor Has It/Someone Like You」を検索結果に表示しました。ほぼ正確だと思いますが、実際に誰が歌っているのか分からなければ、あまり役に立ちません。しかも、これらの検索結果の精度は10~15%と測定されたので、AIアルゴリズムは私がその曲をハミングしているかどうかさえ判断できなかったようです。実際に歌詞を歌った時に初めてAdeleの名前がリストに表示されましたが、それでもGoogle検索は正しい曲だと認識した確率は78%しかありませんでした。
ハミングや実際に歌っているとき、音程が合っているほど、より正確な結果が得られるようです。AC/DCの「Highway to Hell」をハミングすると、その曲は検索結果リストの2位に40%の精度で表示されましたが、「da」を付けると完全にリストから外れてしまいました(ただし、ドラムバージョンは1位でした!)。歌詞を歌うと、AC/DCの曲そのものがリストの2位に戻りました。
でも、どれも私がよく知っている曲で、シャワーで何百回も歌ったものです。Hum to Searchが、私が知らない曲をハミングしているのを正確に認識してくれると確信できるでしょうか?全くそんなことはありません。しかし、AIモデルによってトレーニングされたあらゆる機能と同様に、理論的には時間とともに改善されるでしょう。その背後にある技術は確かに興味深いもので、それについては別のGoogleブログで詳しく解説しています。
ラガヴァン氏によると、Googleは検索AIアルゴリズムを改良し、「order」と「odor」の誤字脱字を判別できるようにしたという。確かに、これは素晴らしいことのように思えます。しかし、Googleはページ全体ではなく、ページ上の特定の文章をインデックス化することで、ユーザーにさらに関連性の高い情報を提供する予定です。これにより、Googleはユーザーが探している情報を含む段落を正確に抽出して検索結果を提供できるようになります。
しかし、Googleの検索結果がこのような形で情報を表示するようになったら、実際に記事へのリンクをクリックする人がどれだけいるのだろうか。理論的には、Googleがページをスクレイピングしてこのような情報を表示すると、記事へのリンクをクリックする人の数が減る可能性がある。これは、長年業界を苦しめてきた巨大テクノロジー企業と既に戦っている出版物にとって、さらなる問題を引き起こす可能性がある。

それほど悪質ではないと思われるその他の検索機能の改善点としては、「検索結果ページに幅広いコンテンツを表示する」サブトピック機能や、動画内の重要な瞬間をタグ付けして、検索で言及した動画内の正確な瞬間に移動できるようにする機能などがあります。サブトピック機能は今後数ヶ月以内に展開される予定で、Googleはすでにこの新しい動画モーメント機能をテストしています。同社は、年末までにGoogle検索全体の10%がこの新技術を利用すると予想しています。
ラガヴァン氏はまた、昨日公開されたジャーナリストスタジオとデータコモンズプロジェクトについても強調しました。Googleアシスタントはデータコモンズプロジェクトと連携し、米国国勢調査局、労働統計局、世界銀行など、様々なデータベースの情報にアクセスして質問に答えます。
「『シカゴで働いている人は何人ですか』といった質問をすると、自然言語処理を使って、検索内容をデータコモンズにある数十億のデータポイントの特定のセットにマッピングし、適切な統計を視覚的に分かりやすい形式で提供します」とラガヴァン氏は書いている。
この機能は現在 Google アシスタントに統合されていますが、「ロサンゼルスには何人住んでいますか?」のような大まかな質問にしか対応していないようです。「ロサンゼルスには学齢期の子供が何人住んでいますか?」というより具体的な質問をしたところ、Google アシスタントは単純な折れ線グラフではなく、記事のリストを表示しました。
段落検索インデックスと同様に、これも平均的な検索ユーザーがGoogleの検索結果で提供する情報を超える検索を控える要因となる可能性があります。検索結果には情報の出所は表示されますが、検索結果に表示された記事をクリックする動機がユーザーにはありません。ただし、検索者にとって関連性が高いと思われる別の情報が検索結果に表示された場合は別です。これらの変更はウェブブラウジングには役立つかもしれませんが、ウェブサイト運営者はトラフィックにどのような影響が出るのか、息を詰めて見守っていることでしょう。