カラフルな新型iMacやAirTagの発表の合間に見逃してしまった方もいるかもしれませんが、Appleが先週発表したiPad Proには、「Center Stage」と呼ばれる興味深いビデオ通話機能が搭載されています。この機能は、常にユーザーをフレームの中央に捉えるように設計されています。その仕組みと、競合する他のビデオ通話技術についてご紹介します。
最新のiPad Proモデルはまだ発売されていないため、この新機能を実際に試用する機会は得られていませんが、その詳細については既にいくつか分かっています。この機能は、先週発表された11インチと12.9インチのiPad Pro(どちらも5月に発売予定)に搭載された、12メガピクセルの超広角フロントカメラによって実現されています。この広角カメラによって、デジタルクロッピング技術が実現されています。カメラは実際には動いておらず、視野内のさまざまな部分を選択して表示するだけです。
カメラに搭載されたTrueDepthテクノロジーは、物体とその距離を検知し、デバイスからの距離も検出します。また、これらの最上位iPadに搭載されているM1チップに搭載された機械学習機能も、この技術を補助しています。このチップは、AIの魔法を使って顔を認識し、顔が動いたり(そして新しい顔が現れたり)すると、即座に調整を行っていると考えられます。
「ユーザーが動き回ると、Center Stageは自動的にパンして、ユーザーを画面内に収めます」とAppleは述べています。「他のユーザーが参加すると、カメラもそれを検知し、スムーズにズームアウトして全員が画面に収まるようにし、会話に参加できるようにします。同僚とのホワイトボード会議でも、バーチャルな家族の集まりでも、これまで以上に魅力的なつながり体験を実現します。」
カメラの広い視野角とM1チップのパワーは、Appleの他のデバイスが追いつくのに苦労するレベルです。安価なiPadでは処理能力が足りず、MacBookにはカメラが搭載されていません。これはしばらくの間、iPad Proだけの機能になる可能性があり、実際、このタブレットはユーザーが立てかけてハンズフリーで操作するのにも快適なデバイスになっているでしょう。

Center Stageの発表以来、いくつか情報が明らかになりました。開発者向けAPIのおかげで、FaceTime以外のアプリでも使えるようになり、人間の顔とペットの顔が混同されることもありません。Center Stageは、Zoom、Microsoft Teamsなどのアプリごとに設定を切り替えることができるようになります。
AppleはSpring Loadedメディアイベントで、Center Stageをキッチンでどのように使うかを披露しました。キッチンは確かにCenter Stageが役立つ場面の一つですが、デバイスを手に持ちたくない、動きながら話したいといった状況であれば、どんな場面でも使えます。Center Stageは、よほどフレームから外れようとしない限り、常にあなたの視界に留まります。
ただし、これは全く新しい機能というわけではありません。Facebook Portalデバイスの重要なセールスポイントの一つに、同様の機能があります。デジタルフレームと、テレビの上に貼り付けるカメラ(Portalのディスプレイとしても使用可能)の両方で提供されています。これらのガジェットは、ユーザーが動き回っても常に画面に映し出すことができ、ここでも超広角カメラが使用されています。Facebookはこれを「スマートカメラ」システムと呼んでおり、「キッチンを動き回っている時でも、リビングルームで子供たちを追いかけている時でも、自動的に動きに合わせて調整する」システムです。Appleのシステムと同様に、撮影に人が加われば視野が広がります。
カメラの視野角は、Portal製品によって114度から140度まで変化するため、広い範囲を撮影できます。Portalに映らないようにするには、ほぼ(完全にではありませんが)Portalの後ろにいる必要があります。WhatsApp、Facebook Messenger、Zoomなどを使ってビデオ通話をする場合でも、これらはすべてシームレスに行われます。

Portalのスマートカメラ機能をオフにすると、カメラは最も広い位置までズームアウトし、その位置で固定されます。使用例はCenter Stageと非常に似ており、Facebookが最も推奨しているのはリビングルームでの家族との集まりです。
そして、新しいAmazon Echo Show 10は、カメラとディスプレイを搭載し、部屋の中をやや不気味な様子で追いかけ回します。この不気味な監視の雰囲気を我慢できるなら、AppleやFacebookがビデオ通話中に顔を映し続けるために行っている方法よりも、はるかに優れたソリューションかもしれません。
Echo Show 10の場合、巧妙なデジタルクロッピングやパンニングは行われていません。カメラは実際にあなたを監視し、あなたの動きに合わせて動きます。さらに、外出中にセキュリティカメラとして部屋を見回すこともできます。ディスプレイとカメラが取り付けられているベーススピーカーは350度回転するので、かなりの回転が可能です。
Amazonによると、音声と視覚的な手がかりを組み合わせてユーザーの現在位置を把握し、追跡するとのこと。ここでも機械学習とAIアルゴリズムが実装されており、人間が物理空間のどこにいるかを把握します。また、複数の人物の撮影にも対応しており、必要に応じてズームアウトすることで、より多くの顔を画面に捉えます。この機能は、デバイスの設定にある「モーション」と「モーション設定」で無効にすることもできます。
Center Stageには、今後もさらに多くのバージョンが登場するでしょう。位置を変えたり、通話に人が加わったりすると、ビデオフィードが自動調整されるのは間違いなく便利な機能であり、人工知能技術がまさにうってつけです。パンデミックが終息し、1日に何度もビデオ会議をしなくて済むようになったら、これらの機能はきっと喜びをもたらすでしょう。