AppleのAI駆動型アクセシビリティアップデートには、あなたの声を模倣できるテキスト読み上げ機能が含まれています

AppleのAI駆動型アクセシビリティアップデートには、あなたの声を模倣できるテキスト読み上げ機能が含まれています

Appleは、スマートフォン、タブレット、ノートパソコンに新たなアクセシビリティ機能を搭載するためにAIを活用しています。昨年5月には、デバイス上でのライブキャプション機能など、新たなアクセシビリティ機能を発表していましたが、今回の新機能は認知障害、言語障害、運動障害のある方にとって大きな助けとなるでしょう。視覚障害のある方でも、電子レンジで正しい選択肢を選んだり、エレベーターで正しい階数を選択したりすることを容易にするAI検出機能や、ユーザーの声を真似る方法を学習するAIも搭載されています。

Appleは火曜日、iPhoneとiPadで最もよく使われているアプリの一部にいくつかの新機能を追加する予定だと発表しました。クパティーノを拠点とする同社は、これらの使い勝手向上のための新機能の具体的な日程については明らかにしていませんが、iPhone、iPad、Mac向けに大小さまざまなアクセシビリティオプションの導入が予定されています。

最前面にあるのは、写真、電話、メッセージ、カメラ、音楽、FaceTime など iPhone の最も一般的なアプリのいくつかを採用し、UI を大幅に簡素化する新しい Assistive Access 機能です。

Apple Music やその他多くのアプリには、よりシンプルな UI のための新しいオプションが含まれるようになります。
Apple Musicをはじめとする多くのアプリに、よりシンプルなUIを実現する新しいオプションが追加される。画像:Apple

メッセージアプリには、絵文字専用の大型キーボードと、ビデオメッセージを録画する新しいオプションが追加されます。ホーム画面とアプリにも、グリッドベースのレイアウト(オプション)が追加されます。例えば、Assistive Access を有効にしたカメラアプリでは、レンズを通して見た景色が表示され、画面下部に黄色で強調表示された大きな「写真を撮る」ボタンが表示されます。Appleの写真アプリでは写真タイルが2列に表示され、通話アプリでは最近の会話がハイライト表示され、名前とプロフィール画像が大きく画面に直接表示されます。Apple Musicもこの新しい設定で刷新され、曲とアルバムカバーが見やすいタイル形式で表示されます。

さらに、Finder、メール、メッセージ、カレンダー、メモなどのアプリでテキストサイズの調整機能が向上するなど、いくつかの小さな変更も導入されます。メッセージやSafariでは、GIFなどの動画をより簡単に一時停止できるようになりました。また、音声コントロール使用時に正しいコマンド(「dew」ではなく「do」)を強調したいユーザー向けに、音声による提案機能も近日中に強化されます。Appleはまた、iPhoneと互換性のある補聴器をMacとペアリングできるようにもします。

視覚障害者が正しいボタンを押すための新しい方法

Appleは、最新の機械学習ベースのAIを活用し、拡大鏡アプリの新機能「Point and Speak(指さし読み)」を発表しました。この機能は基本的に、カメラレンズの前でのユーザーの指の動きをトラッキングし、ユーザーが指さしたテキストを読み上げます。ページ上部のGIF画像でご覧いただけるように、Appleは電子レンジを例に挙げ、指がボタンの前を移動するたびにアプリがボタンを読み上げます。

Appleによると、この新機能はスマートフォンのカメラに加え、LiDARとAIを活用してテキストを読み取り、発音する。この新機能は、画像の説明や人物やドアの検出を行う既存の拡大鏡機能とも連携する。

iPhone、iPad、Macであなたの声を再現できます

Apple が FaceTime の新しいテキスト読み上げ機能を披露。
AppleがFaceTimeの新しい音声合成機能を披露。画像:Apple

Appleは、発話障害のあるユーザー向けに、ユーザーエンドプラットフォーム全体のテキスト読み上げ機能を大幅に改善すると発表しました。このLive Speech機能は、電話やFaceTime通話中だけでなく、対面での会話でも必要に応じて利用できます。

ユーザーは、よく使う表現を録音してすぐに使えるようにすることも可能になります。クパチーノに本社を置く同社は、ユーザーが自分の話し方を録音できる機能も追加します。これは、同社によれば、最終的に話せなくなるリスクがある際に「自分らしい声を作る」ための手段です。Personal Voiceアプリは、ユーザーに約15分間の音声に相当するランダムなテキストプロンプトを読み上げさせます。システムはAIを活用し、ユーザーの話し方に合わせた音声を生成します。

このシステムは、ElevenLabsのような既存のプラットフォームに類似する可能性があります。これらのAIシステムは、他人の声を盗んだり複製したりしているという疑惑が蔓延していますが、この新機能はユーザーのiPhoneに紐付けられており、最終的にリリースされればLive Speechでも動作するはずです。

AppleのAIを活用したアクセシビリティへの進出

以前もお伝えしたように、Appleはこれまで世界アクセシビリティ啓発デーに合わせて、アクセシビリティに関する複数の発表を行ってきました。ジェスチャーコントロールやASL(アメリカ手話)のサポート、さらには「アクセシビリティ絵文字」と呼ばれる機能もいくつか追加されてきました。

今年の注目すべき点は、新機能の多くが機械学習、あるいはより簡潔に言えば最新の人工知能システムを中心に据えられていることです。同社はこれまでAI関連の取り組み、特に自社製の生成型AIシステムの開発に取り組んでいるかどうかについては、ほとんど語ってきませんでした。これらの新機能は、言語モデルやテキスト画像生成ツールをほぼすべてのユーザーエンド製品に押し込んでいるGoogleやMicrosoftといった企業とは異なる戦略をAppleが試みていることを示唆しているのかもしれません。

これらの機能は、6月に開催されるAppleのWWDCにおけるAIのハイライトのほんの一部となる可能性がある。


Gizmodoのおすすめ家電製品をもっとご覧になりたいですか? 最高のスマートフォン、最高のノートパソコン、最高のカメラ、最高のテレビ、最高のプリンター、最高のタブレットのガイドをご覧ください。次なる目玉について知りたい方は、iPhone 15について私たちが知っているすべてをまとめたガイドをご覧ください。The Inventoryの友人たちが提供してくれた、今日の最高のお買い得情報はこちらをクリックしてご覧ください。

Tagged: