次世代Apple Intelligenceを発表。新アーキテクチャでAIを日常のアプリ深くに統合し、より個人的で実用的に。中核モデルではGoogleのGemini系技術と連携する。
アップルは基調講演で、次世代のApple Intelligenceと、刷新した音声アシスタント「Siri AI」を発表した。会話的に何度も往復でき、画面の内容を理解し、利用者の個人的な文脈やアプリと結びついて動く——従来のSiriから大きく踏み込んだ姿だ。
新しいSiriは、世界知識・画面認識・個人コンテキスト・画像理解・アプリ操作を束ね、「Hey Siri」などこれまでと同じ呼び出し方で使える。やり取りは専用アプリに残り、後から見返せる。
基盤を担うのはApple Foundation models。今年はGoogleと深く連携してGemini系の技術を取り込み、オンデバイスとサーバ(Private Cloud Compute)の双方向けに最適化したという。
提供はまず英語から始め、対応言語を順次拡大する。一方で当初の提供範囲には地域的な制約も示された(七面に関連記事)。
本紙の各記事は、講演動画の該当場面にリンクしています。見出しや記事をクリックすると、その話題が始まる時刻から再生されます。
YouTubeで通しで観る昨年導入した質感表現「Liquid Glass」を、フィードバックを踏まえて作り込み直した。背後のコンテンツをより効果的にぼかして読みやすさを上げつつ、奥行きと分離感を高めたという。
透明寄りから着色寄りまで好みで選べるスライダーを新設。Macでは上部ツールバーを統一し、サイドバーを画面端まで広げ、アイコンに色を戻し、ウインドウの角丸も統一した。アプリアイコン自体にもLiquid Glassの層を取り込んだ。
次期macOSの呼称は「Golden Gate」に決まった。命名担当チームをめぐる毎年恒例のユーモアあふれる小芝居の末に明かされる、という演出も健在だった。
地名を冠する命名の流儀は今年も踏襲。発表の“じらし”は、基調講演名物のひとつとして定着している。
派手な新機能だけでなく、土台の最適化にも時間を割いたという。アプリの起動は最大30%、撮影直後の写真表示は最大70%、AirDrop転送は最大80%速くなったとした。
システムのアニメーションも滑らかになり、ホーム画面の切り替えなど日常の操作の手触りが改善している。
CPUスケジューラの改良を旧機種にも展開し、iPhone 11以降を引き続きサポート。対応範囲は過去最大で、より多くの利用者に最新OSが届くとした。
SpotlightやPhotos、Mailを支える検索の基盤を作り直した。索引をより安定・高速・網羅的にし、新しいコンテンツもほぼ即時に索引化。メールの並び替えも刷新した。
共有アルバムにAndroidやWindowsの友人も参加・投稿でき、フル解像度に対応。ヘルスケアは更年期に、AirPodsはカスタムEQに対応。Vision Proはパノラマの空間化、マップはFlyoverの高精細化を進めた。
「すべての子どもは違う」「専門研究に基づいて設計する」の二原則。米国小児科学会と協働し、健全なデジタル習慣づくりを後押しする。
アップルは子ども向けの安全機能を、二つの原則に基づいて設計するとした。一つは、子どもは一人ひとり違い、家庭ごとに最適解が異なるという前提。もう一つは、臨床や発達、オンライン安全の専門研究に基づくという姿勢だ。
米国小児科学会(AAP)の「Family Media Plan」を保護者向けのガイドに落とし込み、対面の交流や学習、運動、睡眠の時間を守ることの大切さを示す。13歳未満は端末利用を絞り、準備が整うにつれ広げていく考え方を示した。
最も重要な第一歩は、子ども用アカウントの作成だと強調。作るだけで年齢に応じた保護が即座に有効になり、成人向けサイトのブロックや年齢に合ったメディアのみの許可、App Storeの制限がかかる。既存アカウントの変換にも対応する。
アプリは「Ask to Buy」で保護者が承認する仕組みだが、今年はWeb閲覧にも「Ask to Browse」を拡張。新しいサイトを見る前に保護者が確認できる。13歳未満は既定で有効だ。
コミュニケーション安全機能は、ヌードに加えてゴアや暴力的な画像・動画についても、表示の前に介入するようになった。
新機能「Time Allowances」は、エンタメ・ゲーム・SNSの利用時間の目安を提示。年齢と専門家の助言に基づく出発点を示しつつ、保護者が自由に調整できる。
平日と週末、学校の時間帯などに応じてアプリの可否をスケジュール設定でき、Screen Timeも刷新。使い方を一目で把握し、その場で調整できるようになった。
中核はApple Foundation models。今年はGemini系の技術を取り込み、オンデバイスとPrivate Cloud Computeの双方に最適化した。
次世代Apple Intelligenceの心臓部はApple Foundation modelsだ。今年はGoogleと深く連携し、Gemini系の技術を活用して次世代の基盤モデルを構築。端末上とサーバの双方で動くよう最適化したとした。
これにより、最新水準の理解と推論に加え、画像の理解・生成といった複数のモダリティに対応。さらに高性能なApple silicon向けに、音声の理解・生成までこなす、より強力なオンデバイス・モデルも用意した。
新たな「システムオーケストレーター」が各能力を安全に束ねる。個人コンテキストの理解、世界知識によるWeb参照、App Actionsでのアプリ操作、画面認識——これらをシステム全体で使えるようにした。
多くのAIは既定で個人のやり取りを保持しがちだと指摘。アップルはオンデバイス処理とPrivate Cloud Computeにより、データを保存も参照もしない設計だとした。要求の実行にのみ使われ、外部の専門家がいつでも検証できるという。
デモでは、コンサートの開催日を世界知識から答え、抽選の通知リマインダーを設定。写真の撮影地を特定し、友人がメッセージで送った住所を探し出して経路に追加。さらに写真を選別し、共有アルバムへ加えるところまでを一気に見せた。
より自然で表情のある新しい音声を採用。抑揚や話す速さを好みに合わせて調整できる。システム全体のディクテーションも精度が大きく向上し、綴りや句読点、大文字小文字までより正確に拾うという。
一問一答を超え、深掘りした相談やブレストができる。W杯のウォッチパーティ計画のデモでは、両国の料理提案、メッセージからのデザート抽出、献立づくり、グループチャットへの送信までを会話で進めた。
MacではSiriをSpotlightに統合。どこからでも呼び出せ、複数ファイルを比較して表にまとめたり、メッセージやメールを横断して推薦したり、メールの下書きを一から作ったりできる。
会話的な体験をiPadOSにも拡大。履歴をiCloudで同期する専用Siriアプリで、iPhoneで始めてiPadやMacで続けられる。Apple Watch、そして“見るだけ”で起動するvisionOSにも広がる。
Visual Intelligenceを各プラットフォームへ。カメラのSiriモードで目の前の対象を調べ、操作できる。Writing Toolsも統合し、入力できる場所ならどこでも下書き・推敲・助言が可能。自動校正もシステム全体に届く。
新機能「Spatial Reframing」。空間モデルと生成モデルを組み合わせ、撮影後にカメラ位置を動かしたかのように画角を調整する。
Clean Upはより自然な補完に強化、Extendは画角を広げて傾きも補正。目玉の「Spatial Reframing」は、オンデバイスの空間モデルでリアルタイムにプレビューし、ずれた分だけを生成モデルが自然に埋める。古い写真や他社カメラの写真でも使えるという。
増えがちなタブを話題別にまとめ、閲覧中も関連タブを追加。更新を見張る「Notify Me」、自然言語から拡張機能を作る「Describe an extension」も。閲覧データは誰とも共有しないとした。
脆弱・漏洩したパスワードを、Safariと連携して各サイトに自動でサインインし、強固なものへ更新。エージェント的に手間なく直すという。
メッセージのワンタップ提案や写真検索、自然言語でのカレンダー登録に対応。電話の「Call Context」は確認番号などを自動で表示し、処理は端末内で完結するとした。
対応カメラの録画をAIが要約・説明し、内容で横断検索できる。関連クリップをつなぎ全体像を把握。通知も一つの活動としてまとめ、4K表示にも対応した。
やりたいことを自然言語で説明すると、必要な手順をAIが組み立てる。退勤時に到着予定を家族へ送る——といった自動化も、言葉で伝えるだけで作れる。
フォトリアルを含む多彩なスタイルで高品質な画像を生成。写真を元に自然言語で変形でき、Private Cloud Computeにより写真は保存・共有されないとした。
開発者は、App IntentsやSpotlight連携を通じて、自分のアプリの機能をSiriから呼び出せるようになる。慣れた技術のままAIを組み込める点が強調された。
オンデバイス・モデルを使うFoundation Modelsフレームワークは、画像入力やカスタムスキル、サーバモデルまで同一のSwift APIで扱える。他のモデルを端末上で動かす新しいCore AIフレームワークも用意した。
Xcodeはエージェント的なコーディングに対応し、Geminiを含むモデルや、Figma・GitHubとの連携を選べる。実機と仮想を一つにまとめる「Device Hub」も発表された。知能はアプリを置き換えるのではなく、native体験を高めるものだと位置づけた。
クックCEOが締めくくった。新OSは本日から開発者向けベータ、翌月にパブリックベータ、一般提供は秋を予定。クック氏は、こうした発表の場がCEOとしての最良の瞬間の一つだったと振り返り、「最良はこれからだ」と語った。
「AIのためのAI」に、急いで突き進む者がいる——基調講演で、アップルはそう競合を遠回しに牽制した。技術の潜在力ではなく、それが最終的に仕えるべき相手、つまり私たち一人ひとりを見失っていないか、と。
同社の主張は一貫している。AIは日常のアプリに溶け込み、個人の文脈に根ざし、設計のすべての段階でプライバシーを守るべきだ。派手な単独機能ではなく、毎日の道具を静かに賢くすること。今年の発表は、その思想の徹底に見えた。
むろん、評価は使ってみてからだ。会話的なSiriも、写真の構図をやり直す魔法も、宣言と体験の距離は、秋に確かめられる。
Siri AIは英語から提供開始し順次拡大。当初、EUのiOS/iPadOSでは提供されず、中国でも規制対応のため新機能は当面見送られる。