RORK LABEN
RORK MAX — Rork MaxがiPhone・iPad・Apple Watch・Apple TV・Vision Pro向けのネイティブSwiftアプリを生成できるようになりましたPUBLISH — Rork Maxは Xcode不要の「2クリックApp Store公開」に対応。申請・公開までの摩擦を大きく減らしますEXPO — 標準のRorkはReact Native(Expo)ベースで、プレーンな英語の説明からiOS/Androidネイティブアプリを生成しますPRICING — Rorkは無料で始められ、有料プランは月額$25から。個人開発で試しやすい価格帯ですFUNDING — Rorkがa16z(Andreessen Horowitz)から$2.8Mを調達。AIアプリビルダー領域への資金流入が続いていますREVIEW — 実運用では生成コードの可読性・保守性、Expo由来の制約、課金・プッシュ・広告SDKの組み込みやすさが評価の鍵になりますRORK MAX — Rork MaxがiPhone・iPad・Apple Watch・Apple TV・Vision Pro向けのネイティブSwiftアプリを生成できるようになりましたPUBLISH — Rork Maxは Xcode不要の「2クリックApp Store公開」に対応。申請・公開までの摩擦を大きく減らしますEXPO — 標準のRorkはReact Native(Expo)ベースで、プレーンな英語の説明からiOS/Androidネイティブアプリを生成しますPRICING — Rorkは無料で始められ、有料プランは月額$25から。個人開発で試しやすい価格帯ですFUNDING — Rorkがa16z(Andreessen Horowitz)から$2.8Mを調達。AIアプリビルダー領域への資金流入が続いていますREVIEW — 実運用では生成コードの可読性・保守性、Expo由来の制約、課金・プッシュ・広告SDKの組み込みやすさが評価の鍵になります
記事一覧/AIモデル
AIモデル/2026-06-14上級

Rork Max の Swift アプリに Foundation Models の画像入力でオンデバイス・タグ付けを実装する

WWDC26 で Foundation Models のオンデバイスモデルに画像入力が加わりました。Rork Max が生成する Swift アプリに、画像のタグ付け・説明生成をクラウドに出さず実装する具体的な手順を、可用性ゲートとVision併用まで含めて解説します。

Rork Max155Foundation Models3画像入力オンデバイスAI6SwiftUI48

プレミアム記事

写真を1枚渡して「これは何の写真か」「どんなタグを付けるべきか」を返す機能を作るとき、これまでは画像を外部のマルチモーダルAPIに送るのが当たり前でした。私が個人開発で運用している壁紙アプリでも、新しく追加した画像にカテゴリやキーワードを自動で付けたい場面が何度もあり、そのたびに「ユーザーの端末にある画像を、わざわざ自社サーバーやクラウドLLMに送ってよいのか」という線引きに悩んできました。

WWDC26 で、その前提が変わりました。iOS 27 のオンデバイス Foundation Models が画像を読めるようになり、プロンプトに画像を添えて「この写真について答えて」と聞けるようになったのです。Apple は新しい専用パイプラインではなく「既存のプロンプトビルダーの自然な拡張」だと説明しています。つまり iOS 26 で覚えた LanguageModelSession@Generable の作法はそのまま使えて、プロンプトに画像が1枚増えるだけです。

ここからは、Rork Max が生成する Swift アプリを土台に、画像のタグ付け・説明生成をオンデバイスで完結させる実装を、可用性チェックと Vision 併用まで含めて組み立てます。Rork Max は React Native ではなくネイティブ Swift を生成する製品なので、Foundation Models のような Apple ネイティブのフレームワークと素直に噛み合うのが利点です。

なぜ「画像をクラウドに出さない」が効くのか

画像理解をクラウドLLMに任せると、3つのコストが同時に乗ります。1つ目は金銭的なコスト(1画像あたりの推論料金)、2つ目はレイテンシ(往復のネットワーク待ち)、3つ目はプライバシー上の説明責任です。とくに壁紙やヘルスケアのように「端末内の個人的な画像」を扱うアプリでは、3つ目が最も重くのしかかります。

Foundation Models のオンデバイスモデルは、これらをまとめて軽くします。推論は端末内で完結するため、初回ダウンロードが一定規模未満の個人開発アプリにとっては実質的に追加費用ゼロで画像理解を載せられます。ネットワーク往復が消えるのでオフラインでも動き、画像が端末の外に出ないので説明も簡潔になります。

ただし万能ではありません。オンデバイスモデルのコンテキストは4K、Private Cloud Compute(PCC)のサーバーモデルは32Kで、画像はそのトークン予算を消費します。Apple 自身が「大きな画像ほど多くのトークンを消費し、レイテンシも増える」と明言しています。設計の出発点は「まずオンデバイスで測り、足りないときだけサーバーへ逃がす」です。

全体像 — タグ付け機能の3層構造

実装は次の3層で考えると整理できます。

  1. 可用性ゲート: そのデバイスで Apple Intelligence(=オンデバイスモデル)が使えるかを確認し、使えない端末では機能自体を隠すかフォールバックする。
  2. 構造化されたタグ生成: 画像をプロンプトに添え、@Generable で「タグ配列・カテゴリ・1行説明」という決まった形のデータを受け取る。
  3. Vision 併用と段階的エスカレーション: 高速・定型の処理は Vision に任せ、言語的な説明はオンデバイス Foundation Models、長文や複数画像のバッチだけ PCC に逃がす。

順に作っていきます。

ここまでお読みいただきありがとうございます。

この記事の続きを読む

この先には、実装コードやベンチマーク結果など、実務でお役に立てる内容をご用意しています。このサイトは広告を掲載しておらず、サーバーや開発にかかる費用はメンバーの皆様のご支援で成り立っています。もしお役に立てていましたら、ご支援いただけますと大変ありがたいです。

この記事で得られること
画像のタグ付けや説明文生成に外部APIを使っていた人が、Rork Max のSwiftアプリ内でオンデバイス完結の実装に切り替えられる
@Generable による構造化出力・Vision併用・可用性ゲートまで、コピーして動かせる Swift コードを手に入れられる
オンデバイス4Kとクラウド32Kのトークン予算を踏まえ、月のAPI費用をかけずに画像理解機能を本番投入できる
Stripe による安全な決済 · いつでもキャンセル可能

この記事を購入する

この先の内容をすべてお読みいただけます。一度のご購入で、いつでも何度でもアクセスできます。このサイトは広告を掲載しておらず、皆さまのご支援がサーバー費用などの運営を支えています。

または
メンバーシップなら全記事が読み放題 →
シェア

お読みいただきありがとうございます

Rork Lab は広告なしで運営しており、サーバー費用などの運営コストはメンバーシップのご支援で賄っています。実装コード・ベンチマーク・本番設計パターンなど、実務でお役立ていただける記事を毎日更新しています。もし読んでよかったと感じていただけましたら、ぜひご覧ください。

  • コピー&ペーストで使える実装コード付き
  • 毎日新しい上級ガイドを追加
  • ¥580/月 または ¥1,480 の永久アクセス
メンバーシップを見る →

関連記事

AI モデル2026-06-14
Rork(Expo)製アプリから Apple Foundation Models を呼ぶ — オンデバイスAIをネイティブモジュールで橋渡しする
Rork が生成する Expo(React Native)アプリから iOS のオンデバイスAI、Apple Foundation Models を呼ぶには、Swift 側のネイティブモジュールを挟む必要があります。Expo Modules API で橋渡しを書き、未対応端末ではクラウドへ逃がす構成を実装します。
AI モデル2026-06-13
オンデバイスAIを一次経路にして、重い処理だけクラウドへ逃がす推論ルーターをRorkアプリに組む
Rork(Expo)で生成したアプリに、オンデバイス→Private Cloud Compute→外部API(Claude/Gemini)の順で推論を流す段階フォールバック型ルーターを実装します。予算管理・タイムアウト・キャッシュ・画像入力の振り分けまで、動くTypeScriptで解説します。
AI モデル2026-05-04
Rork Max の SwiftUI 生成は「どこまでできるのか」— 実機テストで見えた可能性と限界2026
Rork MaxのSwiftUI/ネイティブアプリ生成能力を実機テストで検証。何が得意で何が苦手かを正直にまとめました。機能の宣伝ではなく、実際に使った評価です。
📚RECOMMENDED BOOKS
大規模言語モデル入門
山田育矢
LLM開発
生成AIプロンプトエンジニアリング入門
我妻幸長
プロンプト
Claude CodeによるAI駆動開発入門
平川知秀
AI駆動開発
※ アフィリエイトリンクを含みます
もっと見る →