RORK LABEN
FUNDING — Rorkが$15Mを調達。モバイル特化のノーコードAIという立ち位置に投資家の評価が集まっていますMAX-NATIVE — Rork MaxはAR/LiDAR・Metal 3D・ウィジェット・Dynamic Island・Live Activities・HealthKit・Core MLなど、React Nativeでは届かないネイティブ領域に対応MOBILE-FIRST — BoltやLovableがWebアプリ中心なのに対し、Rorkはモバイルアプリ専業。説明文から本番品質のアプリを生成しますWWDC — WWDC26が閉幕。AIがOSのコア機能となり、iOS 27世代へ。ウィジェットやLive Activitiesの価値がさらに上がる局面ですPRICING — Rorkは無料で開始でき有料$25/月〜、Rork Maxは$200/月。Expoで素早く検証し、必要に応じてMaxでネイティブ化する多段戦略が現実的ALL-APPLE — Rork MaxのSwift直接生成はiPhone・iPad・Apple Watch・Apple TV・Vision Pro・iMessageまでカバーしますFUNDING — Rorkが$15Mを調達。モバイル特化のノーコードAIという立ち位置に投資家の評価が集まっていますMAX-NATIVE — Rork MaxはAR/LiDAR・Metal 3D・ウィジェット・Dynamic Island・Live Activities・HealthKit・Core MLなど、React Nativeでは届かないネイティブ領域に対応MOBILE-FIRST — BoltやLovableがWebアプリ中心なのに対し、Rorkはモバイルアプリ専業。説明文から本番品質のアプリを生成しますWWDC — WWDC26が閉幕。AIがOSのコア機能となり、iOS 27世代へ。ウィジェットやLive Activitiesの価値がさらに上がる局面ですPRICING — Rorkは無料で開始でき有料$25/月〜、Rork Maxは$200/月。Expoで素早く検証し、必要に応じてMaxでネイティブ化する多段戦略が現実的ALL-APPLE — Rork MaxのSwift直接生成はiPhone・iPad・Apple Watch・Apple TV・Vision Pro・iMessageまでカバーします
記事一覧/AIモデル
AIモデル/2026-06-13上級

オンデバイスAIを一次経路にして、重い処理だけクラウドへ逃がす推論ルーターをRorkアプリに組む

Rork(Expo)で生成したアプリに、オンデバイス→Private Cloud Compute→外部API(Claude/Gemini)の順で推論を流す段階フォールバック型ルーターを実装します。予算管理・タイムアウト・キャッシュ・画像入力の振り分けまで、動くTypeScriptで解説します。

Rork391オンデバイスAI4Foundation ModelsReact Native156推論ルーターコスト設計

プレミアム記事

WWDC26 が終わった週、私は個人開発で運用しているアプリの「AIで一言コメントを生成する」機能のクラウド費用を見直していました。月数百円とはいえ、ユーザーが増えるほど線形に積み上がる構造で、無料アプリにとっては地味に重い固定費です。

そこへ Apple が「初回ダウンロード200万未満の開発者は、Private Cloud Compute 上の Foundation Models を無償で使える」と State of the Union で示しました。さらに同じ Swift API から画像入力やサーバーサイドの外部モデル(Claude や Gemini)も呼べる方向に拡張されます。これは「軽い推論はオンデバイスで無料、重い推論だけ課金経路へ」という振り分けが、初めて現実的なコスト設計として組めるようになったことを意味します。

ただし、Rork が生成するのは Expo(React Native)の本番アプリです。React Native から Apple のオンデバイスモデルへ直接は届きません。そこで必要になるのが、**どの推論をどの経路に流すかを一箇所で決める「推論ルーター」**です。以下では、その設計と動くコードを順に置いていきます。

なぜ「単一API直叩き」が本番で破綻するのか

最初に私がやってしまった素朴な実装は、機能ごとに fetch で外部 API を直接呼ぶものでした。動くには動きます。けれど、運用に乗せた途端に次の問題が同時に噴き出しました。

  • オフライン時に機能が完全に死ぬ(地下鉄でアプリを開いた瞬間にエラー)
  • 同じ入力に対して毎回課金される(要約のような決定的なタスクでも)
  • 軽いタスクも重いタスクも同じ高価なモデルに流れる
  • リトライを雑に書いたら、タイムアウト後の再送で二重に課金された

これらはモデルを賢くしても解決しません。経路選択(ルーティング)がアプリのロジックに散らばっていることが原因です。ルーターという一枚の層に集約すると、フォールバックも予算管理もキャッシュも、その層の中だけで完結します。

段階フォールバックの考え方

私が採用しているのは、安くて速い経路から順に試し、扱えなければ次の段へ落とす「はしご(ladder)」構造です。

  1. Tier 0 — キャッシュ: 決定的なタスク(同じ入力なら同じ出力でよいもの)は、まずローカルキャッシュを見る。ヒットすれば課金もネットワークもゼロ
  2. Tier 1 — オンデバイス: 短い分類・要約・整形などは、Foundation Models をネイティブモジュール経由で呼ぶ。無料・低遅延・オフライン可
  3. Tier 2 — Private Cloud Compute: オンデバイスでは精度が足りないが、外部に課金したくない処理。無償枠の範囲で使う
  4. Tier 3 — 外部API(Claude / Gemini): 画像入力を伴うマルチモーダルや、長文の高品質生成など、どうしても重いものだけ

オンデバイス段をネイティブモジュールとして実装する具体的な手順は、Rork で Apple FoundationModels を使う実装ガイドで別途まとめています。無償枠(PCC)をコスト設計として三層に組む観点は、Foundation Models の無償開放で AI コストを三層に組み直すが参考になります。

この順序の肝は、「下の段ほど高価」という前提でタスクを上の段から当てていくことです。各タスクには「最低限ここまでの段が要る」という下限を持たせ、ルーターはその下限以上で最も安い段から試します。

ここまでお読みいただきありがとうございます。

この記事の続きを読む

この先には、実装コードやベンチマーク結果など、実務でお役に立てる内容をご用意しています。このサイトは広告を掲載しておらず、サーバーや開発にかかる費用はメンバーの皆様のご支援で成り立っています。もしお役に立てていましたら、ご支援いただけますと大変ありがたいです。

この記事で得られること
AI機能のAPI費用が読めずに導入をためらっていた人が、月のAIコストを実質ゼロ付近に抑える段階フォールバックの実装を手に入れられる
オンデバイス・PCC・外部APIのどれに何を流すかを、タスクの種類と予算で自動判定する型付きルーターを今日コピーして組み込める
リトライ時の二重課金やアプリ復帰時の競合といった、本番でだけ起きる落とし穴を踏む前に避けられる
Stripe による安全な決済 · いつでもキャンセル可能

この記事を購入する

この先の内容をすべてお読みいただけます。一度のご購入で、いつでも何度でもアクセスできます。このサイトは広告を掲載しておらず、皆さまのご支援がサーバー費用などの運営を支えています。

または
メンバーシップなら全記事が読み放題 →
シェア

お読みいただきありがとうございます

Rork Lab は広告なしで運営しており、サーバー費用などの運営コストはメンバーシップのご支援で賄っています。実装コード・ベンチマーク・本番設計パターンなど、実務でお役立ていただける記事を毎日更新しています。もし読んでよかったと感じていただけましたら、ぜひご覧ください。

  • コピー&ペーストで使える実装コード付き
  • 毎日新しい上級ガイドを追加
  • ¥580/月 または ¥1,480 の永久アクセス
メンバーシップを見る →

関連記事

AI モデル2026-06-12
Apple Foundation Models の無償開放で、Rork アプリの AI コスト設計を三層に組み直す
WWDC 2026 で発表された Foundation Models の無償開放を受けて、オンデバイス・Private Cloud Compute・サードパーティ API の三層にタスクを置き直す設計を整理します。費用の試算スクリプトと、Expo 基盤の Rork アプリから利用する実装経路も載せています。
AI モデル2026-05-08
Rork の AI に古いライブラリのコードを生成されないために — 私が使っている「バージョン明示プロンプト」の実例
Rork Max の AI が古い API を生成してしまう原因と、私が日々使っているバージョン明示プロンプトの構造・テンプレート化の方法・実機で気づくチェック手順までを実例つきでまとめます。
AI モデル2026-04-22
Rork × LiveKit: AI 音声エージェントを本番運用する通話インフラ設計ガイド
LiveKit Agents を Rork 製の React Native アプリに組み込み、低遅延な AI 音声エージェントを本番運用するまでの通話インフラ設計を解説します。
📚RECOMMENDED BOOKS
大規模言語モデル入門
山田育矢
LLM開発
生成AIプロンプトエンジニアリング入門
我妻幸長
プロンプト
Claude CodeによるAI駆動開発入門
平川知秀
AI駆動開発
※ アフィリエイトリンクを含みます
もっと見る →