RORK LABEN
MAX — Rork MaxがネイティブSwiftアプリを生成し、iPhone・iPad・Watch・TV・Vision Pro・iMessageに対応しますNATIVE — AR/LiDAR、Metalによる3D、Dynamic Island、Live Activities、HealthKit、Core MLなどに手が届きますPUBLISH — 2クリックでApp Storeへ提出でき、申請まわりの手間が大きく圧縮されていますPRICING — Rork Maxは月200ドル、元のRorkは無料で始められ有料は月25ドルからですFUNDING — Rorkがa16zから280万ドルを調達し、月間74万超の訪問・成長率85%と紹介されていますTOOL — 元のRorkはReact Native(Expo)でiOSとAndroidのアプリを自然言語から生成しますMAX — Rork MaxがネイティブSwiftアプリを生成し、iPhone・iPad・Watch・TV・Vision Pro・iMessageに対応しますNATIVE — AR/LiDAR、Metalによる3D、Dynamic Island、Live Activities、HealthKit、Core MLなどに手が届きますPUBLISH — 2クリックでApp Storeへ提出でき、申請まわりの手間が大きく圧縮されていますPRICING — Rork Maxは月200ドル、元のRorkは無料で始められ有料は月25ドルからですFUNDING — Rorkがa16zから280万ドルを調達し、月間74万超の訪問・成長率85%と紹介されていますTOOL — 元のRorkはReact Native(Expo)でiOSとAndroidのアプリを自然言語から生成します
記事一覧/AIモデル
AIモデル/2026-06-30上級

Rork のハイブリッドAIが知らぬ間にクラウドへ偏って課金が膨らんでいたとき — 経路選択を計測して切り分ける運用メモ

オンデバイス・エッジ・クラウドを振り分けるAIルーターは、判断ログが無いと静かにクラウドへ偏り、トラフィックが横ばいでも課金だけが伸びます。経路選択を計測して原因を切り分けた運用メモです。

Rork Max202ハイブリッドAIオンデバイスAI12エッジAI4コスト最適化5オブザーバビリティCore ML5Cloudflare Workers AI

プレミアム記事

課金明細を見て初めて気づいた

ハイブリッドAIを載せたアプリで、月末の API 課金が前月比で 1.7 倍になっていました。困ったのは、アクティブユーザーもリクエスト総数もほぼ横ばいだったことです。トラフィックが増えていないのに費用だけが伸びる。最初はモデル単価の改定を疑いましたが、単価は据え置きでした。

原因にたどり着くまで時間がかかったのは、AIルーターがどのリクエストをどこへ流したかを、どこにも記録していなかったからです。オンデバイス・エッジ・クラウドの3層に賢く振り分ける設計にしていたのに、肝心の「実際にどう振り分いたか」は誰も見ていませんでした。設計図はあるのに、走行ログが無い状態です。

このメモは、その走行ログを後付けで仕込み、課金が膨らんだ真因を切り分けるまでにやったことの記録です。コードは Rork Max で生成したアプリ(React Native + Expo 構成)に後から差し込める形にしてあります。

個人開発で長くアプリを運用していると、こうした「壊れていないのに費用だけ伸びる」類の不具合に何度か出会います。私自身、派手なクラッシュより、誰も困らないまま静かに進む劣化のほうが見つけにくく、結局は計測を仕込んでいたかどうかで対応の速さが決まる、と感じてきました。今回もまさにその一例でした。

なぜ「静かに」偏るのか

ハイブリッドAIの振り分けは、たいていこういうヒューリスティックで書かれています。個人情報を含むならオンデバイス、最新情報や複雑な推論が必要ならクラウド、それ以外はエッジ、という具合です。

// src/ai/AIRouter.ts — よくある初期実装(判断を記録していない版)
export type AILayer = 'on-device' | 'edge' | 'cloud';
 
export function determineAILayer(req: AIRequest): AILayer {
  const c = req.context ?? {};
  if (c.offlineMode || c.containsPersonalInfo) return 'on-device';
  if (c.requiresLatestInfo || c.complexReasoning) return 'cloud';
  if (req.message.length <= 50) return 'on-device';
  return 'edge';
}

問題は、この requiresLatestInfocomplexReasoning といったフラグを誰が立てているか、です。多くの場合、上流の軽い分類器やプロンプト側のキーワード判定がふんわり立てています。そこの基準がほんの少し緩むだけで、クラウド送りの割合が静かに増えます。トラフィックの総量は変わらないので、ダッシュボードのどのグラフも異常を示しません。気づけるのは課金明細だけ、という事態になります。

私が見た範囲では、静かなクラウド偏りの原因はだいたい次の3つに収束しました。

原因起きること気づきにくい理由
フラグの過剰付与上流分類器が complexReasoning を立てすぎてクラウド送りが増える各リクエストは正常に応答するため、エラー率に出ない
暗黙のフォールバックオンデバイスモデルの初期化失敗時に黙ってクラウドへ流すユーザー体験は維持されるので、誰も困らない
会話履歴の肥大履歴が長くなるとエッジ層の上限を超えクラウドへ昇格セッション後半だけで起きるため再現しにくい

3つに共通するのは「ユーザーから見ると何も壊れていない」点です。だからこそ計測なしには見つかりません。

ここまでお読みいただきありがとうございます。

この記事の続きを読む

この先には、実装コードやベンチマーク結果など、実務でお役に立てる内容をご用意しています。このサイトは広告を掲載しておらず、サーバーや開発にかかる費用はメンバーの皆様のご支援で成り立っています。もしお役に立てていましたら、ご支援いただけますと大変ありがたいです。

この記事で得られること
AIルーターの判断を1リクエストずつ記録し、レイヤー別シェア・実測レイテンシ・推定トークン課金を集計する計測コード
トラフィック横ばいなのに課金が伸びる「静かなクラウド偏り」の3つの典型原因と、それぞれの切り分け手順
オンデバイス初期化失敗時の暗黙クラウドフォールバックを可視化し、予算アラームで早期検知する運用設計
Stripe による安全な決済 · いつでもキャンセル可能

この記事を購入する

この先の内容をすべてお読みいただけます。一度のご購入で、いつでも何度でもアクセスできます。このサイトは広告を掲載しておらず、皆さまのご支援がサーバー費用などの運営を支えています。

または
メンバーシップなら全記事が読み放題 →
シェア

お読みいただきありがとうございます

Rork Lab は広告なしで運営しており、サーバー費用などの運営コストはメンバーシップのご支援で賄っています。実装コード・ベンチマーク・本番設計パターンなど、実務でお役立ていただける記事を毎日更新しています。もし読んでよかったと感じていただけましたら、ぜひご覧ください。

  • コピー&ペーストで使える実装コード付き
  • 毎日新しい上級ガイドを追加
  • ¥580/月 または ¥1,480 の永久アクセス
メンバーシップを見る →

関連記事

AI モデル2026-07-01
Rork Max のネイティブ Swift で SpeechAnalyzer を使い、長尺の音声を端末内で文字起こしする
SFSpeechRecognizer では詰まっていた長尺・オフラインの文字起こしを、iOS 26 の SpeechAnalyzer と SpeechTranscriber で作り直す実装メモです。モデル資産のダウンロード、AsyncStream での音声供給、確定前と確定後の結果の扱い分け、Rork Max のネイティブ生成と Expo からの橋渡しの境界設計まで、実際にハマった点を添えてまとめます。
AI モデル2026-06-24
Foundation Models の Guided Generation で、オンデバイスAIの出力を型で受け取る
オンデバイスのFoundation Modelsで、AIの返答を自由文ではなく型付きの構造体として受け取る方法を、Guided GenerationとTool Callingの実装コードとともに整理します。
AI モデル2026-06-23
Rork Max のアプリで iOS 18 のオンデバイス翻訳を使う — 無料・オフラインで多言語ユーザーに応える
iOS 18 の Translation フレームワークを使い、Rork Max が生成した Swift アプリに無料・オフラインのリアルタイム翻訳を組み込む手順です。言語モデルの在庫確認、一括翻訳、空応答の回避まで実コードでまとめました。
📚RECOMMENDED BOOKS
大規模言語モデル入門
山田育矢
LLM開発
生成AIプロンプトエンジニアリング入門
我妻幸長
プロンプト
Claude CodeによるAI駆動開発入門
平川知秀
AI駆動開発
※ アフィリエイトリンクを含みます
もっと見る →