RORK LABEN
FUNDING — Rorkが$15Mのシード資金調達を完了。Left Lane Capitalが主導し、Peak XV・True Ventures・Goodwater・a16z Speedrunが参加しましたUSERS — 利用者は200万人に達し、月間74.3万訪問・成長率85%と伸び続けていますMAX — Rork MaxはネイティブSwiftアプリを生成し、iPhone・iPad・Watch・TV・Vision Pro・iMessageに対応しますSTACK — 通常のRorkはReact Native(Expo)でiOSとAndroidを同時に生成し、非エンジニアでも実機アプリを作れますPRICE — 料金は無料から用意され、有料プランは月$25から、Rork Maxは月$200ですMARKET — Gartnerは2026年末までに新規アプリの75%が低コード/ノーコード製になると予測していますFUNDING — Rorkが$15Mのシード資金調達を完了。Left Lane Capitalが主導し、Peak XV・True Ventures・Goodwater・a16z Speedrunが参加しましたUSERS — 利用者は200万人に達し、月間74.3万訪問・成長率85%と伸び続けていますMAX — Rork MaxはネイティブSwiftアプリを生成し、iPhone・iPad・Watch・TV・Vision Pro・iMessageに対応しますSTACK — 通常のRorkはReact Native(Expo)でiOSとAndroidを同時に生成し、非エンジニアでも実機アプリを作れますPRICE — 料金は無料から用意され、有料プランは月$25から、Rork Maxは月$200ですMARKET — Gartnerは2026年末までに新規アプリの75%が低コード/ノーコード製になると予測しています
記事一覧/AIモデル
AIモデル/2026-07-05上級

家計アプリのAI分類が『その他』に飲まれていくとき — 静かに崩れる支出仕分けを計測して立て直す運用メモ

Rork で作ったAI家計アプリの支出自動分類は、リリース直後は当たっていても数ヶ月かけて静かに精度が落ち、月末アドバイスまで狂わせます。確信度と分類分布を計測してドリフトを先回りする運用手順を、動くコードとともにまとめました。

Rork485AI31finance-appGemini6observability2classification-drift

プレミアム記事

分類は当たっていたはずなのに、助言がずれ始めた

Rork で組んだAI家計アプリを個人開発で運用していました。レシートを撮ると Gemini が金額と店名とカテゴリを抜き出し、月末には支出パターンから助言を出す。リリース直後の手応えは良く、私自身も毎日使っていました。

異変は数ヶ月後、じわじわと来ました。ある月の助言が「食費は落ち着いています」と言うのに、実感は逆。財布はいつもより軽い。おかしいと思って中身を開くと、スーパーの買い物がいくつも「その他」に落ちていました。スーパーの支出が先月の 1.4 倍あるはずなのに、集計上の食費はむしろ減っている。分類が壊れていたのです。

壊れ方が厄介でした。アプリはクラッシュせず、エラーも出さない。ただ、少しずつ「その他」が太り、各カテゴリの数字がやせていく。そして分類を土台にした月末助言が、静かに的外れになっていく。数字は毎月きちんと出ているのに、その数字が信用できなくなっていました。

個人開発で複数のアプリを回している私自身の運用から、この静かな崩れをどう突き止め、どんな計測を足して立て直したのかを、動くコードとともに書き残しておきます。AI に支出やレシートを仕分けさせるアプリを Rork で作っている方に、同じ後手を踏んでほしくないという気持ちで書いています。

「その他」が静かに太っていく

原因を追う前に、なぜ気づけなかったのかを整理しておきます。分類器の故障は、二つの意味で見えにくいものでした。

一つ目は、一件ごとに見れば「その他」は正しい選択肢に見えることです。判断に迷った支出を「その他」に入れるのは、間違いではありません。問題は、その頻度が月を追うごとに上がっていたこと。単発では正常に見える判断が、集計すると異常な傾向を描いていました。

二つ目は、分類器自身が黙っていたことです。Gemini が返す JSON には確信度が入っていましたが、私はそれを分類の枝分かれ(0.5 以下ならユーザーに確認)にしか使っておらず、時系列で眺めていませんでした。確信度は毎回どこかに捨てられ、後から振り返る術がなかったのです。

症状単発で見たとき集計で見たとき
「その他」への割り当て妥当に見える比率が月々上昇
確信度の低下境界値以上なら素通り平均が静かに右肩下がり
助言の的外れ一文だけなら違和感薄い実感と体系的にずれる

分類が崩れた引き金は、後から見ればいくつも重なっていました。利用者が増えて未知の店名が増えたこと、モデル側の挙動が更新でわずかに変わったこと、季節商品でレシートの語彙が変わったこと。どれも一撃ではありません。だからこそ、一件ずつではなく傾向を測る仕組みが要りました。

ここまでお読みいただきありがとうございます。

この記事の続きを読む

この先には、実装コードやベンチマーク結果など、実務でお役に立てる内容をご用意しています。このサイトは広告を掲載しておらず、サーバーや開発にかかる費用はメンバーの皆様のご支援で成り立っています。もしお役に立てていましたら、ご支援いただけますと大変ありがたいです。

この記事で得られること
分類の確信度を一件ずつ記録し、平均確信度の低下を月次で追う計測実装
カテゴリ分布のドリフトを距離で数値化し『その他』の肥大を早期に検知する手順
ユーザー訂正率を裏の正解として使い、助言生成の手前で分類の健全性を判定するゲート
Stripe による安全な決済 · いつでもキャンセル可能

この記事を購入する

この先の内容をすべてお読みいただけます。一度のご購入で、いつでも何度でもアクセスできます。このサイトは広告を掲載しておらず、皆さまのご支援がサーバー費用などの運営を支えています。

または
メンバーシップなら全記事が読み放題 →
シェア

お読みいただきありがとうございます

Rork Lab は広告なしで運営しており、サーバー費用などの運営コストはメンバーシップのご支援で賄っています。実装コード・ベンチマーク・本番設計パターンなど、実務でお役立ていただける記事を毎日更新しています。もし読んでよかったと感じていただけましたら、ぜひご覧ください。

  • コピー&ペーストで使える実装コード付き
  • 毎日新しい上級ガイドを追加
  • ¥580/月 または ¥1,480 の永久アクセス
メンバーシップを見る →

関連記事

AI モデル2026-05-05
Rork で作る AI 資格試験対策アプリ:苦手分野を自動分析して合格を最短で目指す仕組み
Rork と Gemini API を組み合わせて、AI が苦手分野を分析する資格試験対策アプリを作ります。問題演習・弱点特定・アダプティブ学習の仕組みを実装し、App Store への公開まで解説します。
AI モデル2026-06-17
Rork でバグ修正を AI に任せる線引き — 自己解決7割を運用に織り込むトリアージ手順
Rork に渡したバグの多くは数回の再生成で直りますが、一部は直すたびに別の症状を生む堂々巡りに入ります。任せ続ける範囲と手で引き取る範囲を分けるトリアージ手順を、退却ライン・回帰ガード・判断ログまで実例つきで整理します。
AI モデル2026-05-05
Rork の AI 生成で実務レベルの UI を作るプロンプト設計ガイド
Rork の AI がどのようにプロンプトを解釈するかを理解し、フォーム・リスト・カードなどの実務で使えるコンポーネントを意図通りに生成するテクニックを紹介します。
📚RECOMMENDED BOOKS
大規模言語モデル入門
山田育矢
LLM開発
生成AIプロンプトエンジニアリング入門
我妻幸長
プロンプト
Claude CodeによるAI駆動開発入門
平川知秀
AI駆動開発
※ アフィリエイトリンクを含みます
もっと見る →