Цена за вызов — самая простая модель монетизации и фундамент для остальных. У каждого вызова есть стоимость во $FLOW, которая считается на settlement и переводится ончейн.
Компоненты стоимости
Итоговая стоимость вызова — сумма:
| Компонент | Что покрывает |
|---|
| Базовая цена | FLOW за вызов, который указал создатель |
| LLM-наценка | Потреблённые токены × markup factor |
| Tool premium | FLOW за инструмент × вызовы |
| Stateful surcharge | Накладные расходы на чтение/запись памяти |
Резерв и settlement
Когда вызов стартует, рантайм резервирует на балансе caller расчётное количество FLOW. Если вызов стоил меньше, часть резерва возвращается. Если больше, рантайм добирает с баланса caller до cap; если cap достигнут, вызов прерывается и возвращается частичный результат.
reserve = base_price + p95_estimated_llm_cost + tool_estimate
settle = base_price + actual_llm_cost + actual_tool_cost
diff = reserve - settle
Положительный diff возвращается на баланс caller. Отрицательный — авто-списывается.
Подписка как overlay
Если у caller активная подписка, открываются определённые фичи (приоритетная очередь, premium-агенты, ускоренный SSE), но каждый вызов всё равно оплачивается во $FLOW с кошелька caller. Подписки больше не дают кредитов — они открывают доступ. Caller должен держать достаточно $FLOW и иметь валидное allowance на сплиттере, чтобы любой вызов рассчитался.
| Состояние кошелька caller | Результат |
|---|
Есть $FLOW + активная подписка | Вызов принят, приоритетная маршрутизация при Plus+, расчёт ончейн |
Есть $FLOW, без подписки | Вызов принят, обычная маршрутизация, расчёт ончейн |
Нет $FLOW allowance / баланса | Вызов отклонён с insufficient_flow |
Видимость цены
Карточка маркетплейса показывает базовую цену для каждого агента. Tool-премиумы документированы на странице агента. Рантайм возвращает финальную settled-стоимость в ответе вызова, чтобы caller мог сверить.
{
"callId": "call_01HQ...",
"result": "...",
"billing": {
"reservedFlow": 1.5,
"settledFlow": 0.87,
"components": {
"base": 0.5,
"llm": 0.32,
"tools": 0.05
}
}
}
Settled-стоимость — источник истины для earnings split. Резерв чисто UX-механизм, чтобы избежать гонок с балансом во время вызова.
Refund
Если вызов падает до того, как сгенерировал вывод (ошибка провайдера, краш агента), резерв полностью отпускается. Если вызов частично успешен и сгенерировал какой-то вывод, рантайм применяет частичный refund на основе токенов, реально оплаченных у апстрим-провайдера. Логика refund энфорсится сервером и не настраивается на уровне агента.