Панель
https://zedproxy.pro/v1 для Zed, https://zedproxy.pro для керування
Operator cockpit
Очікую живий стан
Очікується актуальний стан сервісу.
Рекомендована дія
Перевірити live state
Очікується перший live update.
Сервісcheckinghealth очікує
Баланс-policy очікує
Режим-premium/fallback очікує
Останній route-причина очікує
DNSочікуєПеревіряю canonical host
TLSочікуєПеревіряю scheme
Zed APIhttps://zedproxy.pro/v1OpenAI-compatible endpoint
Dashboardhttps://zedproxy.proПанель оператора
IP fallbackhttp://46.202.188.88/zedproxy/Резервний доступ до DNS/TLS
Policyочікує live stateОчікується readiness
Діагностика системи
Запитів сьогодні0
Витрати за день$0.0000
Середнє за вікном$0.00000
Кеш-хіти0%
Активні генерації0
Балансnormalочікує живий стан
Режимautoпровайдер: ok
Активний рівень-причина: -
Ліміт відповіді-кредитні події: -
Наступні дії
очікуєОповіщення
очікуєКанал оповіщень очікує перевірку.
Провайдери
очікуєMCP контур
очікуєАктивні генерації
онлайнПоточні правила маршрутизації
Операційна хронологія policy
очікуєРозподіл моделей
Останні запити
Ключі провайдерів
Як auto працює без ручного втручання
очікуєЯкщо немає стабільної помилки маршрутизації, ручні rules краще не множити. Базова логіка auto вже враховує тип задачі, budget, policy і fallback.
Активні ручні правила
Порядок дій з версіями
крок 1Ця сторінка тепер тільки про версії. Спочатку додаємо або вмикаємо версії, а вже потім з них збираємо робочі гілки.
Версії
Показую список версій у робочому порядку.
Додаткові transport-налаштування версій
Транспорт моделей
Імпорт нових версій з OpenRouter
Каталог OpenRouter
Це живий список моделей OpenRouter. Імпорт додає модель у локальний каталог proxy, після чого її можна обрати в A/B тестах, Playground або правилах маршрутизації.
Гілки
Системні промпти
Пісочниця
A/B тести
Для чесного cold-start порівняння перед A/B тестом очисти кеш у вкладці «Кеш» або тимчасово вимкни його. Інакше повторні однакові запити можуть прийти з кешу й спотворити latency та вартість.
Живі логи
Активні інциденти
Route decisions
Provider incidents
Бюджет
Налаштування застосунку Zed
auto
Швидкий сценарій
Завантажую contract для Zed...
Порядок дій тут один: 1. згенеруй ключ, 2. вибери для нього гілку, 3. встав цей ключ у Zed. Усе інше нижче це перевірка або внутрішня кухня.
Що вставити у Zed
Перевірка без spend
Для першого безкоштовного тесту не чіпай дорогі моделі. Почни з
deepseek-free або llama-free: одна для reasoning smoke, друга для простого baseline.Крок 4. Ключі для Zed
Generated keys
Ще немає даних.
Карта шляху ключів
Шлях кожного ключа читається так: Zed -> ключ -> гілка -> auto. Саме гілка визначає, які версії ключ взагалі може зачепити, а фінальна модель уже обирається правилами, budget і policy.
Перевірка і внутрішні налаштування
Smoke ключа із Zed
Як система прийме рішення по запиту із Zed
без spendЦе dry-run: вставляєш приклад запиту з Zed, а панель пояснює, яку модель, ліміт, cache path і fallback вибере проксі. Це інструмент перевірки після того, як ключ уже створено.
Preview ще не прив'язаний до ключа або гілки.
Внутрішні ключі провайдерів
Ці ключі не вставляються в Zed. Вони потрібні самому проксі для зв'язку з OpenRouter, Anthropic, Gemini та іншими upstream providers.
Кеш
Кеш спільний для всього VPS proxy, а не окремий для кожного проєкту. Ключ кешу залежить від моделі та повного payload запиту, тому однаковий prompt на тій самій моделі може дати кеш-хіт навіть у різних проєктах.
Канонічна схема роботи
- Підключення: Zed працює тільки з
https://zedproxy.pro/v1, моделлюautoі окремим client key. - Виконання: proxy сам вирішує модель, tier, cache, fallback і budget-policy.
- Контроль: оператор дивиться incidents, витрати, route decisions і provider health у dashboard.
- Захист: degraded mode, cheap-only mode, output caps і alerts не дають системі працювати навмання.
- Відновлення: IP fallback і runbook лишаються резервом, а не основним способом роботи.
Що де робиться
- Zed застосунок: тільки provider, API URL, модель
autoі client key. - Сторінка «Zed застосунок»: setup, генерація key, smoke без spend і пояснення flow.
- Operations: alerts, route decisions, provider incidents.
- Маршрути, моделі, промпти, кеш: внутрішня логіка шлюзу, а не налаштування клієнта.
Як працює платформа
- Zed -> VPS Proxy: локальний Zed працює як клієнт, а всі агентні запити йдуть на
https://zedproxy.pro/v1з моделлюauto. - Smart Router: proxy визначає тип задачі, складність, бюджетні обмеження й підбирає модель.
- LiteLLM/OpenRouter: фактичний запит іде в обрану upstream модель через LiteLLM.
- Санітизація: reasoning-поля вирізаються, щоб Zed отримував чисту OpenAI-compatible відповідь.
- Логи й витрати: токени, модель, маршрут, ціна та cache-hit записуються в SQLite базу на VPS.
Автозапуск і сервіси
- Proxy:
https://zedproxy.pro/v1 - Панель:
https://zedproxy.pro - Автозапуск: systemd service
zedproxy.serviceна VPS - Публічний маршрут: домен або IP reverse proxy перенаправляє
/,/v1і/healthу native service. - Кеш: Redis service на VPS, з memory fallback
- Ручні команди:
systemctl status zedproxy,journalctl -u zedproxy -f
Доступ і вхід
- Реєстрації немає: панель відкривається через окреме вікно входу.
- Обліковий запис адміністратора: вхід працює через логін
admin. - Пароль адміністратора: задається тільки через
ZED_DASHBOARD_PASSWORD. - Захист сесії: cookie-session закриває сторінки панелі, керуючі
/apiendpoint-и і websocket логів. - Ключі для Zed: сторінка «Zed застосунок» генерує окремі client keys у форматі OpenRouter (
sk-or-v1-...); у базі зберігається hash і маска, а повний ключ показується один раз. - Вихід: кнопка «Вийти» очищає поточну сесію браузера.
- Зміна доступу: через
ZED_DASHBOARD_USERNAME,ZED_DASHBOARD_PASSWORD,ZED_DASHBOARD_SESSION_SECRET.
Робота через SSH і Zed
- SSH вхід: робоча машина для коду тепер VPS, а основний runtime живе на ньому постійно.
- Папка runtime:
/var/www/Zedproxy. - Робочий режим: відкривай VPS по SSH у Zed і працюй відразу на сервері, без локального proxy/runtime.
- Важливо:
/var/www/Zedproxyце deploy-копія без.git; для повного git-workflow потрібен окремий git clone на VPS або локальний repo як source of truth. - Профіль Zed: у Zed обирай
OpenRouter, вставляй URLhttps://zedproxy.pro/v1, модельautoі згенерований на сторінці «Zed застосунок» ключsk-or-v1-.... - Локальний Mac: локальний proxy вимкнений; редактор лише відправляє запити у VPS API.
- Що перевіряти: якщо щось не відповідає, дивись
journalctl -u zedproxy -fі вкладку «Логи».
Кеш, версії й A/B тести
- Кеш не по проєкту: він спільний для всього VPS proxy.
- Що входить у ключ: назва моделі + payload запиту без
streamполів. - Одна й та сама модель + той самий prompt: може повернутися з кешу, навіть якщо тест іде з іншого проєкту.
- Різні моделі: мають різні cache keys, тому A/B між моделями не ділить один і той самий запис.
- Cold-тест: очистити кеш або вимкнути кеш.
- Warm-тест: лишити кеш увімкненим, щоб дивитися поведінку після прогріву.
- Точні моделі: у A/B формі прапорець «Тестувати точні моделі» не дає budget-router підміняти вибраний варіант.
OpenRouter каталог
- Живий список: вкладка «Моделі» може завантажити актуальний каталог OpenRouter.
- Імпорт: обрана модель додається в локальний каталог proxy з цінами за 1M токенів.
- Тестування: після імпорту модель доступна в A/B тестах, Playground і правилах маршрутизації.
- Zed: редактор усе одно бачить одну модель
auto, а вибір конкретних версій робиться в панелі.
Бюджетна ціль
- Ціль: тримати одну не кешовану генерацію в діапазоні
$0.010-$0.050. - Автоліміт: якщо прогнозована вартість вибраної auto-моделі вища за максимум, router шукає найякіснішу модель, яка вкладається в cap.
- Базовий ліміт відповіді: Zed і proxy стартують із cheap cap
700, tool-cheap900, strong2000, premium3500. - Обмежений режим: при critical/exhausted balance premium routes вимикаються, а output cap автоматично зменшується.
- Якість у межах бюджету: окремий перемикач може піднімати auto до сильнішої моделі, якщо початковий вибір дешевший за мінімальну ціль і сильніша модель вкладається в максимум.
- Аналітика: вкладка «Бюджет» показує останню генерацію, rolling average, запити в цілі й запити вище цілі.
- Реальність: точна ціна відома після відповіді OpenRouter, тому cap працює як прогноз за prompt + очікуваними output токенами.
Стан політики
- Стан балансу:
normal,low_balance,critical_balance,balance_exhausted. - Тільки дешеві моделі: вимикає strong/premium routes і тримає відповіді коротшими.
- Коди причин: кожен request log має
policy_reason_code,policy_tierіeffective_output_cap. - Кредитні події: 402 або
can only afford Nпишуться як policy event, навіть якщо retry потім успішний.
Де лежать дані
- Моделі:
config/models.yaml - Routing rules:
config/routing.yaml - Runtime config:
config/.env - База платформи:
logs/costs.db - Логи процесу:
journalctl -u zedproxy -f
Практичне правило: якщо порівнюєш саме моделі або ціни, тримай однаковий prompt і контролюй стан кешу. Якщо порівнюєш якість на реальній роботі після прогріву, кеш можна залишити ввімкненим.