VibeCode Claude - FAQ
codexОсновная статья:
https://telegra.ph/Api-Vibecode-Claude-04-10
Ошибки и вопросы:
1) ВПН - самая частая ошибка. Все наши сервисы на Cloudflare - поэтому без ВПН у вас ничего работать не будет. Даже дашборд. Смените 2-3 раличных ВПН, прежде чем писать, что не ничего работает.
2) Подключаете не того провайдера. Вы может быть выбрали просто Anthropic и ввели ключ, и он выдает 401 или 403. Наш сервис будет работать, только если вы указали И наш base url (https://api.vibecode-claude.online), И апи ключ. Если вы только указали апи ключ - значит вы 100% подключили НЕ наш сервис, а что-то другое. Провайдер всегда должен быть либо Custom provider, либо OpenAI Compatible - именно с Compatible, а не просто OpenAI!!! И они должны предложить указать URL. Без него ничего не получится
3) Выдает 401 ошибку (Invalid Key) в Claude Code CLI - значит вы не нажали Yes в последнем шаге, а нажали No (легко перепутать, так как No стоит по умолчанию и светится зеленым). В таком случае переустановите полностью claude - удалите все локальные папки. Если не поможет (так как ключ отдельно кэшируется и добавляется в ЧС у вас локально, мы не знаем где именно) - пишите мне в лс, выдам другой ключ, но это может занять время
4) Выдает ошибку 503 - проблема нашего сервиса. Лежит больше 1-2 часов - пишите мне по контактам
5) Выдает ошибку 502 - наш сервис лежит. То же что и выше
6) Ошибка 400 - это несовместимость используемых tools вашего приложения с нашим АПИ. Такое бывает редко, мы над этим работаем. Просто повторите запрос снова. А лучше отпишите мне - буду фиксить. Это либо проблема нашего провайдера, либо вашего приложения, это надо всегда отдельно выяснить. Такие ошибки уже случаются очень редко.
7) Ошибка 429 - вы шлете много мелких запросов. Такое бывает редко и только если вы ставите ключ на обслуживание чат ботов или на реселл. Мы такое не разрешаем без согласования. То есть наши ключи предназначены ТОЛЬКО для кодинга. Мы пробрасываем АПИ с реальных AWS аккаунтов и вяжем их к вашему ключу. Их АПИнельзя использовать для чат-ботов и сотни мелких запросов - только для нормального кодинга. В случае если вы просто нормально программируете - рейт лимита у вас быть не может никак (отпишите в поддержку в ином случае)
8) Ошибка 401 Key is deactivated - закончился баланс. Проверьте дашборд, посмотрите свои запросы, убедитесь в этом. Если баланс остался - отпишите мне по контактам
9) Любые другие ошибки - ПОМЕНЯЙТЕ ВПН. Очень часто просто плохой/дешевый VPN - из-за этого Claude не пускает. Попробуйте поменять 2-3 разных ВПНа. Не помогло - в таком случае кидайте скрин и отписывайте.
10) У нас есть модели по умолчанию, в случае если вы шлете ломанное или неверное имя модели. Например если вы шлете gpt-4.1-mini (которой у нас нет), запрос пойдет на модель по умолчанию gpt-5.4-mini. Если вы указали с опечаткой, например gpt-5.4-high (а унас только xhigh), то запрос тоже пойдет на gpt-5.4-mini. Вы можете видеть запросы в дашборде, сверяйте точно имя модели которое шлете. Для Claude по умолчанию такой моделью является claude-haiku-4.5, для Gemini - gemini-pro-3.1-low
11) Наши модели НЕ поддерживают генерацию изображений или их распознание. Только чат, кодинг (текст). И видео тоже не поддерживают, в т.ч. и gemini модели.
12) Расширение Claude Code в VS Code также работает. Сначала настройте по инструкции Claude Code CLI. Как только у вас получится (модель выдаст первый ответ) - врубайте расширение, там все подтянется, и ничего отдельно там делать не нужно. Главное не пытайтесь с нуля через расширение все настроить - у вас скорее всего просто не получится, и еще можете что-то сломать.
13) При новой покупке вы получаете новый ключ. Баланс на старый НЕ начисляется. Поэтому вам придется поменять его. Если часто и много покупаете - рекомендуем просто брать ключи с большим лимитом.
14) Любые ошибки по типу Connection Error, ERR_CONN_RESET и т.п. - 99% случаев надо либо включить ВПН, либо сменить локацию, либо попробовать другой. Всех лучше брать США
15) Поддержка Cursor: тут есть важные особенности. Cursor - VS code форк, поэтому там будет работать все то же что и в VS code - Claude расширение, Kilo code, Roo code и т.п. Можете спокойно пользоваться. Рекомендую Claude. Никакой подписки для этого там не нужно, даже логинить аккаунт необязательно. НО также там можно и встроить наш сервис НАТИВНО (чтобы работало так же как и обычный курсор), но эта настройка открывается только на платных планах (Pro и выше). В models ниже выбираете Use own Api Key - далее Openai, далее override base url. При этом Cursor не позволяет использовать MCP при таком варианте (это официальные ограничения с его стороны). Остальное (субагенты, tools) - работает, но не 100% стабильно.
16) В дашборде информация отображается в кредитах. 1 кредит = 50 тысяч токенов. При этом если вы используете более легкие модели - расход идет меньше. К примеру для Claude - Opus 4.6 расходует с лимитами 1x, Sonnet 4.6 - 0.7x, Haiku - 0.5x. С Gemini: gemini 3.1 pro high - 1x, pro low - 0.8x, flash - 0.5x. У Gpt codex и gpt 5.4 - 1x, а mini - 0.5x.
17) Поддержка Claude Opus 4.7 добавлена 21.04.2026. Цена такая же, как для Opus 4.6. Размер контексного окна 1 миллион, но мы пока что урезаем до 600-700к для стабильности (вас это в идеале касаться не должно, так как нами уже отмечалось, что фактически больше 200-250к контекста вам тянуть не стоит, так как просто модели будут тупить, а вы получите высокий расход). Claude Opus 4.7 может больше думать перед ответами, чаще рейтлимить. AWS добавил их недавно и не на все аккаунты, поэтому у нас меньше экземпляров, но работаем над этим. Зато честно, в отличие от других селлеров, которые добавили все спустя секунду, сами знаете каким образом. Также для Opus 4.7, как и для других моделей, НЕ доступна регуляция уровня мышления. Идет базовый низкий уровень мышления. Получаете выше скорость и очень низкую стоимость, но надежность падает на 10-20%.
18) Как убедиться, что мы не обманываем вас с моделью?
а) Не полагайтесь на "Какая ты модель?" вопрос. Это самый бессмысленный вопрос, который решается систем промптом. Наши модели могут часто говорить, что они Kiro - поскольку мы делаем через этого провайдера (это официальная IDE Amazon сервиса, которая предоставляет доступ к моделям Claude)
б) Не полагайтесь на "чуйку". Модели уже тяжело друг от друга отличить. Но различные LLM имеют свой "стиль" того, как они работают. Например как они пилят фронт и т.п. Это для вас может быть наводкой, но не 100% идентификатором
в) Knowledge Cutoff - хорошая штука, но вообще ненадеждная. https://github.com/HaoooWang/llm-knowledge-cutoff-dates - здесь например представлен список последних знаний всех моделей. Суть в том, что продавец может подменить систем промпт и заставить диписика представляться опусом - но он не расскажет ему все события, которые он не застал в своем обучении. Спрашивайте имеено про события, а не просто про дату. Саму дату многие модели выдают ошибочно, например Gpt-5.4 в lm.arena мне пишет за июнь 2024, в codex на за начало 2025 года, в чате ChaGPT - честный август 2025. Но это вообще ненадежно - спрашивайте именно про события. И если вы видите, что отвечает не так - проверьте оригинальную модель. А она точно ответит?
г) JailBreak. Эта штука поинтереснее. Есть различные способы обойти защиты у всяких LLM (защита на написание читов, аудита безопасности и т.п.). Они есть в свободном доступе. И как правило - то, что работатае на Claude Opus 4.6 - может например не работать на Gemini, а наоборот. Это уже хороший и более продвинутый метод. Что самое интересное - китайские модели, по типу Glm, Minimax, Kimi, Qwen - они в целом более податливы под написание всякого такого. Наши модели например очень часто напрочь отказываются писать читы и подобные программы - придется юзать jailbreak. Китайцы же будут меньше ломаться. Тоже идентификатор.
д) Вопросы про политику. Ходит слух, что китайские модели не отвечают на китайские острые политические вопросы. На самом деле это также вопрос jailbreak. Если вы слышали про DarkGPT - их делают как раз именно на базе китайских моделей. Они им напрочь отключают инструкции и работают на них очень мощно. Так что и про политику они могут забыть. Как вариант можно - но не полагайтесь сильно. Конечно, важно учитывать, что многие провайдеры, которые пытаются вас обмануть - просто и не знают про эти jailbreak, и это вам просто позволяет спокойно использовать этот метод. Но имейте в виду, что иногда и Opus не ответит на подобные вопросы в виду политкорректности. Так что задавайте с умом
е) Контекст. Ни одна китайская опенсурс модель не поддерживает 1М контекста. Максимум 400к. Если ваш провайдер говорит за опус 4.7, но 400к контекст рубит лимиты и выдает ошибку - очень хороший повод задуматься. Исключение - Qwen3.6 Plus.
ж) БЕНЧМАРКИ. Самый лучший вариант, и я всегда говорю про него. Подключайте к апишке, смотрите бенчмарки. Это реальные задания, которые дадут модели рейтинг. Сравните это с официальными показателями. Таких очень много. Вот например бенчмарк по математике https://github.com/openai/simple-evals. Вот более соревновательный бенчмарк https://github.com/lmarena/arena-hard-auto. Тратит это проверка 10-20М токенов. Для тех, кто собиратеся покупать на 200+М - это проверка точно того стоит. Я привел лишь примеры репо, они могут быть устаревшими. Сам тейк в том, что вам надо запускать сравнение в реальном времени на реальных задачах. При этом имейте в виду - смотрите вот эту доску по интегральным бенчмаркам: https://artificialanalysis.ai/leaderboards/models. Опус 4.7 макс новейший примерно на 15-20% в сумме сильнее опенсурсной китайской глм 5.1. Это означает что иногда на бенчмарках они будут показывать себя одинаково - а на реальных задачах - по разному. Поэтому выбирайте тщательно бенчмарки. Я привел тут лишь для примера. Вполне возможно, что Math500 на 100% решит как Opus, так и Qwen.
з) Ваш личный опыт. Возьмите заготовку проекта, в котором вы разбираетесь как в своих пяти пальцах. Попросите модель изучить его, предложить правки, и САМИ пытайтесь подумать и понять, что это за модель, насколько она компетентна. Потратьте 20-30 долларов чтобы потестить на реальном опусе и понимать, как отвечает он. Сравните с Gemini через антигравити, с GPT через Codex. Купите через опенроутер другие модели китайские - посмотрите на специфику их ответов. За 2-3 дня вы научитесь понимать стиль каждой, и вас не смогут обмануть. Фактически именно это самый надежный способ. Он конечно субъективный, но он самый надежный, так как программировать и создавать проекты будете именно вы.
19) Я возвращаю деньги, если вы считаете, что с моделью что-то не так. Я продаю оригинальный Claude через AWS (хоть там и нельзя регулировать мышление), но я могу понять ощущение, когда после негативного опыта покупки фейк моделей вы подозреваете все вокруг и не можете быть уверены ни в чем. ЕДИНСТВЕННОЕ, что я прошу - написать об этом как можно раньше, пока потратили минимальное количество ключа, нормально и внятно объяснить ситуацию, а также общаться адекватно. Я оставляю за собой право принимать решение, но в целом я отношусь к этому нейтрально. Я заточен на постоянных лояльных клиентов, поэтому готов делать бэки в случае проблем
20) Ошибки 400. Когда вам приходит такая ошибка - постарайтесь отправить текст этой ошибки. Разные среды требуют различной совместимости, и иногда что-то не работает для новых сред. Просто сообщайте мне об этом непосредственно в чат, можете писать по несколько раз, если не отвечаю. Все ошибки 400 - это проблема и на нашей, и на вашей стороне одновременно. Ваша среда может слать нестандартные tool call, или может быть вы отправили картинку (они у нас официально не поддерживаются - фактически иногда да, иногда нет). Для начала попробуйте стартануть новую сессию, перейти на другую среду, если возможно. Или отписывайте нам, иногда мы можем легко тоже и оперативно на своей стороне подправить, и у вас все заработает.
21) Ошибки 510. Эту ошибку мы возвращаем вам, когда вы своими запросами слишком сильно нагружаете наш сервис. Это может быть как из-за того, что мы испытываем временные проблемы, так и из-за того, что вы действительно делаете что-то не так. Это не связано с частотой запросов или с их размером, а именно с качеством - возможно шлете слишком много битого контекста или что-то в этом роде. В любом случае - ОТПИСЫВАЙТЕ обязательно в чат, я персонально смотрю и анализирую что там такое. В 90% случаев это связано с NON stream text.
22) "Я Kiro - ИИ ассистент". Наши модели работают на базе Kiro провайдера - kiro.dev сайт. Это официальный сервис Amazon, он проксирует доступ к моделям Claude, которые сам Amazon у себя хостит. Можете это проверить, это официальная информация. Поскольку мы пробрасываем запросы через их сервис - фактически получается, что он зачастую представляется Kiro, а не Claude Opus и т.п. Мы могли бы подменить системный промпт и заставить его представляться кем угодно, но мы этого не делаем, поскольку нам нечего скрывать. Мы указываем в описании товара, что происхождение - сервис AWS bedrock. Kiro - это НЕ ОТДЕЛЬНАЯ LLM - прогуглите это пожалуйста, такой не сущесвует вообще. Это - СЕРВИС, подобно Openrouter. Фактическое имя модели у вас показывается в дашборде. Если не верите - просто прогуглите, что такое Kiro - спросите у чатгпт с поиском в инете и подобное. Это все открытая информация, легко проверямая! Если бы мы хотели подменить имя модели - мы бы это очень легко сделали и заставляли бы ее представляться кем угодно, но мы этого не делаем. Реальные проверки, как понять, что это за модель, указана и описана выше.
23) Кэширование не поддерживается. Это никак не влияет на производительность. Если вы про стоимость - сервис и так стоит 10 центов за 1 миллион входящих токенов, что в 50 раз меньше официальной цены и при этом в раз 5 меньше кэшированной цен. Вы хотите, чтобы кэширование по итогу вообще делало стоимость 1м токенов вам в 1 цент? В контексте производительности это никак не влияет, на нашей стороне оно реализуется по отношению к провайдеру, и он нормально читает всю вашу историю и т.п.