Может ли ИИ стать вторым разработчиком игры: честный эксперимент
Может ли ИИ стать вторым разработчиком игры:
честный эксперимент
Вокруг ИИ сейчас слишком много громких обещаний. Всюду твердят, что ИИ заменит полноценных разработчиков, однако на деле всё не так просто. Да, ИИ умеет ускорять работу: помогает со стартом проекта, создает структуру, предлагает решения, экономит время на рутине. Однако между простой генерацией кода и созданием рабочего проекта большая разница.
Мне захотелось проверить это на реальном примере. Может ли ИИ стать не просто генератором кода, а вторым разработчиком в небольшом игровом проекте. Не полностью заменить человека, а взять на себя часть работы, ускорить разработку и не провалиться на первых же доработках.
Почему я взял именно игру?
Небольшая браузерная игра – отличный формат для моего эксперимента. Это не гигантский проект, но и не примитивная задача на пару функций. В игре будет несколько вещей, которые смогут проверить ИИ: игровые состояния, таймеры, различные механики, дизайн и графика. Важно чтобы проект был цельным, понятным и пригодным для будущей разработки.
Какие ИИ я буду использовать?
В эксперименте участвуют:
- ChatGPT 5.4 high (в среде ai)
- Gemini 3.1 Pro (в Google AI Studio)
Сразу уточню: это не идеальное чистое сравнение двух моделей, это сравнение AI-инструментов в тех средах, где они реально используются. На результат влияет не только сама модель, но и интерфейс, работа с файлами, способ редактирования кода и общее удобство взаимодействия.
Разнообразие в этом эксперименте даже к лучшему, оно поможет узнать, с каким инструментом реально удобнее и результативнее создавать игру.
Что я хочу проверить?
Может ли ИИ быть не просто генератором кода, но и реальным полноценным помощником в разработке игры?
Меня интересует не только конечный результат, но и более важные вещи:
- Насколько хорошо ИИ понимает задачу?
- Можно ли сразу получить рабочий вариант игры?
- Удобно ли вносить правки?
- Экономит ли время использование ИИ?
Какую я игру выбрал?
Для эксперимента я выбрал небольшую 2D браузерную игру в космическом сеттинге. Игрок управляет космическим кораблем, который летит сквозь космос, уклоняется от метеоров и собирает нужное количество монет для победы. В игре есть 3 уровня, таймер прохождения, экраны победы и поражения, а также лучший результат для каждого уровня.
Такая игра идеально подходит под поставленную задачу.
Как устроен эксперимент?
Чтобы сравнение было честным, обе нейросети получают одинаковый промт с одинаковой задачей.
Дальше я смотрю на несколько параметров:
- Насколько быстро получается рабочий результат?
- Полный ли объем требований выполнен?
- Есть ли ошибки?
- Выглядит ли прототип достаточно хорошо для дальнейшей разработки?
Этот эксперимент не нацелен на выявление лучшей модели, он направлен на изучение поведения различных AI-инструментов в реальной задаче, чтобы узнать, где ИИ реально помогает, а где вредит.
Раунд 1: игра с нуля
На первом этапе всё начинается с одного промта, который я отправил в одинаковом виде в ChatGPT 5.4 high и в Gemini 3.1 Pro. По ссылке можно увидеть его: https://disk.yandex.ru/i/uzVbyxAUokRkYQ.


Первый результат: визуал против рабочей механики
С первого промта стало понятно, что обе нейронки пошли в разные стороны.
ChatGPT сделал более аккуратную и визуально красивую версию. Главный экран выглядит собранно: есть карточки уровней, заявленный стиль выполнен, цветовая палитра выбрана верно. Дизайн впечатляет.

Однако, как только дело дошло до геймплея, начались проблемы. На уровне нет метеоритов, нет монет, а значит основная цель игры не выполнена. Кроме того текст в верхней части накладывается друг на друга.
Таким образом, ChatGPT лучше справился с визуалом, чем с игровой логикой.

У Gemini результат вышел совершенно противоположный. Визуально игра грубее и проще: стиль не совсем соответствует заявленному, фон и оформление сильно уступают версии от ChatGPT. Общий вид игры напоминает скорее технический прототип, а не аккуратную игру.

Зато по механикам Gemini оказался намного ближе к поставленной задаче. В игре есть: метеориты, монеты, движение игрока, анимации, счетчик, таймер и экраны победы или поражения. Это уже действительно рабочая основа игры. Единственные минусы – отсутствие кнопки паузы и не такой крутой визуал. Но по главному критерию, а именно насколько рабочая игра получилась, Gemini ушел вперёд.

По итогам первого раунда получился интересный результат: ChatGPT лучше оформил идею, а Gemini лучше реализовал логику. Здесь и становится понятно, что инструменты отличаются в понимании задачи. Обе модели показали совершенно непохожие друг на друга результаты.
Теперь нужно посмотреть, как обе системы справятся с исправлением своих недочетов. Для ChatGPT – сможет ли он реализовать до конца все механики игры, а для Gemini – сможет ли он подтянуть графику и добавить кнопку паузы.
Раунд 2: результат неплох, но не идеален
После первого раунда я отправил моделям промт с указанием на слабые места и попросил доработать их, сохраняя то что уже вышло неплохо.
Здесь было важно не просто получить новый код, а посмотреть, как нейросети умеют чинить и развивать уже существующий проект. Однако разница между моделями не сократилась.
ChatGPT улучшил визуал игры и мелкие детали, например, анимация подбора монет с легкими вспышками. На уровне наконец появились монеты и метеориты, текст стал корректно отображаться, сама сцена стала ближе к космическому стилю, который я задавал в промте.

Но при этом проблемы с играбельностью остались. Главная проблема – поведение объектов. Хотя монеты и метеоры и появились, но они не летят в направлении игрока, а просто дрейфуют в верхней части экрана. Механика вроде бы и есть, но не работает как надо. Также экраны победы и поражения приятно визуально изменились, но кнопки в них не работают и игрок просто зависает в этом меню навсегда.


У Gemini получился другой результат. Он сохранил тот же стиль, но немного обновил цвета и интерфейс. Визуально проект всё ещё выглядит слабее, чем у ChatGPT.

Зато по части логики Gemini вновь стал лучше. Пауза работает, кнопки в меню работают, переходы между состояниями игры не сломаны, основная механика игры не сломана и работает идеально. Проще говоря, Gemini сохранил своё главное преимущество – надёжность логики.
Второй раунд только усилил первое впечатление. ChatGPT лучше справляется с визуалом, но как только дело доходит до строгой логики поведения объектов он всё еще может оставить проект недоделанным. Gemini действует совершенно наоборот, он лучше держит механику и структуру игры, но при этом в графике он не спешит радикально меняться.
Раунд 3: исправление недочетов дается сложнее всего
На последнем этапе я решил не усложнять и расширять игру, а продолжить дорабатывать слабые места, чтобы проверить, умеют ли модели добивать до конца свои слабые места.
ChatGPT получил понятный промт: сохранить сильный визуал и наконец реализовать корректно игровые механики. И с этим он не справился. В какой-то степени он даже ухудшил результат: монеты и метеориты теперь почти не появляются, видно лишь несколько объектов, которые всё также дрейфуют сверху экрана и не летят вниз. В игру так и не получилось поиграть.

Это важно: ChatGPT хорошо чувствует подачу, интерфейс и визуал, но на этапе точечной доработки он проваливается. Его версия всё еще просто красивый макет игровой сцены, но не рабочая игра.
У Gemini ситуация противоположная. Он тоже не совершил чуда и не дал крутой графики. Дизайн лишь чуть-чуть улучшился. Видно, что ИИ опирается на выбранную ранее стилистику и не может её радикально переосмыслить.

Но прогресс всё же есть: Gemini улучшил внешний вид игрока, метеоров и монет. Но самое главное – игра осталась рабочей, в неё можно поиграть. Это показывает, что в данном случае ИИ лучше справляется со структурой и строго логикой.

После этого раунда продолжать эксперимент нет смысла, так как лучше не становится. Проект до ума никто так и не довел.
Итоговая таблица:
| Критерий | ChatGPT 5.4 high | Gemini 3.1 Pro |
|
Визуальный стиль |
сильнее |
слабее |
|
Меню и UI |
сильнее |
проще |
|
HUD и мелкие эффекты |
сильнее |
средне |
|
Игровая механика |
слабее |
сильнее |
|
Работа кнопок и состояний |
нестабильно |
стабильно |
|
Пауза и переходы |
средне |
хорошо |
|
Надёжность при доработке |
ниже |
выше |
|
Итог |
скорее демо |
скорее рабочая основа |
Так может ли ИИ стать вторым разработчиком игры?
ДА, но с очень важными нюансами.
ИИ реально помогает создавать прототипы, структуру, выполняет множество рутинных задач, может набросать интерфейс или механику. Это не просто чат для развлечений, а реальный инструмент, который экономит время.
НО назвать ИИ полноценным разработчиком никак нельзя. Проблема в том, что сильные стороны нейросетей слишком неравномерны. Модели в чем то да недотягивают при разработке проекта, будь то графика или логика. В любом случае человеку приходится помогать нейросети:
- Формулировать задачу
- Проверять результат
- Замечать ошибки
- Решать, что оставить, а что переделать
- Оценивать реальную готовность проекта
Таким образом, ИИ сегодня – это не второй разработчик, который способен сделать игру от начала и до конца. Это полезный ассистент, который сильно ускоряет работу при грамотном управлении человеком.
Это и есть главный итог эксперимента.

Doggy1227