Может ли ИИ стать вторым разработчиком игры: честный эксперимент

Может ли ИИ стать вторым разработчиком игры: честный эксперимент


Может ли ИИ стать вторым разработчиком игры:

честный эксперимент

Вокруг ИИ сейчас слишком много громких обещаний. Всюду твердят, что ИИ заменит полноценных разработчиков, однако на деле всё не так просто. Да, ИИ умеет ускорять работу: помогает со стартом проекта, создает структуру, предлагает решения, экономит время на рутине. Однако между простой генерацией кода и созданием рабочего проекта большая разница.

Мне захотелось проверить это на реальном примере. Может ли ИИ стать не просто генератором кода, а вторым разработчиком в небольшом игровом проекте. Не полностью заменить человека, а взять на себя часть работы, ускорить разработку и не провалиться на первых же доработках.

Почему я взял именно игру?

Небольшая браузерная игра – отличный формат для моего эксперимента. Это не гигантский проект, но и не примитивная задача на пару функций. В игре будет несколько вещей, которые смогут проверить ИИ: игровые состояния, таймеры, различные механики, дизайн и графика. Важно чтобы проект был цельным, понятным и пригодным для будущей разработки.

Какие ИИ я буду использовать?

В эксперименте участвуют:

  • ChatGPT 5.4 high (в среде ai)
  • Gemini 3.1 Pro (в Google AI Studio)

Сразу уточню: это не идеальное чистое сравнение двух моделей, это сравнение AI-инструментов в тех средах, где они реально используются. На результат влияет не только сама модель, но и интерфейс, работа с файлами, способ редактирования кода и общее удобство взаимодействия.

Разнообразие в этом эксперименте даже к лучшему, оно поможет узнать, с каким инструментом реально удобнее и результативнее создавать игру.

Что я хочу проверить?

Может ли ИИ быть не просто генератором кода, но и реальным полноценным помощником в разработке игры?

Меня интересует не только конечный результат, но и более важные вещи:

  • Насколько хорошо ИИ понимает задачу?
  • Можно ли сразу получить рабочий вариант игры?
  • Удобно ли вносить правки?
  • Экономит ли время использование ИИ?

Какую я игру выбрал?

Для эксперимента я выбрал небольшую 2D браузерную игру в космическом сеттинге. Игрок управляет космическим кораблем, который летит сквозь космос, уклоняется от метеоров и собирает нужное количество монет для победы. В игре есть 3 уровня, таймер прохождения, экраны победы и поражения, а также лучший результат для каждого уровня.

Такая игра идеально подходит под поставленную задачу.

Как устроен эксперимент?

Чтобы сравнение было честным, обе нейросети получают одинаковый промт с одинаковой задачей.

Дальше я смотрю на несколько параметров:

  • Насколько быстро получается рабочий результат?
  • Полный ли объем требований выполнен?
  • Есть ли ошибки?
  • Выглядит ли прототип достаточно хорошо для дальнейшей разработки?

Этот эксперимент не нацелен на выявление лучшей модели, он направлен на изучение поведения различных AI-инструментов в реальной задаче, чтобы узнать, где ИИ реально помогает, а где вредит.

Раунд 1: игра с нуля

На первом этапе всё начинается с одного промта, который я отправил в одинаковом виде в ChatGPT 5.4 high и в Gemini 3.1 Pro. По ссылке можно увидеть его: https://disk.yandex.ru/i/uzVbyxAUokRkYQ.

Первый результат: визуал против рабочей механики

С первого промта стало понятно, что обе нейронки пошли в разные стороны.

ChatGPT сделал более аккуратную и визуально красивую версию. Главный экран выглядит собранно: есть карточки уровней, заявленный стиль выполнен, цветовая палитра выбрана верно. Дизайн впечатляет.

Однако, как только дело дошло до геймплея, начались проблемы. На уровне нет метеоритов, нет монет, а значит основная цель игры не выполнена. Кроме того текст в верхней части накладывается друг на друга.

Таким образом, ChatGPT лучше справился с визуалом, чем с игровой логикой.

У Gemini результат вышел совершенно противоположный. Визуально игра грубее и проще: стиль не совсем соответствует заявленному, фон и оформление сильно уступают версии от ChatGPT. Общий вид игры напоминает скорее технический прототип, а не аккуратную игру.

Зато по механикам Gemini оказался намного ближе к поставленной задаче. В игре есть: метеориты, монеты, движение игрока, анимации, счетчик, таймер и экраны победы или поражения. Это уже действительно рабочая основа игры. Единственные минусы – отсутствие кнопки паузы и не такой крутой визуал. Но по главному критерию, а именно насколько рабочая игра получилась, Gemini ушел вперёд.

По итогам первого раунда получился интересный результат: ChatGPT лучше оформил идею, а Gemini лучше реализовал логику. Здесь и становится понятно, что инструменты отличаются в понимании задачи. Обе модели показали совершенно непохожие друг на друга результаты.

Теперь нужно посмотреть, как обе системы справятся с исправлением своих недочетов. Для ChatGPT – сможет ли он реализовать до конца все механики игры, а для Gemini – сможет ли он подтянуть графику и добавить кнопку паузы.

Раунд 2: результат неплох, но не идеален

После первого раунда я отправил моделям промт с указанием на слабые места и попросил доработать их, сохраняя то что уже вышло неплохо.

Здесь было важно не просто получить новый код, а посмотреть, как нейросети умеют чинить и развивать уже существующий проект. Однако разница между моделями не сократилась.

ChatGPT улучшил визуал игры и мелкие детали, например, анимация подбора монет с легкими вспышками. На уровне наконец появились монеты и метеориты, текст стал корректно отображаться, сама сцена стала ближе к космическому стилю, который я задавал в промте.

Но при этом проблемы с играбельностью остались. Главная проблема – поведение объектов. Хотя монеты и метеоры и появились, но они не летят в направлении игрока, а просто дрейфуют в верхней части экрана. Механика вроде бы и есть, но не работает как надо. Также экраны победы и поражения приятно визуально изменились, но кнопки в них не работают и игрок просто зависает в этом меню навсегда.

У Gemini получился другой результат. Он сохранил тот же стиль, но немного обновил цвета и интерфейс. Визуально проект всё ещё выглядит слабее, чем у ChatGPT.

Зато по части логики Gemini вновь стал лучше. Пауза работает, кнопки в меню работают, переходы между состояниями игры не сломаны, основная механика игры не сломана и работает идеально. Проще говоря, Gemini сохранил своё главное преимущество – надёжность логики.

Второй раунд только усилил первое впечатление. ChatGPT лучше справляется  с визуалом, но как только дело доходит до строгой логики поведения объектов он всё еще может оставить проект недоделанным. Gemini действует совершенно наоборот, он лучше держит механику и структуру игры, но при этом в графике он не спешит радикально меняться.

Раунд 3: исправление недочетов дается сложнее всего

На последнем этапе я решил не усложнять и расширять игру, а продолжить дорабатывать слабые места, чтобы проверить, умеют ли модели добивать до конца свои слабые места.

ChatGPT получил понятный промт: сохранить сильный визуал и наконец реализовать корректно игровые механики. И с этим он не справился. В какой-то степени он даже ухудшил результат: монеты и метеориты теперь почти не появляются, видно лишь несколько объектов, которые всё также дрейфуют сверху экрана и не летят вниз. В игру так и не получилось поиграть.

Это важно: ChatGPT хорошо чувствует подачу, интерфейс и визуал, но на этапе точечной доработки он проваливается. Его версия всё еще просто красивый макет игровой сцены, но не рабочая игра.

У Gemini ситуация противоположная. Он тоже не совершил чуда и не дал крутой графики. Дизайн лишь чуть-чуть улучшился. Видно, что ИИ опирается на выбранную ранее стилистику и не может её радикально переосмыслить.

Но прогресс всё же есть: Gemini улучшил внешний вид игрока, метеоров и монет. Но самое главное – игра осталась рабочей, в неё можно поиграть. Это показывает, что в данном случае ИИ лучше справляется со структурой и строго логикой.

После этого раунда продолжать эксперимент нет смысла, так как лучше не становится. Проект до ума никто так и не довел.

Итоговая таблица:

Критерий ChatGPT 5.4 high Gemini 3.1 Pro

Визуальный стиль

сильнее

слабее

Меню и UI

сильнее

проще

HUD и мелкие эффекты

сильнее

средне

Игровая механика

слабее

сильнее

Работа кнопок и состояний

нестабильно

стабильно

Пауза и переходы

средне

хорошо

Надёжность при доработке

ниже

выше

Итог 

скорее демо

скорее рабочая основа

Так может ли ИИ стать вторым разработчиком игры?

ДА, но с очень важными нюансами.

ИИ реально помогает создавать прототипы, структуру, выполняет множество рутинных задач, может набросать интерфейс или механику. Это не просто чат для развлечений, а реальный инструмент, который экономит время.

НО назвать ИИ полноценным разработчиком никак нельзя. Проблема в том, что сильные стороны нейросетей слишком неравномерны. Модели в чем то да недотягивают при разработке проекта, будь то графика или логика. В любом случае человеку приходится помогать нейросети:

  • Формулировать задачу
  • Проверять результат
  • Замечать ошибки
  • Решать, что оставить, а что переделать
  • Оценивать реальную готовность проекта

Таким образом, ИИ сегодня – это не второй разработчик, который способен сделать игру от начала и до конца. Это полезный ассистент, который сильно ускоряет работу при грамотном управлении человеком.

Это и есть главный итог эксперимента.

Оценить публикацию