Genie 3: AI, который превращает текст в живой 3D-мир

GS.BY

Google DeepMind снова удивляет — на этот раз моделью Genie 3, которая способна превращать текстовые описания в динамичные 3D-сцены с разрешением 720p и плавностью 24 кадра в секунду. Да, вы не ослышались: просто напишите, например, «девочка идёт по берегу под дождём» — и модель сгенерирует полноценный анимированный клип.

Реклама

🧠 Что умеет Genie 3?

Genie 3 — это генеративная мультимодальная модель, которая:

  • создаёт трёхмерные сцены по текстовому запросу;

  • работает в реальном времени (в пределах технических ограничений);

  • использует обученные физические и визуальные симуляции для формирования движения и взаимодействия объектов.

Это не просто анимация — это «живой» мир, созданный ИИ на основе абстрактной идеи. По сути, это следующий шаг после текстовых генераторов и видео по промптам.

Новости кибербезопасности: DevSecOps на стероидах: ИИ берёт на себя аудит безопасности

Почему это важно?

Это не просто технологическая демонстрация. Genie 3:

  • приближает нас к AGI (искусственному интеллекту общего назначения), который способен понимать, интерпретировать и воссоздавать сложную реальность;

  • открывает новые горизонты в гейминге, VR/AR, образовании и виртуальной режиссуре;

  • может стать основой для будущих интерактивных ИИ-агентов — которые не только говорят, но и «видят» и «действуют».

 Что дальше?

На фоне гонки LLM и генеративных моделей, Genie 3 демонстрирует, что будущее не ограничивается чатами и картинками. Мы уже вступаем в эпоху, где одна строка текста — это сценарий для целого виртуального мира.


 Комментарий обозревателя:

Genie 3 — как если бы Pixar встретился с искусственным интеллектом.

Следите в Telegram Прислать новость
Реклама

Оцените статью