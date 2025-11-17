Axios: В сфере ИИ начинается новая гонка 3 17.11.2025, 14:30

Следующим большим шагом станут модели, понимающие мир.

На смену крупным языковым моделям приходят физические модели — системы, которые способны понимать и симулировать физическую реальность, пишет Axios (перевод — сайт Charter97.org).

Такие модели обещают сделать ИИ гораздо полезнее в робототехнике, видеоиграх и других приложениях, где требуются знания о том, как устроен мир. В отличие от языковых моделей, которые предсказывают следующее слово, новые модели пытаются предсказать следующее событие.

Лидеры в этой области:

Лаборатория World Labs под руководством Фэй-Фэй Ли представила свой первый коммерческий продукт — Marble.

Ян Лекун готовит собственный стартап после ухода из Meta. Google и Meta активно развивают такие модели для улучшения видео и управления роботами. OpenAI рассматривает улучшенные видеомодели как возможный путь к созданию полноценной модели, понимающей мир. Китайские компании, включая Tencent, создают системы с пониманием физики и трехмерных данных. Университет искусственного интеллекта имени Мохаммеда бин Зайеда (ОАЭ) на прошлой неделе представил свою первую модель PAN.

Как это работает?

Физические модели обучаются на видео, симуляциях и пространственных данных, формируя представления об объектах, средах и динамике мира. Они учатся понимать гравитацию, скрытие объектов, причинно-следственные связи — без прямого программирования.

Ключевой вызов — данные. В отличие от языковых моделей, которые можно обучать на текстах из интернета, миромоделям нужны огромные объемы качественных мультимодальных данных. Даже крупнейшие открытые наборы, такие как датасет Encord (1 млрд пар данных), являются лишь отправной точкой.

