Новая система на основе ИИ преобразует текст в точные архитектурные изображения

Современные системы генерации изображений по тексту позволяют создавать визуализации зданий по описанию, иногда с учетом эскизов или данных о глубине. Однако такие модели нередко ошибаются в деталях – например, могут неправильно отобразить количество этажей или расположение окон. Это связано с тем, что обучающие данные редко содержат точные структурные характеристики зданий, из-за чего ИИ плохо справляется с конкретными пространственными требованиями.

Ученые из Японского института передовых наук и технологий предложили решение– систему генерации с использованием внешних данных. Она сочетает текстовые запросы с информацией из архитектурных баз, позволяя опираться на реальные примеры при создании изображений. Такой подход может упростить и ускорить процесс проектирования. Система работает поэтапно, имитируя реальный процесс проектирования. Сначала она создает базовый эскиз на основе текста, задавая форму здания и количество этажей. Затем добавляет детали – окна, двери и элементы фасада – используя базу данных строительных компонентов. В конце объединяет все с исходным описанием и формирует реалистичное изображение.

Для проверки эффективности метод протестировали на проектах кампусных зданий, где важна точность планировки. Были созданы специальные наборы данных с тысячами изображений элементов зданий, их конфигураций и связей между эскизами и готовыми визуализациями. В результате система показала точность более 70% в передаче структуры зданий и превзошла базовые модели по качеству и соответствию описанию. Дополнительное тестирование с участием студентов архитектурных специальностей также подтвердило высокий уровень работы системы – в среднем она получила более 4 баллов из 5 по качеству и детализации.

Важные новости