Friday, 13 June 2025

Проект "Интересные статьи": Ученые объяснили почему ИИ не может творить как человек

Красивая роза, но какая-то ненастоящая!

Искусственный интеллект не может понять, что такое цветок — и именно поэтому его искусство кажется «поверхностным»

Любой может сесть за программу искусственного интеллекта (ИИ), такую как ChatGPT, и написать с её помощью стихотворение, детскую сказку или сценарий. Это поразительно: на первый взгляд результаты могут показаться вполне «человеческими». Но, как объясняют исследователи в новом исследовании, не стоит ожидать от ИИ глубины или чувственного богатства.

Учёные выяснили, что большие языковые модели (Large Language Models, LLMs), лежащие в основе генеративных ИИ-инструментов, не способны представить себе, что такое цветок, так же, как это делает человек.

Более того, исследователи предполагают, что языковые модели в целом плохо справляются с представлением любых объектов, имеющих сенсорный или моторный компонент — потому что у ИИ нет тела и никакого органического человеческого опыта.

«Большая языковая модель не может почувствовать запах розы, прикоснуться к лепесткам ромашки или пройтись по полю с дикими цветами. Без этих сенсорных и моторных переживаний она не может по-настоящему представить себе, что такое цветок во всей его полноте. Это касается и многих других человеческих понятий», — говорит Цисюй Сюй (Qihui Xu), ведущий автор исследования из Университета штата Огайо (США).

Исследование предполагает, что неспособность ИИ адекватно представить сенсорные понятия, такие как цветы, может объяснять, почему у него не получается творить по-человечески.

«У ИИ нет богатого сенсорного опыта. Поэтому он часто создаёт нечто, что удовлетворяет минимальному определению творчества, но при этом остаётся пустым и поверхностным», — считает Марк Ранко (Mark Runco), когнитивный учёный из Южного Орегонского университета (США), не участвовавший в исследовании.

ИИ плохо понимает чувственные образы

Чем глубже учёные исследуют внутренние механизмы работы ИИ, тем очевиднее становится, насколько сильно его «мышление» отличается от человеческого. Некоторые даже считают, что ИИ ближе к инопланетному типу разума, чем к человеческому.

Однако объективно проверить концептуальное понимание ИИ — задача не из простых. Если программист заглянет внутрь языковой модели, то вряд ли сможет интерпретировать миллионы чисел, которые постоянно меняются.

Сюй и его коллеги попытались протестировать, насколько хорошо LLM понимают вещи на основе сенсорных характеристик. Они измеряли, насколько ИИ удаётся представить слова с богатыми чувственными значениями: насколько объект эмоционально заряжен, насколько его легко представить визуально, и насколько он связан с движением и действием.

Например, они изучали, насколько для человека восприятие цветка связано с обонянием или с движениями туловища — например, когда человек тянется, чтобы прикоснуться к лепестку. Эти образы легко понять человеку, ведь у нас есть телесный опыт, а вот для ИИ, у которого нет тела, это затруднительно.

В целом, LLM хорошо справляются с представлением слов — но эти слова у них лишены связи с чувствами или движениями, которые мы переживаем как люди.

Но когда речь заходит о понятиях, связанных с тем, что мы видим, пробуем на вкус или с чем взаимодействуем телом, — вот тут ИИ и оказывается неспособным по-настоящему отразить человеческое восприятие.

Что значит «искусство ИИ — пустое»

ИИ создаёт представления понятий и слов, анализируя шаблоны в данных, на которых он обучен. Эта идея лежит в основе любой задачи — будь то написание стихотворения или распознавание лица на фотографии.

Большинство LLM обучаются на текстах, собранных из интернета. Но некоторые модели получают также и визуальные данные — изображения и видео.

Сюй и его коллеги обнаружили, что LLM с визуальным обучением демонстрируют больше сходства с человеческим восприятием в визуальных аспектах. Они показали лучшие результаты по сравнению с моделями, обученными только на тексте. Однако это исследование не включало другие виды чувств, такие как осязание или слух.

Это говорит о том, что чем больше сенсорной информации получает ИИ в ходе обучения, тем лучше он может воспроизводить сенсорные аспекты.

ИИ продолжает учиться и развиваться

Авторы исследования отметили, что LLM постоянно улучшаются и, вероятно, в будущем смогут лучше схватывать человеческие концепции.

Сюй добавил, что будущие модели, дополненные сенсорами и робототехникой, смогут делать выводы о физическом мире и взаимодействовать с ним.

Однако независимые эксперты, с которыми поговорило DW, отмечают, что будущее «чувственного» ИИ пока остаётся неопределённым.

«Возможно, ИИ, обученный на мультисенсорной информации, сможет без труда справляться с задачами, связанными с несколькими модальностями восприятия», — говорит Мирко Мусолези (Mirco Musolesi), компьютерный учёный из Университетского колледжа Лондона (Великобритания), не участвовавший в исследовании.

Но Ранко считает, что даже с продвинутыми сенсорными возможностями ИИ всё равно будет понимать, что такое цветы, иначе, чем человек.

Наш человеческий опыт и память тесно связаны с чувствами — это взаимодействие мозга и тела, выходящее за пределы текущего момента. Запах розы или шелковистость её лепестков могут вызвать радостные воспоминания из детства или чувственное возбуждение во взрослом возрасте.

У ИИ нет ни тела, ни памяти, ни «Я». Он не может переживать мир или взаимодействовать с ним, как это делают животные и люди. А это, по словам Ранко, означает, что «творческий результат ИИ всё равно будет пустым и поверхностным».

Редактор: Зульфикар Аббани
Автор: Фред Шваллер

Оригинал статьи здесь: Researchers explain why AI art is inferior to human creativity

No comments:

Post a Comment