![]() |
Красивая роза, но какая-то ненастоящая! |
Искусственный интеллект не может понять, что такое цветок — и именно поэтому его искусство кажется «поверхностным»
Любой может сесть за программу искусственного интеллекта (ИИ), такую как ChatGPT, и написать с её помощью стихотворение, детскую сказку или сценарий. Это поразительно: на первый взгляд результаты могут показаться вполне «человеческими». Но, как объясняют исследователи в новом исследовании, не стоит ожидать от ИИ глубины или чувственного богатства.
Учёные выяснили, что большие языковые модели (Large Language Models, LLMs), лежащие в основе генеративных ИИ-инструментов, не способны представить себе, что такое цветок, так же, как это делает человек.
Более того, исследователи предполагают, что языковые модели в целом плохо справляются с представлением любых объектов, имеющих сенсорный или моторный компонент — потому что у ИИ нет тела и никакого органического человеческого опыта.
«Большая языковая модель не может почувствовать запах розы, прикоснуться к лепесткам ромашки или пройтись по полю с дикими цветами. Без этих сенсорных и моторных переживаний она не может по-настоящему представить себе, что такое цветок во всей его полноте. Это касается и многих других человеческих понятий», — говорит Цисюй Сюй (Qihui Xu), ведущий автор исследования из Университета штата Огайо (США).
Исследование предполагает, что неспособность ИИ адекватно представить сенсорные понятия, такие как цветы, может объяснять, почему у него не получается творить по-человечески.
«У ИИ нет богатого сенсорного опыта. Поэтому он часто создаёт нечто, что удовлетворяет минимальному определению творчества, но при этом остаётся пустым и поверхностным», — считает Марк Ранко (Mark Runco), когнитивный учёный из Южного Орегонского университета (США), не участвовавший в исследовании.
ИИ плохо понимает чувственные образы
Чем глубже учёные исследуют внутренние механизмы работы ИИ, тем очевиднее становится, насколько сильно его «мышление» отличается от человеческого. Некоторые даже считают, что ИИ ближе к инопланетному типу разума, чем к человеческому.
Однако объективно проверить концептуальное понимание ИИ — задача не из простых. Если программист заглянет внутрь языковой модели, то вряд ли сможет интерпретировать миллионы чисел, которые постоянно меняются.
Сюй и его коллеги попытались протестировать, насколько хорошо LLM понимают вещи на основе сенсорных характеристик. Они измеряли, насколько ИИ удаётся представить слова с богатыми чувственными значениями: насколько объект эмоционально заряжен, насколько его легко представить визуально, и насколько он связан с движением и действием.
Например, они изучали, насколько для человека восприятие цветка связано с обонянием или с движениями туловища — например, когда человек тянется, чтобы прикоснуться к лепестку. Эти образы легко понять человеку, ведь у нас есть телесный опыт, а вот для ИИ, у которого нет тела, это затруднительно.
В целом, LLM хорошо справляются с представлением слов — но эти слова у них лишены связи с чувствами или движениями, которые мы переживаем как люди.
Но когда речь заходит о понятиях, связанных с тем, что мы видим, пробуем на вкус или с чем взаимодействуем телом, — вот тут ИИ и оказывается неспособным по-настоящему отразить человеческое восприятие.
Что значит «искусство ИИ — пустое»
ИИ создаёт представления понятий и слов, анализируя шаблоны в данных, на которых он обучен. Эта идея лежит в основе любой задачи — будь то написание стихотворения или распознавание лица на фотографии.
Большинство LLM обучаются на текстах, собранных из интернета. Но некоторые модели получают также и визуальные данные — изображения и видео.
Сюй и его коллеги обнаружили, что LLM с визуальным обучением демонстрируют больше сходства с человеческим восприятием в визуальных аспектах. Они показали лучшие результаты по сравнению с моделями, обученными только на тексте. Однако это исследование не включало другие виды чувств, такие как осязание или слух.
Это говорит о том, что чем больше сенсорной информации получает ИИ в ходе обучения, тем лучше он может воспроизводить сенсорные аспекты.
ИИ продолжает учиться и развиваться
Авторы исследования отметили, что LLM постоянно улучшаются и, вероятно, в будущем смогут лучше схватывать человеческие концепции.
Сюй добавил, что будущие модели, дополненные сенсорами и робототехникой, смогут делать выводы о физическом мире и взаимодействовать с ним.
Однако независимые эксперты, с которыми поговорило DW, отмечают, что будущее «чувственного» ИИ пока остаётся неопределённым.
«Возможно, ИИ, обученный на мультисенсорной информации, сможет без труда справляться с задачами, связанными с несколькими модальностями восприятия», — говорит Мирко Мусолези (Mirco Musolesi), компьютерный учёный из Университетского колледжа Лондона (Великобритания), не участвовавший в исследовании.
Но Ранко считает, что даже с продвинутыми сенсорными возможностями ИИ всё равно будет понимать, что такое цветы, иначе, чем человек.
Наш человеческий опыт и память тесно связаны с чувствами — это взаимодействие мозга и тела, выходящее за пределы текущего момента. Запах розы или шелковистость её лепестков могут вызвать радостные воспоминания из детства или чувственное возбуждение во взрослом возрасте.
У ИИ нет ни тела, ни памяти, ни «Я». Он не может переживать мир или взаимодействовать с ним, как это делают животные и люди. А это, по словам Ранко, означает, что «творческий результат ИИ всё равно будет пустым и поверхностным».
Редактор: Зульфикар Аббани
Автор: Фред Шваллер
Оригинал статьи здесь: Researchers explain why AI art is inferior to human creativity
No comments:
Post a Comment