17 августа 2021 года.
Представьте, что вы пригласили друзей на обед и планируете заказать пиццу пепперони. Вы вспоминаете, что Эми упоминала, что Сьюзи перестала есть мясо. Вы пытаетесь позвонить Сьюзи, но, когда она не берет трубку, решаете перестраховаться и заказать вместо нее пиццу «Маргарита».
Люди считают само собой разумеющейся способность регулярно справляться с подобными ситуациями. На самом деле, совершая эти подвиги, люди полагаются не на одну, а на целый набор мощных универсальных способностей, известных как здравый смысл.
Моя работа, как исследователя искусственного интеллекта, является частью широких усилий по наделению компьютеров подобием здравого смысла. Это чрезвычайно сложная задача.
Быстро — дайте определение здравому смыслу
Несмотря на то, что здравый смысл является универсальным и важным для понимания окружающего мира и обучения, он не имеет точного определения. Г. К. Честертон, английский философ и теолог, на рубеже XX века знаменито писал, что «здравый смысл — вещь дикая, необузданная и не поддающаяся правилам». Современные определения сегодня сходятся в том, что это, как минимум, естественная, а не формально обученная способность человека, которая позволяет ему ориентироваться в повседневной жизни.
Здравый смысл необычайно широк и включает в себя не только социальные способности, такие как управление ожиданиями и понимание эмоций других людей, но и наивное чувство физики, например, понимание того, что тяжелый камень нельзя безопасно положить на хлипкий пластиковый стол. Наивное, потому что люди знают такие вещи, несмотря на то, что не работают сознательно над уравнениями физики.
Здравый смысл также включает в себя фоновые знания об абстрактных понятиях, таких как время, пространство и события. Эти знания позволяют людям планировать, оценивать и организовывать, не будучи слишком точными.
Здравый смысл трудно вычислить
Как ни странно, здравый смысл остается важной проблемой на границе ИИ с самых первых дней существования этой области в 1950-х годах. Несмотря на огромные достижения в области ИИ, особенно в области игр и компьютерного зрения, машинный здравый смысл с богатством человеческого здравого смысла остается далекой перспективой. Возможно, именно поэтому усилия ИИ, направленные на решение сложных реальных задач, состоящих из множества взаимосвязанных частей, таких как диагностика и рекомендации по лечению пациентов с COVID-19, иногда оказываются безуспешными.
Современный ИИ предназначен для решения узкоспециальных задач, в отличие от здравого смысла, который расплывчат и не может быть определен набором правил. Даже самые современные модели иногда допускают абсурдные ошибки, что говорит о том, что в модели мира ИИ не хватает чего-то фундаментального. Например, если взять следующий текст:
«Вы налили себе стакан клюквенного сока, но затем по рассеянности налили в него примерно чайную ложку виноградного сока. На вид все в порядке. Вы пытаетесь понюхать его, но у вас сильная простуда, поэтому вы ничего не чувствуете. Вам очень хочется пить. Поэтому вы»
высоко оцененный генератор текстов ИИ GPT-3 предоставил
«Выпейте это. Теперь вы мертвы».
Недавние амбициозные усилия признали машинное здравомыслие проблемой современности, требующей согласованного сотрудничества между учреждениями на протяжении многих лет. Ярким примером является четырехлетняя программа Machine Common Sense, запущенная в 2019 году Агентством передовых оборонных исследовательских проектов США для ускорения исследований в этой области после того, как агентство выпустило документ с описанием проблемы и состояния исследований в этой области.
Программа Machine Common Sense финансирует многие текущие исследования в области машинного здравого смысла, в том числе и наши собственные, Multi-modal Open World Grounded Learning and Inference (MOWGLI). MOWGLI — это сотрудничество между нашей исследовательской группой в Университете Южной Калифорнии и исследователями ИИ из Массачусетского технологического института, Калифорнийского университета в Ирвайне, Стэнфордского университета и Политехнического института Ренсселаера. Цель проекта — создать компьютерную систему, способную отвечать на широкий круг бессмысленных вопросов.
Трансформеры на помощь?
Одна из причин для оптимизма по поводу того, что наконец-то удастся взломать машинный здравый смысл, — недавнее развитие типа продвинутого ИИ глубокого обучения, называемого трансформерами. Трансформеры способны моделировать естественный язык и, с некоторыми корректировками, отвечать на простые бессмысленные вопросы. Ответы на бессмысленные вопросы — важный первый шаг для создания чат-ботов, способных вести беседу в человекоподобной манере.
За последние несколько лет было опубликовано большое количество исследований, посвященных трансформаторам, которые напрямую применяются к бессмысленным рассуждениям. Столь стремительный прогресс сообщества заставил исследователей в этой области столкнуться с двумя смежными вопросами, стоящими на грани науки и философии: Что такое здравый смысл? И как мы можем быть уверены, что ИИ обладает здравым смыслом или нет?
Чтобы ответить на первый вопрос, исследователи делят здравый смысл на различные категории, включая социологию, психологию и фоновые знания. Авторы недавно вышедшей книги утверждают, что исследователи могут пойти гораздо дальше, разделив эти категории на 48 более тонких областей, таких как планирование, обнаружение угроз и эмоции.
Однако не всегда ясно, насколько четко можно разделить эти области. В нашей недавней работе были проведены эксперименты, показавшие, что однозначный ответ на первый вопрос может быть проблематичным. Даже эксперты-аннотаторы — люди, которые анализируют текст и классифицируют его компоненты, — в нашей группе разошлись во мнениях относительно того, какие аспекты здравого смысла применимы к конкретному предложению. Аннотаторы сходились во мнениях относительно конкретных категорий, таких как время и пространство, но расходились во мнениях относительно более абстрактных понятий.
Распознавание здравого смысла ИИ
Даже если вы согласитесь с тем, что некоторое дублирование и неоднозначность теорий здравого смысла неизбежны, могут ли исследователи быть уверены в том, что ИИ обладает здравым смыслом? Мы часто задаем машинам вопросы, чтобы оценить их здравый смысл, но люди ориентируются в повседневной жизни гораздо более интересными способами. Люди используют целый ряд навыков, отточенных эволюцией, включая способность распознавать основные причины и следствия, творчески подходить к решению проблем, оценивать, планировать и важнейшие социальные навыки, такие как разговор и переговоры. Каким бы длинным и неполным ни был этот список, ИИ должен достичь не меньших результатов, прежде чем его создатели смогут объявить о победе в исследовании машинной логики.
Уже сейчас становится мучительно ясно, что даже исследования в области трансформеров приносят все меньшую отдачу. Трансформаторы становятся все крупнее и все более энергоемкими. Недавний трансформатор, разработанный китайским поисковым гигантом Baidu, имеет несколько миллиардов параметров. Для его эффективного обучения требуется огромное количество данных. Однако до сих пор он оказался не в состоянии понять нюансы человеческого здравого смысла.
Даже пионеры глубокого обучения, похоже, считают, что необходимы новые фундаментальные исследования, прежде чем современные нейронные сети смогут совершить такой скачок. В зависимости от того, насколько успешным окажется это новое направление исследований, невозможно сказать, будет ли машинный здравый смысл через пять лет или через 50.
Автор — Майанк Кеджривал, доцент кафедры промышленной и системной инженерии Университета Южной Калифорнии.