Искусственный интеллект помогает ученым расшифровывать языки животных

Google-переводчика для грызунов и китов пока не существует, но исследователи работают над этим.

Отредактировано 2023-25-06
птица

В пиксаровском фильме "Вверх" у мультяшной собаки по кличке Даг есть своеобразный волшебный ошейник, который может переводить ее лай и скулеж в беглую человеческую речь. В реальном мире очень хорошо обученных собак можно научить нажимать на кнопки, которые воспроизводят человеческую речь для таких простых команд, как "на улицу", "гулять" и "играть". Людей всегда интересовала возможность общения с животными, с которыми они делят мир, а недавно машинное обучение, с его все более совершенными возможностями разбора человеческой речи, представило себя как надежный путь к переводу речи животных.

В статье, опубликованной на этой неделе в New York Times, рассказывается об основных усилиях пяти групп исследователей, которые рассматривали возможность использования алгоритмов машинного обучения для анализа разговоров грызунов, лемуров, китов, цыплят, свиней, летучих мышей, кошек и других животных.

Как правило, системы искусственного интеллекта обучаются путем тренировки на помеченных данных (которые могут быть получены из Интернета или ресурсов, таких как электронные книги). Для моделей человеческого языка это обычно означает, что компьютеру дают предложение, исключают определенные слова и просят программу заполнить пробелы. Существуют и более творческие стратегии, которые стремятся сопоставить речь с мозговой активностью.

Но анализ языка животных отличается от анализа человеческого языка. Ученые-компьютерщики должны обучать программы тому, что искать и как организовывать данные. Этот процесс, по большей части, зависит не только от накопления большого количества вокальных записей, но и от сопоставления этих вокальных записей с визуальным социальным поведением животных. Группа, изучающая египетских плодовых летучих мышей, например, также использовала видеокамеры для записи самих летучих мышей, чтобы обеспечить контекст для их призывов. А группа, изучающая китов, планирует использовать видео- и аудиозаписи, а также метки, фиксирующие движения животных, чтобы расшифровать синтаксис, семантику и, в конечном итоге, смысл того, что и почему передают киты. Конечно, несколько групп также предложили протестировать свои словари для животных, проигрывая записи животным и наблюдая за их реакцией.

Создание Google Translate для животных - это проект, который вынашивался на протяжении большей половины последнего десятилетия. Машинное обучение тоже далеко продвинулось в плане обнаружения присутствия животных и даже в некоторых случаях точной идентификации животных по их позывам. (Приложение Merlin от Cornell поражает своей точностью в определении видов птиц по их позывам). И хотя этот тип программного обеспечения показал определенный успех в определении базового словарного запаса определенных животных по характеристикам их вокализации (т.е. частоте или громкости), а также в отнесении позывов к отдельным особям, до понимания всех сложных нюансов языка животных еще далеко.

Многие скептики такого подхода отмечают как недостатки современных языковых моделей ИИ в способности действительно понять отношения между словами и объектами, к которым они могут относиться в реальном мире, так и недостатки в понимании учеными общества животных в целом. Языковые модели искусственного интеллекта для людей основаны на том, что компьютер составляет схему отношений между словами и контекстами, в которых они могут появляться (где они могут находиться в предложении и к чему они могут относиться). Но у этих моделей есть свои недостатки, и иногда они могут быть "черным ящиком" - исследователи знают, что входит и выходит, но не совсем понимают, как алгоритм приходит к такому выводу.

Еще одним фактором, который учитывают исследователи, является то, что коммуникация животных может работать совсем не так, как коммуникация людей, и тенденция антропоморфизировать их может искажать результаты. В языке животных могут быть уникальные элементы, обусловленные физиологическими и поведенческими различиями.

В связи с невозможностью заранее знать параметры данных, существуют предложения по использованию алгоритмов самообучения для анализа аудиоданных, согласно отчету, опубликованному в начале этого года в Wall Street Journal, в котором компьютер сообщает исследователям, какие закономерности он видит в данных - закономерности, которые могут выявить связи, упущенные человеческим глазом. В конечном итоге, то, насколько далеко человек зайдет в кроличью нору, пытаясь понять коммуникацию животных, зависит от целей, которые он преследует при проведении подобных исследований, и для этого может быть достаточно разобраться в основах. Например, переводчик, способный надежно интерпретировать, счастливы ли животные, с которыми мы часто находимся в тесном контакте, грустны ли они или находятся в опасности, может быть полезным и более практичным для создания.