Meta считает, что ее новый инструмент искусственного интеллекта может сделать Википедию более точной

Проект под названием Sphere черпает свои знания из "неструктурированного" открытого Интернета. Он все еще находится на стадии исследования.

Отредактировано 2023-25-06
домашняя страница википедииМета разработала инструмент искусственного интеллекта, который можно использовать для проверки цитат из Википедии.

На этой неделе компания Meta запустила новую модель искусственного интеллекта под названием Sphere, предназначенную для автоматической проверки ссылок на Википедию. База знаний Sphere состоит из 134 миллионов веб-страниц.

Meta заявила, что не сотрудничает с Wikimedia (некоммерческой организацией, владеющей сайтом wikipedia.com) в рамках этого проекта, который все еще находится на стадии исследования и не будет использоваться для обновления Википедии в реальном времени. Однако недавно Wikimedia объявила, что использует технологию Meta в своем инструменте перевода контента.

Sphere, говорится в сообщении Meta в блоге, представляет собой модель ИИ, которая выполняет наукоемкую обработку естественного языка, ту же задачу, которую выполняет виртуальный помощник на вашем телефоне, когда вы задаете ему вопрос типа "Кто получил первую Нобелевскую премию по физике?". Затем эти модели будут рыться в репозитории, чтобы найти подходящий ответ.

В случае с Sphere, она использует информацию из "неструктурированного" открытого Интернета в отличие от поисковой системы. "Поскольку Sphere может получить доступ к гораздо большему объему публичной информации, чем современные стандартные модели, она может предоставить полезную информацию, которую они не могут предоставить", - написали исследователи Meta в своем блоге. Кроме того, система Meta использует понимание естественного языка для "оценки вероятности того, что утверждение может быть выведено из источника". Эта техника разбивает предложения или фразы на математические представления, а затем сравнивает наборы представлений друг с другом.

Препринт с описанием Sphere можно найти на arXiv, а само программное обеспечение с открытым исходным кодом - на GitHub. Meta также создала эталонный тест под названием KILT, который будет использоваться для оценки того, как Sphere и другие подобные модели справляются с широким спектром задач, таких как проверка фактов, диалог в форме вопросов и ответов и вставка релевантных ссылок.

До сих пор эта способность использовалась только для сканирования и проверки цитат из Википедии. "Она обращает внимание на сомнительные цитаты, позволяя редакторам-людям оценивать случаи, которые, скорее всего, являются ошибочными, без необходимости просеивать тысячи правильно процитированных утверждений", - объясняет Мета. "Если цитата кажется неуместной, наша модель предложит более подходящий источник, даже укажет на конкретный отрывок, который поддерживает утверждение".

В конечном счете, обучение пониманию взаимосвязи между текстовыми фрагментами записей в Википедии и ссылками, которые они цитируют, также улучшит способность модели анализировать реальные знания, поскольку редактирование цитат требует глубокого понимания человеческого языка и рассуждений.

"Эти модели - первые компоненты потенциальных редакторов, которые могли бы помочь проверять документы в режиме реального времени. Помимо предложения ссылок, система могла бы предлагать автозаполняемый текст - на основе соответствующих документов, найденных в Интернете - и предлагать корректорские правки", - сказал Мета. "В идеале, модели должны понимать несколько языков и уметь обрабатывать несколько типов медиа, включая видео, изображения и таблицы данных".