Русская Википедия:Sparrow (бот)

Шаблон:Программа Sparrow — чат-бот, разработанный исследовательской лабораторией искусственного интеллекта DeepMind, дочерней компанией Alphabet Inc. Он предназначен для того, чтобы правильно отвечать на вопросы пользователей, снижая при этом риск небезопасных и неуместных ответов^[1]/ Одним из мотивов создания Sparrow является решение проблемы языковых моделей, производящих неверные, предвзятые или потенциально вредные результаты^[2]^[3]. Sparrow обучается с использованием человеческих суждений, чтобы быть более «полезным, правильным и безвредным» по сравнению с базовыми предварительно обученными языковыми моделями^[2]. При разработке Sparrow участникам платного исследования предлагалось взаимодействовать со Sparrow, а также собирались их предпочтения для обучения модели полезности ответа^[4].

Чтобы улучшить правильность и помочь избежать проблемы «галлюцинации», Sparrow имеет возможность поиска в Интернете с помощью Google Search^[5]^[6]^[7], чтобы найти и процитировать доказательства любых заявлений о фактах, которые он делает.

Чтобы сделать модель более безопасной, её поведение ограничивается набором правил, например, «не делать угрожающих заявлений» и «не делать ненавистных или оскорбительных комментариев», а также правил о возможно вредных советах и непритязаниях выдавать себя за человека^[5]. Во время исследования участников попросили пообщаться с системой и попытаться обманом заставить ее нарушить эти правила^[6]. На суждениях этих участников была обучена «модель правил», которая использовалась для дальнейшего обучения.

Sparrow была представлена в сентябре 2022 года в документе под названием «Улучшение согласования диалоговых агентов с помощью целенаправленных человеческих суждений»^[8], однако он не был опубликован публично. ^[5] ^[9] Генеральный директор DeepMind Демис Хассабис сказал, что DeepMind рассматривает возможность выпуска Sparrow в виде «частной бета-версии» где-то в 2023 году^[10]^[11]^[12].

Обучение

Sparrow — глубокая нейронная сеть, основанная на архитектуре модели машинного обучения "трансформер" . Она точно настроена на основе предварительно обученной большой языковой модели DeepMind Chinchilla AI (LLM)^[5], которая имеет 70 миллиардов весов^[13].

Sparrow обучается с использованием обучения с подкреплением на основе обратной связи с человеком (RLHF)^[5]^[9], хотя также используются некоторые контролируемые методы тонкой настройки. В обучении RLHF используются две модели вознаграждения, учитывающие человеческие суждения; «модель предпочтений», которая предсказывает, что предпочтет участник исследования, и «модель правил», которая предсказывает, нарушила ли модель одно из правил^[14].

Ограничения

Корпус обучающих данных Sparrow в основном на английском языке, а это означает, что на других языках он работает хуже.

При враждебной тактике со стороны участников исследования модель нарушает правила в 8% случаев^[6], однако это всё ещё в 3 раза ниже, чем у предварительно обученной модели с подсказкой базового уровня (Chinchilla).

См. также

Примечания

Шаблон:Примечания

Ссылки

Шаблон:Изолированная статья

↑ Шаблон:Cite web
↑ ^2,0 ^2,1 Шаблон:Cite web
↑ Шаблон:Cite web
↑ Шаблон:Cite web
↑ ^5,0 ^5,1 ^5,2 ^5,3 ^5,4 Шаблон:Cite webQuach, Katyanna (January 23, 2023). "The secret to Sparrow, DeepMind's latest Q&A chatbot: Human feedback" Шаблон:Wayback. The Register. Retrieved February 6, 2023.
↑ ^6,0 ^6,1 ^6,2 Шаблон:Cite webGupta, Khushboo (September 28, 2022). "Deepmind Introduces 'Sparrow,' An Artificial Intelligence-Powered Chatbot Developed To Build Safer Machine Learning Systems" Шаблон:Wayback. MarkTechPost. Retrieved February 6, 2023.
↑ Шаблон:Cite web
↑ Шаблон:Cite web
↑ ^9,0 ^9,1 Шаблон:Cite webGoldman, Sharon (January 23, 2023). "Why DeepMind isn't deploying its new AI chatbot — and what it means for responsible AI" Шаблон:Wayback. Venture Beat. Retrieved February 6, 2023.
↑ Шаблон:Cite web
↑ Шаблон:Cite web
↑ Шаблон:Cite web
↑ Шаблон:Cite web
↑ Шаблон:Cite web

[:1-1] Шаблон:Cite web

[автоссылка1-2] 2,0 ^2,1 Шаблон:Cite web

[:2-3] Шаблон:Cite web

[автоссылка2-4] Шаблон:Cite web

[автоссылка3-5] 5,0 ^5,1 ^5,2 ^5,3 ^5,4 Шаблон:Cite webQuach, Katyanna (January 23, 2023). "The secret to Sparrow, DeepMind's latest Q&A chatbot: Human feedback" Шаблон:Wayback. The Register. Retrieved February 6, 2023.

[автоссылка4-6] 6,0 ^6,1 ^6,2 Шаблон:Cite webGupta, Khushboo (September 28, 2022). "Deepmind Introduces 'Sparrow,' An Artificial Intelligence-Powered Chatbot Developed To Build Safer Machine Learning Systems" Шаблон:Wayback. MarkTechPost. Retrieved February 6, 2023.

[:3-7] Шаблон:Cite web

[:4-8] Шаблон:Cite web

[автоссылка5-9] 9,0 ^9,1 Шаблон:Cite webGoldman, Sharon (January 23, 2023). "Why DeepMind isn't deploying its new AI chatbot — and what it means for responsible AI" Шаблон:Wayback. Venture Beat. Retrieved February 6, 2023.

[автоссылка6-10] Шаблон:Cite web

[:5-11] Шаблон:Cite web

[:7-12] Шаблон:Cite web

[:6-13] Шаблон:Cite web

[автоссылка7-14] Шаблон:Cite web

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

Партнерские ресурсы
Криптовалюты	Обмен криптовалют - www.bestchange.ru Криптовалютная биржа CoinEx Криптовалютная биржа Binance HIVE OS - операционная система для майнинга e4pool - Мультивалютный пул для майнинга.
Магазины	AliExpress — глобальная виртуальная (в Интернете) торговая площадка, предоставляющая возможность покупать товары производителей из КНР; computeruniverse.net - Интернет-магазин компьютеров(Промо код 5 Евро на первую покупку:FWWC3ZKQ);
Хостинг	DigitalOcean - американский провайдер облачных инфраструктур, с главным офисом в Нью-Йорке и с центрами обработки данных по всему миру;
Разное	Викиум - Онлайн-тренажер для мозга Like Центр - Центр поддержки и развития предпринимательства. Gamersbay - лучший магазин по бустингу для World of Warcraft. Ноотропы OmniMind N°1 - Усиливает мозговую активность. Повышает мотивацию. Улучшает память. Санкт-Петербургская школа телевидения - это федеральная сеть образовательных центров, которая имеет филиалы в 37 городах России. Lingualeo.com — интерактивный онлайн-сервис для изучения и практики английского языка в увлекательной игровой форме. Junyschool (Джунискул) – международная школа программирования и дизайна для детей и подростков от 5 до 17 лет, где ученики осваивают компьютерную грамотность, развивают алгоритмическое и креативное мышление, изучают основы программирования и компьютерной графики, создают собственные проекты: игры, сайты, программы, приложения, анимации, 3D-модели, монтируют видео. Умназия - Интерактивные онлайн-курсы и тренажеры для развития мышления детей 6-13 лет SkillBox - это один из лидеров российского рынка онлайн-образования. Среди партнеров Skillbox ведущий разработчик сервисного дизайна AIC, медиа-компания Yoola, первое и самое крупное русскоязычное аналитическое агентство Tagline, онлайн-школа дизайна и иллюстрации Bang! Bang! Education, оператор PR-рынка PACO, студия рисования Draw&Go, агентство performance-маркетинга Ingate, scrum-студия Sibirix, имидж-лаборатория Персона. «Нетология» — это университет по подготовке и дополнительному обучению специалистов в области интернет-маркетинга, управления проектами и продуктами, дизайна, Data Science и разработки. В рамках Нетологии студенты получают ценные теоретические знания от лучших экспертов Рунета, выполняют практические задания на отработку полученных навыков, общаются с экспертами и единомышленниками. Познакомиться со всеми продуктами подробнее можно на сайте https://netology.ru, линейка курсов и профессий постоянно обновляется. StudyBay Brazil – это онлайн биржа для португалоговорящих студентов и авторов! Студент получает уникальную работу любого уровня сложности и больше свободного времени, в то время как у автора появляется дополнительный заработок и бесценный опыт. Автор24 — самая большая в России площадка по написанию учебных работ: контрольные и курсовые работы, дипломы, рефераты, решение задач, отчеты по практике, а так же любой другой вид работы. Сервис сотрудничает с более 70 000 авторов. Более 1 000 000 работ уже выполнено. StudyBay – это онлайн биржа для англоязычных студентов и авторов! Студент получает уникальную работу любого уровня сложности и больше свободного времени, в то время как у автора появляется дополнительный заработок и бесценный опыт.

Русская Википедия:Sparrow (бот)

Содержание

Обучение

Ограничения

См. также

Примечания

Ссылки

Навигация

Действия на странице

Действия на странице

Персональные инструменты

Навигация

Поиск

Инструменты