Английская Википедия:Empowerment (artificial intelligence)

Empowerment in the field of artificial intelligence formalises and quantifies (via information theory) the potential an agent perceives that it has to influence its environment.^[1]^[2] An agent which follows an empowerment maximising policy, acts to maximise future options (typically up to some limited horizon). Empowerment can be used as a (pseudo) utility function that depends only on information gathered from the local environment to guide action, rather than seeking an externally imposed goal, thus is a form of intrinsic motivation.^[3]

The empowerment formalism depends on a probabilistic model commonly used in artificial intelligence. An autonomous agent operates in the world by taking in sensory information and acting to change its state, or that of the environment, in a cycle of perceiving and acting known as the perception-action loop. Agent state and actions are modelled by random variables (<math>S: s \in \mathcal{S}, A: a \in \mathcal{A}</math>) and time (<math>t</math>). The choice of action depends on the current state, and the future state depends on the choice of action, thus the perception-action loop unrolled in time forms a causal bayesian network.

Definition

Empowerment (<math>\mathfrak{E}</math>) is defined as the channel capacity (<math>C</math>) of the actuation channel of the agent, and is formalised as the maximal possible information flow between the actions of the agent and the effect of those actions some time later. Empowerment can be thought of as the future potential of the agent to affect its environment, as measured by its sensors.^[3]

\mathfrak{E} := C(A_t \longrightarrow S_{t+1}) \equiv \max_{p(a_t)} I(A_t;S_{t+1})

</math>

In a discrete time model, Empowerment can be computed for a given number of cycles into the future, which is referred to in the literature as 'n-step' empowerment.^[4]

\mathfrak{E}(A^n_t \longrightarrow S_{t+n}) = \max_{p(a_t,...,a_{t+n-1})} I(A_t,...,A_{t+n-1};S_{t+n})

</math>

The unit of empowerment depends on the logarithm base. Base 2 is commonly used in which case the unit is bits.

Contextual Empowerment

In general the choice of action (action distribution) that maximises empowerment varies from state to state. Knowing the empowerment of an agent in a specific state is useful, for example to construct an empowerment maximising policy. State-specific empowerment can be found using the more general formalism for 'contextual empowerment'.^[4] <math>C</math> is a random variable describing the context (e.g. state).

\mathfrak{E}(A^n_t \longrightarrow S_{t+n}{\mid}C) = \sum_{c{\in}C} p(c) \mathfrak{E}(A^n_t \longrightarrow S_{t+n}{\mid}C=c)

</math>

Application

Empowerment maximisation can be used as a pseudo-utility function to enable agents to exhibit intelligent behaviour without requiring the definition of external goals, for example balancing a pole in a cart-pole balancing scenario where no indication of the task is provided to the agent.^[4] Empowerment has been applied in studies of collective behaviour^[5] and in continuous domains.^[6]^[7] As is the case with Bayesian methods in general, computation of empowerment becomes computationally expensive as the number of actions and time horizon extends, but approaches to improve efficiency have led to usage in real-time control.^[8] Empowerment has been used for intrinsically motivated reinforcement learning agents playing video games,^[9] and in the control of underwater vehicles.^[10]

References

Шаблон:Reflist

↑ Ошибка цитирования Неверный тег <ref>; для сносок klyubin2005a не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок klyubin2005b не указан текст
↑ ^3,0 ^3,1 Ошибка цитирования Неверный тег <ref>; для сносок salge2014 не указан текст
↑ ^4,0 ^4,1 ^4,2 Ошибка цитирования Неверный тег <ref>; для сносок klyubin2008 не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок capdepuy2007 не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок jung2011 не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок salge2013 не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок karl2017 не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок rezende2015 не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок volpi2016 не указан текст

[klyubin2005a-1] Ошибка цитирования Неверный тег <ref>; для сносок klyubin2005a не указан текст

[klyubin2005b-2] Ошибка цитирования Неверный тег <ref>; для сносок klyubin2005b не указан текст

[salge2014-3] 3,0 ^3,1 Ошибка цитирования Неверный тег <ref>; для сносок salge2014 не указан текст

[klyubin2008-4] 4,0 ^4,1 ^4,2 Ошибка цитирования Неверный тег <ref>; для сносок klyubin2008 не указан текст

[capdepuy2007-5] Ошибка цитирования Неверный тег <ref>; для сносок capdepuy2007 не указан текст

[jung2011-6] Ошибка цитирования Неверный тег <ref>; для сносок jung2011 не указан текст

[salge2013-7] Ошибка цитирования Неверный тег <ref>; для сносок salge2013 не указан текст

[karl2017-8] Ошибка цитирования Неверный тег <ref>; для сносок karl2017 не указан текст

[rezende2015-9] Ошибка цитирования Неверный тег <ref>; для сносок rezende2015 не указан текст

[volpi2016-10] Ошибка цитирования Неверный тег <ref>; для сносок volpi2016 не указан текст

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

Партнерские ресурсы
Криптовалюты	Обмен криптовалют - www.bestchange.ru Криптовалютная биржа CoinEx Криптовалютная биржа Binance HIVE OS - операционная система для майнинга e4pool - Мультивалютный пул для майнинга.
Магазины	AliExpress — глобальная виртуальная (в Интернете) торговая площадка, предоставляющая возможность покупать товары производителей из КНР; computeruniverse.net - Интернет-магазин компьютеров(Промо код 5 Евро на первую покупку:FWWC3ZKQ);
Хостинг	DigitalOcean - американский провайдер облачных инфраструктур, с главным офисом в Нью-Йорке и с центрами обработки данных по всему миру;
Разное	Викиум - Онлайн-тренажер для мозга Like Центр - Центр поддержки и развития предпринимательства. Gamersbay - лучший магазин по бустингу для World of Warcraft. Ноотропы OmniMind N°1 - Усиливает мозговую активность. Повышает мотивацию. Улучшает память. Санкт-Петербургская школа телевидения - это федеральная сеть образовательных центров, которая имеет филиалы в 37 городах России. Lingualeo.com — интерактивный онлайн-сервис для изучения и практики английского языка в увлекательной игровой форме. Junyschool (Джунискул) – международная школа программирования и дизайна для детей и подростков от 5 до 17 лет, где ученики осваивают компьютерную грамотность, развивают алгоритмическое и креативное мышление, изучают основы программирования и компьютерной графики, создают собственные проекты: игры, сайты, программы, приложения, анимации, 3D-модели, монтируют видео. Умназия - Интерактивные онлайн-курсы и тренажеры для развития мышления детей 6-13 лет SkillBox - это один из лидеров российского рынка онлайн-образования. Среди партнеров Skillbox ведущий разработчик сервисного дизайна AIC, медиа-компания Yoola, первое и самое крупное русскоязычное аналитическое агентство Tagline, онлайн-школа дизайна и иллюстрации Bang! Bang! Education, оператор PR-рынка PACO, студия рисования Draw&Go, агентство performance-маркетинга Ingate, scrum-студия Sibirix, имидж-лаборатория Персона. «Нетология» — это университет по подготовке и дополнительному обучению специалистов в области интернет-маркетинга, управления проектами и продуктами, дизайна, Data Science и разработки. В рамках Нетологии студенты получают ценные теоретические знания от лучших экспертов Рунета, выполняют практические задания на отработку полученных навыков, общаются с экспертами и единомышленниками. Познакомиться со всеми продуктами подробнее можно на сайте https://netology.ru, линейка курсов и профессий постоянно обновляется. StudyBay Brazil – это онлайн биржа для португалоговорящих студентов и авторов! Студент получает уникальную работу любого уровня сложности и больше свободного времени, в то время как у автора появляется дополнительный заработок и бесценный опыт. Автор24 — самая большая в России площадка по написанию учебных работ: контрольные и курсовые работы, дипломы, рефераты, решение задач, отчеты по практике, а так же любой другой вид работы. Сервис сотрудничает с более 70 000 авторов. Более 1 000 000 работ уже выполнено. StudyBay – это онлайн биржа для англоязычных студентов и авторов! Студент получает уникальную работу любого уровня сложности и больше свободного времени, в то время как у автора появляется дополнительный заработок и бесценный опыт.

Английская Википедия:Empowerment (artificial intelligence)

Содержание

Definition

Contextual Empowerment

Application

References

Навигация

Действия на странице

Действия на странице

Персональные инструменты

Навигация

Поиск

Инструменты