Русская Википедия:Энтропия

Материал из Онлайн справочника
Перейти к навигацииПерейти к поиску

Шаблон:Значения

Энтропи́я (от Шаблон:Lang-grc «в» + Шаблон:Lang-gr2 «обращение; превращение») — широко используемый в естественных и точных науках термин (впервые введён в рамках термодинамики как функция состояния термодинамической системы), обозначающий меру необратимого рассеивания энергии или бесполезности энергии (потому что не всю энергию системы можно использовать для превращения в какую-нибудь полезную работу). Для понятия энтропии в данном разделе физики используют название термодинамическая энтропия; термодинамическая энтропия обычно применяется для описания равновесных (обратимых) процессов.

В статистической физике энтропия характеризует вероятность осуществления какого-либо макроскопического состояния. Кроме физики, термин широко употребляется в математике: теории информации и математической статистике. В этих областях знания энтропия определяется статистически и называется статистической или информационной энтропией. Данное определение энтропии известно также как энтропия Шеннона (в математике) и энтропия Больцмана—Гиббса (в физике).

Хотя понятия термодинамической и информационной энтропии вводятся в рамках различных формализмов, они имеют общий физический смысл — логарифм числа доступных состояний системы. Взаимосвязь этих понятий впервые установил Людвиг Больцман. В неравновесных (необратимых) процессах энтропия также служит мерой близости состояния системы к равновесному: чем больше энтропия, тем ближе система к равновесию (в состоянии термодинамического равновесия энтропия системы максимальна).

Величина, противоположная энтропии, именуется негэнтропией или, реже, экстропией.

Употребление в различных дисциплинах

  • Термодинамическая энтропия — термодинамическая функция, характеризующая меру необратимой диссипации энергии в ней.
  • В статистической физике — характеризует вероятность осуществления некоторого макроскопического состояния системы.
  • В математической статистике — мера неопределённости распределения вероятностей.
  • Информационная энтропия — в теории информации мера неопределённости источника сообщений, определяемая вероятностями появления тех или иных символов при их передаче.
  • Энтропия динамической системы — в теории динамических систем мера хаотичности в поведении траекторий системы.
  • Дифференциальная энтропия — формальное обобщение понятия энтропии для непрерывных распределений.
  • Энтропия отражения — часть информации о дискретной системе, которая не воспроизводится при отражении системы через совокупность своих частей.
  • Энтропия в теории управления — мера неопределённости состояния или поведения системы в данных условиях.
  • Технологическая энтропия — «количественная мера отставания данной технологии от наивысшего в мире уровня, принимаемого за единицу. Основным параметром, характеризующим меру технологической энтропии, является степень неопределённости получения конечного результата, а именно: объёма выпуска инновационной продукции, который может быть получен при данных объёмах вовлечённых в производство ресурсов»[1].

В термодинамике

Шаблон:Main Понятие энтропии впервые было введено Клаузиусом в термодинамике в 1865 году для определения меры необратимого рассеивания энергии, меры отклонения реального процесса от идеального. Определённая как сумма приведённых теплот, она является функцией состояния и остаётся постоянной при замкнутых обратимых процессах, тогда как в необратимых замкнутых — её изменение всегда положительно. В открытой системе может происходить уменьшение энтропии рассматриваемой системы за счет уноса энергии, например в виде излучения, при этом полная энтропия окружающей среды увеличивается[2].

Математически энтропия определяется как функция состояния системы, определённая с точностью до произвольного постоянного слагаемого. Разность энтропий в двух равновесных состояниях 1 и 2 по определению равна приведённому количеству тепла (<math>\delta Q / T </math>), которое надо сообщить системе, чтобы перевести её из состояния 1 в состояние 2 по любому квазистатическому пути[3]: Шаблон:EF Так как энтропия определена с точностью до произвольной аддитивной постоянной, то можно условно принять состояние 1 за начальное и положить <math>S_1 = 0</math>. Тогда Шаблон:EF Здесь интеграл берется для произвольного квазистатического процесса. Дифференциал функции <math>S</math> имеет вид Шаблон:EF

Энтропия устанавливает связь между макро- и микросостояниями. Особенность данной характеристики заключается в том, что это единственная функция в физике, которая показывает направленность процессов. Поскольку энтропия является функцией состояния, то она не зависит от того, как осуществлён переход из одного состояния системы в другое, а определяется только начальным и конечным состояниями системы.

Физический смысл энтропии

Термодинамическая энтропия как физическая величина отличается своей абстрактностью, физический смысл энтропии непосредственно не вытекает из её математического выражения и не поддаётся простому интуитивному восприятию.

С физической точки зрения энтропия характеризует степень необратимости, неидеальности реального термодинамического процесса. Она является мерой диссипации (рассеивания) энергии, а также мерой оценки энергии в плане её пригодности (или эффективности) использования для превращения теплоты в работу. Шаблон:Sfn Два последних утверждения не относятся к необычным системам с отрицательной абсолютной температурой, в которых теплота самопроизвольно может полностью превращаться в работу.

В теории информации

Шаблон:MainДля энтропии (чаще в математике) встречается также название шенноновская информация или количество информации по ШеннонуШаблон:Sfn.

Энтропия может интерпретироваться как мера неопределённости (неупорядоченности) или сложности некоторой системы, например, какого-либо опыта (испытания), который может иметь разные исходы, а значит, и количество информации[4][5]. Таким образом, другой интерпретацией энтропии является информационная ёмкость системы. С данной интерпретацией связан тот факт, что создатель понятия энтропии в теории информации (Клод Шеннон) сначала хотел назвать эту величину информацией.

Понятие информационной энтропии применяется как в теории информации и математической статистике, так и в статистической физике (энтропия Гиббса и её упрощённый вариант — энтропия Больцмана)[6][7]. Математический смысл информационной энтропии — это логарифм числа доступных состояний системы (основание логарифма может быть различным, но большим 1, оно определяет единицу измерения энтропии)Шаблон:Sfn. Такая функция от числа состояний обеспечивает свойство аддитивности энтропии для независимых систем. Причём, если состояния различаются по степени доступности (то есть не равновероятны), под числом состояний системы нужно понимать их эффективное количество, которое определяется следующим образом.

Пусть состояния системы равновероятны и имеют вероятность <math>p</math>, тогда число состояний <math>N=1/p</math>, а <math>\log N=\log (1/p)</math>. В случае разных вероятностей состояний <math>p_i</math> рассмотрим средневзвешенную величину

<math>\log \overline{N}=\sum_{i=1}^N p_i \log (1/p_i),</math>

где <math>\overline{N}</math> — эффективное количество состояний. Из данной интерпретации непосредственно вытекает выражение для информационной энтропии Шеннона:

<math>H=\log \overline{N}=-\sum_{i=1}^N p_i\log p_i.</math>

Подобная интерпретация справедлива и для энтропии Реньи, которая является одним из обобщений понятия информационная энтропия, но в этом случае иначе определяется эффективное количество состояний системы. Энтропии Реньи соответствует эффективное количество состояний, определяемоеШаблон:Sfn как среднее степенное взвешенное с параметром <math>q \le 1</math> от величин <math>1/p_i</math>.

Следует заметить, что интерпретация формулы Шеннона на основе взвешенного среднего не является её обоснованием. Строгий вывод этой формулы может быть получен из комбинаторных соображений с помощью асимптотической формулы Стирлинга и заключается в том, что комбинаторность распределения (то есть число способов, которыми оно может быть реализовано) после взятия логарифма и нормировки в пределе совпадает с выражением для энтропии в виде, предложенном Шенноном[8]Шаблон:Sfn[9].

Аксиоматическое определение энтропии

Выражение для информационной энтропии может быть выведено на основе некоторой системы аксиом. Одним из подходов является следующая система аксиом, известная как система аксиом Хинчина:[10].

1. Пусть некоторая система может пребывать в каждом из <math>N</math> доступных состояний с вероятностью <math>p_i</math>, где <math>i=1,...,N</math>. Энтропия <math>H</math> является функцией только вероятностей <math>P=(p_1,...,p_N)</math>: <math>H=H(P)</math>.
2. Для любой системы <math>P</math> справедливо <math>H(P) \le H(P_{unif})</math>, где <math>P_{unif}</math> — система с равномерным распределением вероятностей: <math>p_1=p_2=...=p_N=1/N</math>.
3. Если добавить в систему состояние <math>p_{N+1}=0</math>, то энтропия системы не изменится.
4. Энтропия совокупности двух систем <math>P</math> и <math>Q</math> имеет вид <math>H(PQ)=H(P)+H(Q/P)</math>, где <math>H(Q/P)</math> — средняя по ансамблю <math>P</math> условная энтропия <math>Q</math>.

Указанный набор аксиом однозначно приводит к формуле для энтропии Шеннона.

Некоторые авторы[11] обращают внимание на неестественность последней аксиомы Хинчина. И действительно, более простым и очевидным является требование аддитивности энтропии для независимых систем. Таким образом, последняя аксиома может быть заменена следующим условием.

4'. Энтропия совокупности двух независимых систем <math>P</math> и <math>Q</math> имеет вид <math>H(PQ)=H(P)+H(Q)</math>.

Оказывается, система аксиом с пунктом 4' приводит не только к энтропии Шеннона, но и к энтропии Реньи.

f-энтропия

Кроме энтропии Реньи, известны и другие обобщения стандартной энтропии Шеннона, например класс f-энтропий, предложенный[12] И. Чисаром в 1972 г. Также С. Аримото в 1971 г. предложил[13] концепцию f-энтропии, задающую иной класс функционалов. Далее рассматривается концепция И. Чисара. Понятие f-энтропии связано[14] с понятием f-дивергенции. Элементы этих классов образуют парное соответствие, причём каждая такая пара функционалов определяется некоторой выпуклой функцией <math>f(t)</math> при <math>t \geq 0</math>, удовлетворяющей условию <math>f(1)=0</math>.

Для заданной функции <math>f(t)</math> f-энтропия дискретного распределения <math>P=\{p_i\,|\,i=1,...,N\}</math> определяется как

<math> H_f(P) = -\sum_{i=1}^N f\left(p_i\right). </math>

Наиболее известными частными случаями f-энтропии являются:

  • энтропия Шеннона для <math>f(t)=t\ln t</math>;
  • энтропия Берга для <math>f(t)=-\ln t</math>;
  • энтропия Цаллиса для <math>f(t)={t^q-t \over q-1}</math>, <math>q>0</math>, <math>q \neq 1</math>;
  • альфа-энтропия для <math>f(t) = {t^\alpha-t \over \alpha(\alpha-1)}</math>, <math>\alpha \neq 1</math>, <math>\alpha \neq 0</math>.

Энтропия Шеннона является единственной аддитивной энтропией в классе f-энтропий.

Понятие f-энтропии определяют в общем виде следующим образом. Пусть <math>P</math> — распределение вероятностей и <math>\mu</math> — любая мера на <math>\Omega</math>, для которой существует абсолютно непрерывная относительно <math>\mu</math> функция <math>p = \frac{dP}{d\mu}</math>. Тогда

<math> H_f(P) = -\int_{\Omega} f(p)\,\partial\mu.</math>

Однако непрерывные версии f-энтропий могут не иметь смысла по причине расходимости интеграла.

f-энтропия является вогнутым функционалом от распределения вероятностей.

Можно заметить, что функция <math>f(t)</math> может быть задана с точностью до слагаемого <math>c(t-1)</math>, где <math>c</math> — произвольная константа. Независимо от выбора <math>c</math> функция <math>f(t)</math> порождает единственный функционал f-дивергенции. А функционал f-энтропии оказывается определённым с точностью до произвольной аддитивной постоянной, то есть выбором константы <math>c</math> можно задать начало отсчёта энтропии. При этом возникает следующий нюанс: в случае <math>\mu(\Omega)=\infty</math> константа <math>c</math> должна выбираться так, чтобы подынтегральное выражение не содержало ненулевых постоянных слагаемых, иначе интеграл будет всегда расходиться, то есть <math>c</math> перестаёт быть произвольной. В частности, в дискретной версии энтропии константа <math>c</math> должна фиксироваться при <math>N=\infty</math>. Поэтому для f-энтропии, чтобы не уменьшать общность определения, можно явно указывать аддитивную константу. Например, если <math>\mu</math> — лебегова мера на <math>\Omega</math>, тогда <math>p(x)</math> — плотность распределения вероятности и

<math> H_f(P) = -\int_{\Omega} f(p(x))\,dx+c,</math>

где <math>c</math> — произвольная константа.

Функция <math>f(t)</math> может также задаваться с точностью до произвольного положительного сомножителя, выбор которого равносилен выбору единицы измерения соответствующей f-энтропии или f-дивергенции.

Сравнивая выражения для f-энтропии и f-дивергенции в общем виде, можно записать следующее связывающее их соотношение[15]:

<math> H(P) = -D(P\parallel Q_0)+c,</math>

где <math>Q_0</math> — равномерное на <math>\Omega</math> распределение. Если положить, что аргументами энтропии и дивергенции выступают производные распределений по мере <math>\mu</math> (то есть плотности распределений), имеет место формальная запись

<math> H(p) = -D(p\parallel 1)+c.</math>

Данная связь носит фундаментальный характер и играет важную роль не только в классах f-энтропии и f-дивергенции. Так, данное соотношение справедливо для энтропии и дивергенции Реньи и, в частности, для энтропии Шеннона и дивергенции Кульбака—Лейблера. Обусловлено это тем, что согласно общепринятой аксиоматике энтропия достигает максимума на равномерном распределении вероятностей.

В биологии

Вводимая обычно как «мера неупорядоченности или неопределенности системы» энтропия часто используется в рассуждениях о направленности эволюционных процессов. Согласно этой точке зрения, биосфера — сверхсложная самоорганизующаяся структура, «питающаяся» неограниченной энтропией солнечного излучения[16][17]. Бактериородопсин выполняет ту же функцию, что и хлорофилл (туннельный эффект) — обеспечивает преобразование электромагнитного облучения в энергию химических связей. Если говорить о порядке, то упорядочивание расположения элементов фотосинтетической электрон-транспортной цепи обеспечивается фотосинтетической мембраной (структурной единицей хлоропластов), которая определяет направленный перенос электронов и протонов, создавая и поддерживая разность электрохимических потенциалов ионов, разделяя окисленные и восстановленные продукты и препятствуя их рекомбинации[18].

Считается, что сложность организации по-разному влияет на устойчивость в живой и неживой природе[19][20]. В неживой природе увеличение сложности приводит к понижению устойчивости живого вещества. В противоположность этому в живой природе сложные (социальные) организации устойчивее (в смысле способности к выживанию), нежели устойчивость каждого элемента в отдельности. Например, численность организмов, состоящих из малого числа клеток (например, москитов), значительно больше численности организмов, состоящих из большого числа клеток (например, слонов). Однако это ничего не говорит об устойчивости, отнесенной к элементарной составляющей. Если бы цитолог пожелал заняться статистикой и собрал случайным образом коллекцию клеток, то он нашел бы в ней больше всего клеток, принадлежащих млекопитающим. Это говорит о том, что с усложнением живых организмов устойчивость их элементарных составляющих (клеток) значительно увеличивается[21].

По аналогии с шенноновским определением энтропии в качестве меры организованности можно рассматривать величину

<math>G=-\sum^{N+1}_{i=1}p_{i}\log p_{i},</math>

где <math>p_{i}</math> — отношение числа связей <math>n_{i},</math> имеющихся у элемента <math>i</math> в данный момент, к числу всех возможных <math>N</math> связей этого элемента. Здесь, как и в случае определения энтропии источника информации, справедливо условие <math>0\leq p_{i}\leq 1,</math> однако условие <math>\sum_{i}p_{i}=1,</math> выполняющееся для случая определения энтропии, здесь уже не имеет места и заменяется неравенством <math>0\leq \sum_{i}p_{i}\leq (N+1).</math> Для элемента <math>i,</math> не имеющего ни одной связи с любым другим элементом, <math>p_{i}=0.</math> Напротив, когда элемент <math>i</math> соединен со всеми другими <math>N</math> элементами, <math>p_{i}=1</math> и <math>\log p_{i}=0.</math>

Выражение для меры относительной организованности запишется следующим образом:

<math>G=-\sum^{N+1}_{i=1}\frac{n_{i}}{N}\log\frac{n_{i}}{N}=-\frac{1}{N}\sum^{N+1}_{i=1}(n_{i}\log n_{i}+n_{i}\log\frac{1}{N})=-\frac{1}{N}\log\frac{1}{N}\sum^{N+1}_{i=1}n_{i}-\frac{1}{N}\sum^{N+1}_{i=1}n_{i}\log n_{i}.</math>

Максимальная организованность находится приравниванием <math>G</math> по всем <math>p_{i}</math> нулю, в результате чего получается система из <math>N+1</math> уравнений:

<math>\frac{dG}{\partial p_{j}}=-\frac{d}{\partial p_{j}}\sum^{N+1}_{i=1}p_{i}\log p_{i}=0\quad\quad (j=\overline{1,(N+1)}).</math>

Для любого из этих уравнений справедливо

<math>\frac{dG}{\partial p_{j}}=-\frac{d}{\partial p_{j}}(p_{j}\log p_{j})-\frac{d}{\partial p_{j}}\sum_{i\neq j}p_{i}\log p_{i}=-\log e-\log p_{j}-0=0,\quad\quad \log p_{j}=-\log e=\log\frac{1}{e}.</math>

Таким образом, для достижения максимума организованности отношение связи должно быть равно <math>p_{i}=\frac{1}{e}</math> (где <math>e</math> — число Эйлера), <math>G_{\mathrm{max}}=(N+1)\frac{1}{e}\log e.</math>

Данное нестохастическое толкование организованности обладает и тем преимуществом, что позволяет сделать ряд интересных выводов. Для учета в степени связи наличия связи между двумя элементами через промежуточные элементы нужно будет использовать не число связей, подходящих к элементу <math>i,</math> а число, которое определяется из выражения

<math>n_{i}=\sum_{j\neq i}m_{i,j},</math>

где <math>m_{i,j}=m_{j,i}</math> — степень родства (сила связи) между элементами <math>i</math> и <math>j.</math> В этом случае <math>p_{i}</math> будет представлять в формуле относительную общую силу связи (вместо числа связей, как было ранее) для элемента <math>i.</math>[22]

См. также

Шаблон:Колонки

Шаблон:Колонки/конец

Примечания

Шаблон:Примечания

Литература

Ссылки

Шаблон:Вс Шаблон:Термодинамические потенциалы Шаблон:Rq

  1. Шаблон:Книга
  2. Книга:Физическая энциклопедия
  3. Книга:Сивухин Д.В.: Термодинамика и молекулярная физика
  4. Книга:Физическая энциклопедия
  5. Шаблон:БСЭ3
  6. http://emf.pskgu.ru/ebooks/astros/0401_O.pdf
  7. http://profbeckman.narod.ru/poryadok/Doclad_poryadok.pdf
  8. Шаблон:Статья
  9. Шаблон:Статья
  10. Шаблон:Статья
  11. Шаблон:Статья
  12. Шаблон:Статья
  13. Шаблон:Статья
  14. Шаблон:Статья
  15. Шаблон:Статья
  16. Рапапорт А. — Математические аспекты абстрактного анализа систем // Исследования по общей теории систем. М.: Прогресс. 1969. С. 83-105.
  17. Н. Н. Брушлинская, Фактор-инвариантность уравнений химической кинетики вдоль одномерного множества в пространстве параметров, УМН, 1975, том 30, выпуск 6(186), 161—162.
  18. Кадошников С. И. — Фотоэлектрические и спектральные свойства искусственных хлорофилл-липидных мембран.
  19. Усков А. А., Круглов В. В. — Устойчивость больших систем.
  20. George J.Klir — Architecture of systems problem solving.
  21. Г.Фёрстер — Био-логика // «Проблемы бионики: Биологические прототипы и синтетические системы», изд. «Мир», М., 1965.
  22. Р.Бойелл — Память с семантическими связями // «Проблемы бионики: Биологические прототипы и синтетические системы», изд. «Мир», М., 1965.