Русская Википедия:Абсолютная энтропия языка

Материал из Онлайн справочника
Перейти к навигацииПерейти к поиску

Абсолютная энтропия языка — величина, равная максимуму информации, которую можно передать единицей данного языка. В теории информации обычно под единицей языка понимают один символ (букву) соответствующего алфавита, а абсолютная энтропия вычисляется при условии равновероятности всех последовательностей символов.

Если в алфавите языка используется <math>L</math> различных букв, то абсолютная энтропия языка (бит на букву) можно вычислить как:

<math>R = \log_{2}{L}</math>

Данная величина не учитывает возможную непроизносимость полученных «слов».

Для английского языка эта величина примерно равна 4,7 бита на букву. Данная величина намного больше фактической энтропии языка, так как английский язык, как и все естественные языки, обладает избыточностью.

Литература