Русская Википедия:Коэффициент Жуайна

Материал из Онлайн справочника
Перейти к навигацииПерейти к поиску

Коэффициент Жуайна — в лингвистике коэффициент, показывающий, насколько универсально или, наоборот, специализировано применение того или иного слова в текстах различной тематики. Если слово применяется только в текстах определённой узкой тематики, коэффициент Жуайна близок к 0, если же частота словоупотребления примерно одинакова в любом тексте, коэффициент близок к 100.

Вычисление

Коэффициент Жуайна определяется формулой[1][2]

<math> D = 100 \left ( 1 - \frac {\sigma}{\mu \sqrt{n-1}} \right ), </math>

где <math>n</math> — количество тематических сегментов, на которые разбиты исследуемые тексты;

<math>\mu</math> — средняя частота слова по всем сегментам;

<math>\sigma</math> — среднеквадратическое отклонение частот по отдельным сегментам.

Для вычисления коэффициента Жуайна исследуемые тексты разбиваются на сегменты разной тематики примерно одинакового объёма (при составлении частотных словарей обычно выделяют 100 сегментов). Для каждого сегмента вычисляется частота употребления <math>\mu_i</math> определённого слова, то есть количество словоупотреблений, делённое на общий объём сегмента. Для полученного ряда частот <math>\mu_i</math> вычисляется среднеквадратическое отклонение <math>\sigma</math>, после чего полученные значения подставляются в формулу.

Пример

Пусть исследуемые тексты разбиты на 4 сегмента, каждый размером по 1 миллиону слов. Некоторое слово, например, «коэффициент» встречается в этих сегментах соответственно 10, 11, 8 и 3 раза. Тогда <math>\mu_1</math> = 10, <math>\mu_2</math> = 11, <math>\mu_3</math> = 9, <math>\mu_4</math> = 3 употребления на миллион. Среднее значение

<math> \mu = \frac {10 + 11 + 8 + 3}{4} =8. </math>

Среднеквадратическое отклонение

<math> \sigma = \sqrt{ \frac {(10-8)^2 + (11-8)^2 + (8-8)^2 + (3-8)^2}{4} } = \sqrt{ \frac {4 + 9 + 0 + 25}{4} } = \sqrt{9,5} = 3,08. </math>

Тогда Коэффициент Жуайна

<math> D = 100 \left ( 1 - \frac {3,08}{8 \sqrt{4-1}} \right ) = 100 ( 1 - 0,22) = 78. </math>

Примечания

Шаблон:Reflist

См. также

Частотный словарь

  1. Ошибка цитирования Неверный тег <ref>; для сносок Sharov не указан текст
  2. Ошибка цитирования Неверный тег <ref>; для сносок Juilland не указан текст