Русская Википедия:Частотность
Частотность (или относительная частотность) — отношение количества экземпляров данного объекта полному количеству экземпляров всех объектов в данном множестве. Иногда количество экземпляров данного объекта называют абсолютной частотностью этого объекта. В лингвистике и лексикостатистике в качестве таких объектов понимаются слова, буквы, словосочетания, в криптографии и информатике - также сочетания букв и просто любые символы. Под множеством может пониматься какой-либо текст, совокупность текстов (корпус) или даже язык.
Расчёт частотности слов осуществляется по формуле:
- <math>Freq_x=\frac{Q_x}{Q_{all}},</math>
где Freqx — частотность слова «x», Qx — количество словоупотреблений слова «x», Qall — общее количество словоупотреблений. В большинстве случаев частотность выражается в процентах. В словарях частотность слов может отражаться пометками — употребительное, малоупотребительное и т. д.
Аналогичным образом определяется частотность для букв. Бо́льшая частотность согласных на данном отрезке текста (например, в стихотворениях) является одним из признаков аллитерации (наряду с позиционными характеристиками). Высокие показатели частотности гласных в тексте косвенно свидетельствуют об ассонансе. Частотный анализ используется в криптографии для выявления наиболее частотных букв того или иного языка.
Частотность слов и букв являлась важнейшим инструментов криптоанализа в эпоху до повсеместного распространения блочных шифров.
Не следует путать термины частотность и частота.
Частотность букв русского языка
Статистика частотности букв русского языка (на материале НКРЯ):[1]
буква | ранг | употреблений | частотность | |
---|---|---|---|---|
а | 3 | 40487008 | Шаблон:Bartable | |
б | 21 | 8051767 | Шаблон:Bartable | |
в | 9 | 22930719 | Шаблон:Bartable | |
г | 19 | 8564640 | Шаблон:Bartable | |
д | 13 | 15052118 | Шаблон:Bartable | |
е | 2 | 42691213 | Шаблон:Bartable | |
ё | 33 | 184928 | Шаблон:Bartable | |
ж | 25 | 4746916 | Шаблон:Bartable | |
з | 20 | 8329904 | Шаблон:Bartable | |
и | 4 | 37153142 | Шаблон:Bartable | |
й | 23 | 6106262 | Шаблон:Bartable | |
к | 11 | 17653469 | Шаблон:Bartable | |
л | 10 | 22230174 | Шаблон:Bartable | |
м | 12 | 16203060 | Шаблон:Bartable | |
н | 5 | 33838881 | Шаблон:Bartable | |
о | 1 | 55414481 | Шаблон:Bartable | |
п | 14 | 14201572 | Шаблон:Bartable | |
р | 8 | 23916825 | Шаблон:Bartable | |
с | 7 | 27627040 | Шаблон:Bartable | |
т | 6 | 31620970 | Шаблон:Bartable | |
у | 15 | 13245712 | Шаблон:Bartable | |
ф | 31 | 1335747 | Шаблон:Bartable | |
х | 24 | 4904176 | Шаблон:Bartable | |
ц | 28 | 2438807 | Шаблон:Bartable | |
ч | 22 | 7300193 | Шаблон:Bartable | |
ш | 26 | 3678738 | Шаблон:Bartable | |
щ | 29 | 1822476 | Шаблон:Bartable | |
ъ | 32 | 185452 | Шаблон:Bartable | |
ы | 17 | 9595941 | Шаблон:Bartable | |
ь | 18 | 8784613 | Шаблон:Bartable | |
э | 30 | 1610107 | Шаблон:Bartable | |
ю | 27 | 3220715 | Шаблон:Bartable | |
я | 16 | 10139085 | Шаблон:Bartable |
См. также
- Частотный словарь
- Анализ текста
- Математическая лингвистика
- Статистика запросов
- Частотность букв немецкого языка
- Частотность букв таджикского языка
- Списки частотности в Викисловаре
Примечания
Ссылки
- Самые частотные буквы в различных языках Шаблон:Ref-en
- Шаблон:Cite web
- en:Most common words in English Шаблон:Ref-en
- Letter frequency-simia.net Шаблон:En icon
- ↑ О. Н. Ляшевская, С. А. Шаров. Новый частотный словарь русской лексикиШаблон:Проверено