Русская Википедия:Квантитативная лингвистика

Квантитати́вная лингви́стика (Шаблон:Lang-en) — раздел общей лингвистики и, в частности, математической лингвистики. Квантитативная лингвистика (КЛ) исследует язык при помощи статистических методов; её конечная цель — сформулировать законы, по которым функционирует язык и, в конечном счете, построить общую теорию языка в виде совокупности взаимосвязанных законов функционирования языков^[1]Шаблон:Rp Специально для этой цели была созданаШаблон:Кем? синергетическая лингвистика (Synergetic linguistics).^[1]Шаблон:Rp Квантитативная лингвистика эмпирически основывается на результатах языковой статистики, которая, в свою очередь, может интерпретироваться как статистика языков или статистика лингвистического объекта. Эта область знаний не обязательно связана с фундаментальными научными целями. Корпусная лингвистика и компьютерная лингвистика также вносят свой вклад в квантитативную лингвистику, поставляя важные эмпирические данные.

История

Самые ранние концепции КЛ относятся к древнегреческой и древнеиндийской культурам. Один из исторических источников включает приложения комбинаторики к лингвистическим реалиям^[2], другой основывается на элементарных статистических исследованиях, которые можно найти под заголовками колометрия и стихометрия.^[3]

Языковые законы в квантитативной лингвистике

В КЛ под законом понимается класс гипотез, выведенных из теоретических допущений, математически сформулированных, взаимосвязанных с другими законами в этой области и в достаточном объёме и успешно проверенных на эмпирических данных, то есть таких, которые нельзя было опровергнуть несмотря на многочисленные попытки. Köhler пишет о законах КЛ: «Более того, можно показать, что эти свойства лингвистических элементов и отношений между ними подчиняются универсальным законам, которые могут быть сформулированы строго математически, так же как и законы естественных наук. Нужно иметь в виду в данном контексте, что эти законы стохастической природы; они не соблюдаются в каждом отдельном случае (в этом не было бы необходимости и возможности); они скорее определяют вероятности событий или количественные отношения изучаемых явлений. Каждому из упомянутых выше примеров легко найти противоположные, тем не менее эти случаи не нарушают соответствующих законов, поскольку вариации вокруг статистического среднего не только допустимы, но даже и необходимы, так как сами они квантитативно точно определяются соответствующими законами. Ситуация такая же, как и в естественных науках, которые уже давно отказались от старых детерминистских и каузальных (причинно-следственных) взглядов на мир и заменили их на статистические/вероятностные модели»^[4].

Некоторые языковые (лингвистические) законы

Существует целый ряд языковых законов, среди которых^[5]:

Закон диверсификации: Если лингвистические категории (такие, например, как части речи или грамматические окончания) появляются в различных формах, то можно сказать, что частоты их появления в текстах контролируются определёнными законами.

Закон распределение длин (или, в более общем виде, многокомпонентности). Исследование частот различных языковых единиц с точки зрения их длин в текстах и словарях регулярно приводит к выявлению целого ряда распределений, в зависимости от изучаемой единицы. На данный момент были изучены следующие единицы:
- Закон распределения длин морфов;
- Закон распределения длин ритмических единиц^[6];
- Закон распределения длин предложений;
- Закон распределения длин слогов;
- Закон распределения длин слов^[7]^[8];

Другие языковые единицы, которые также подчиняются этому закону, — это, например, буквы (символы) различной сложности, длины так называемых hrebs и речевых актов. Это же справедливо и для распределений звуков (фонов) различной длительности (долготы).

Закон Мартина: Этот закон касается лексических цепочек, которые образуются при поиске дефиниций (определений) слов в словаре, затем дефиниций только что найденных дефиниций и т. д. В конце концов все эти дефиниции образуют иерархию всё более и более общих значений, при этом дефиниций становится тем меньше, чем более общее значение получается. Среди уровней данной иерархии существует целый ряд подчиняющихся закону отношений.

Закон Менцерата (также, в особенности в лингвистике, известный как закон Менцерата-Альтмана): Данный закон гласит, что размеры составляющих конструкции уменьшаются с увеличением самой изучаемой конструкции. Чем длиннее, например, предложение (измеренное количеством входящих в его состав придаточных предложений), тем короче входящие в его состав придаточные предложения (измеренные количеством слов), или: чем длиннее слово (в слогах или морфах), тем короче слоги или их звучание.

Законы частотно-рангового распределения: Практически любая языковая единица подчиняется этим закономерностям. Приведём лишь несколько примеров:
- Слова в тексте организованы в соответствии с частотой их появления в тексте, и каждому из них присвоен номер ранга и соответствующая частота. Со времён Джорджа Кингсли Ципфа (и его известного закона) предлагалось большое количество математических моделей, описывающих отношения между рангом и частотой.
- Можно наблюдать похожее распределение между рангом и частотой звуков, фонем и букв.
- Словесные ассоциации: ранг и частота ассоциаций реагируют на (словесный) стимул.
Закон изменения языка: процессы роста в языке (как, например, расширение словаря), распространение иностранных и заимствованных слов, изменения во флективной системе — подчиняются закону, известному в КЛ как закон Пиотровского, и соответствуют моделям роста в других научных дисциплинах. Закон Пиотровского — это частный случай так называемой логистической модели (ср. с логистическим уравнением). Было показано, что он затрагивает и процессы усвоение языка (ср. закон усвоения языка).
Закон текстового блока: лингвистические единицы (напр., слова, буквы, синтаксические функции и конструкции) демонстрируют определённые распределения частот в одинаково больших блоках текстов.
Закон Ципфа: частота слова обратно пропорциональна его порядковому номеру в списках частотности^[9].

Стилистика

Изучение поэтического и непоэтического стилей может основываться на статистических методах; более того, возможно проводить соответствующие исследования на основе особых форм (параметров), которые языковые законы принимают в текстах различных стилей. В таких случаях КЛ проводит исследование в стилистике: одна из итоговых целей — доказать существование стилистического феномена, ссылаясь на действие языкового закона (причём настолько объективно, насколько это вообще возможно. Одно из главных предположений КЛ состоит в том, что некоторые законы (например, закон распределения длин слов) требуют различных моделей, по крайне мере различных значений параметров закона (распределений или функций), в зависимости от типа текста. Если изучаются поэтические тексты, то методы КЛ образуют поддисциплину, которая называется «Квантитативное изучение литературы» (Стилометрия)^[10].

Примечания

Шаблон:Примечания

Литература

Karl-Heinz Best: Quantitative Linguistik. Eine Annäherung. 3., stark überarbeitete und ergänzte Auflage. Peust & Gutschmidt, Göttingen 2006, ISBN 3-933043-17-4.
Karl-Heinz Best, Otto Rottmann: Quantitative Linguistics, an Invitation. RAM-Verlag, Lüdenscheid 2017. ISBN 978-3-942303-51-4.
Peter Grzybek, Emmerich Kelih: Zur Vorgeschichte quantitativer Ansätze in der russischen Sprach- und Literaturwissenschaft. In: Reinhard Köhler, Gabriel Altmann, Gabriel, Rajmund G. Piotrowski (eds.): Quantitative Linguistik — Quantitative Linguistics. Ein internationales Handbuch — An International Handbook. de Gruyter, Berlin/ New York 2005, p. 23-64. ISBN 3-11-015578-8.
Emmerich Kelih: Geschichte der Anwendung quantitativer Verfahren in der russischen Sprach- und Literaturwissenschaft. Kovač, Hamburg 2008. ISBN 978-3-8300-3575-6.
Sebastian Kempgen: Russische Sprachstatistik. Systematischer Überblick und Bibliographie. Verlag Otto Sagner, München 1995. ISBN 3-87690-617-2.
В. В. Левицкий: Квантитативные методы в лингвистике. Нова книга, Винница 2007. ISBN 978-966-382-046-0.
A. V. Zenkov, A Method of Text Attribution Based on the Statistics of Numerals // Journal of Quantitative Linguistics. 2018, Vol. 25, No.3, p. 256—270. DOI: 10.1080/09296174.2017.1371915.

Шаблон:Вс

↑ ^1,0 ^1,1 Шаблон:Книга
↑ N.L. Biggs: The Roots of Combinatorics. In: Historia Mathematica 6, 1979, S. 109—136.
↑ Adam Pawłowski: Prolegomena to the History of Corpus and Quantitative Linguistics. Greek Antiquity. In: Glottotheory 1, 2008, S. 48-54.
↑ cf. note 1, p. 1-2.
↑ cf. references: Köhler, Altmann, Piotrowski (eds.) (2005)
↑ Marina Knaus: Zur Verteilung rhythmischer Einheiten in russischer Prosa. In: Glottometrics 16, 2008, p. 57-62. (PDF ram-verlag.eu Шаблон:Wayback)
↑ Ioan-Iovitz Popescu, et alii: Word length: aspects and languages. In: Reinhard Köhler, Gabriel Altmann (eds.): Issues in Quantitative Linguistics 3. Dedicated to Karl-Heinz Best on the occasion of his 70th birthday. Lüdenscheid: RAM-Verlag 2013, p. 224—281. ISBN 978-3-942303-12-5.
↑ Ioan-Iovitz Popescu, Karl-Heinz Best, Gabriel Altmann: Unified Modelling of Length in Language. Lüdenscheid: RAM-Verlag 2014. ISBN 978-3-942303-26-2.
↑ H. Guiter, M. V. Arapov (eds.): Studies on Zipf’s Law. Bochum: Brockmeyer 1982. ISBN 3-88339-244-8.
↑ Alexander Mehler: Eigenschaften der textuellen Einheiten und Systeme. In: Reinhard Köhler, Gabriel Altmann, Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik — Quantitative Linguistics. Ein internationales Handbuch. de Gruyter, Berlin/ New York 2005, p. 325—348, esp. Quantitative Stilistik, p. 339—340. ISBN 3-11-015578-8; Vivien Altmann, Gabriel Altmann: Anleitung zu quantitativen Textanalysen. Methoden und Anwendungen. Lüdenscheid: RAM-Verlag 2008, ISBN 978-3-9802659-5-9.

[:0-1] 1,0 ^1,1 Шаблон:Книга

[2] N.L. Biggs: The Roots of Combinatorics. In: Historia Mathematica 6, 1979, S. 109—136.

[3] Adam Pawłowski: Prolegomena to the History of Corpus and Quantitative Linguistics. Greek Antiquity. In: Glottotheory 1, 2008, S. 48-54.

[4] . note 1, p. 1-2.

[5] . references: Köhler, Altmann, Piotrowski (eds.) (2005)

[6] Marina Knaus: Zur Verteilung rhythmischer Einheiten in russischer Prosa. In: Glottometrics 16, 2008, p. 57-62. (PDF ram-verlag.eu Шаблон:Wayback)

[7] Ioan-Iovitz Popescu, et alii: Word length: aspects and languages. In: Reinhard Köhler, Gabriel Altmann (eds.): Issues in Quantitative Linguistics 3. Dedicated to Karl-Heinz Best on the occasion of his 70th birthday. Lüdenscheid: RAM-Verlag 2013, p. 224—281. ISBN 978-3-942303-12-5.

[8] Ioan-Iovitz Popescu, Karl-Heinz Best, Gabriel Altmann: Unified Modelling of Length in Language. Lüdenscheid: RAM-Verlag 2014. ISBN 978-3-942303-26-2.

[9] H. Guiter, M. V. Arapov (eds.): Studies on Zipf’s Law. Bochum: Brockmeyer 1982. ISBN 3-88339-244-8.

[10] Alexander Mehler: Eigenschaften der textuellen Einheiten und Systeme. In: Reinhard Köhler, Gabriel Altmann, Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik — Quantitative Linguistics. Ein internationales Handbuch. de Gruyter, Berlin/ New York 2005, p. 325—348, esp. Quantitative Stilistik, p. 339—340. ISBN 3-11-015578-8; Vivien Altmann, Gabriel Altmann: Anleitung zu quantitativen Textanalysen. Methoden und Anwendungen. Lüdenscheid: RAM-Verlag 2008, ISBN 978-3-9802659-5-9.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

Партнерские ресурсы
Криптовалюты	Обмен криптовалют - www.bestchange.ru Криптовалютная биржа CoinEx Криптовалютная биржа Binance HIVE OS - операционная система для майнинга e4pool - Мультивалютный пул для майнинга.
Магазины	AliExpress — глобальная виртуальная (в Интернете) торговая площадка, предоставляющая возможность покупать товары производителей из КНР; computeruniverse.net - Интернет-магазин компьютеров(Промо код 5 Евро на первую покупку:FWWC3ZKQ);
Хостинг	DigitalOcean - американский провайдер облачных инфраструктур, с главным офисом в Нью-Йорке и с центрами обработки данных по всему миру;
Разное	Викиум - Онлайн-тренажер для мозга Like Центр - Центр поддержки и развития предпринимательства. Gamersbay - лучший магазин по бустингу для World of Warcraft. Ноотропы OmniMind N°1 - Усиливает мозговую активность. Повышает мотивацию. Улучшает память. Санкт-Петербургская школа телевидения - это федеральная сеть образовательных центров, которая имеет филиалы в 37 городах России. Lingualeo.com — интерактивный онлайн-сервис для изучения и практики английского языка в увлекательной игровой форме. Junyschool (Джунискул) – международная школа программирования и дизайна для детей и подростков от 5 до 17 лет, где ученики осваивают компьютерную грамотность, развивают алгоритмическое и креативное мышление, изучают основы программирования и компьютерной графики, создают собственные проекты: игры, сайты, программы, приложения, анимации, 3D-модели, монтируют видео. Умназия - Интерактивные онлайн-курсы и тренажеры для развития мышления детей 6-13 лет SkillBox - это один из лидеров российского рынка онлайн-образования. Среди партнеров Skillbox ведущий разработчик сервисного дизайна AIC, медиа-компания Yoola, первое и самое крупное русскоязычное аналитическое агентство Tagline, онлайн-школа дизайна и иллюстрации Bang! Bang! Education, оператор PR-рынка PACO, студия рисования Draw&Go, агентство performance-маркетинга Ingate, scrum-студия Sibirix, имидж-лаборатория Персона. «Нетология» — это университет по подготовке и дополнительному обучению специалистов в области интернет-маркетинга, управления проектами и продуктами, дизайна, Data Science и разработки. В рамках Нетологии студенты получают ценные теоретические знания от лучших экспертов Рунета, выполняют практические задания на отработку полученных навыков, общаются с экспертами и единомышленниками. Познакомиться со всеми продуктами подробнее можно на сайте https://netology.ru, линейка курсов и профессий постоянно обновляется. StudyBay Brazil – это онлайн биржа для португалоговорящих студентов и авторов! Студент получает уникальную работу любого уровня сложности и больше свободного времени, в то время как у автора появляется дополнительный заработок и бесценный опыт. Автор24 — самая большая в России площадка по написанию учебных работ: контрольные и курсовые работы, дипломы, рефераты, решение задач, отчеты по практике, а так же любой другой вид работы. Сервис сотрудничает с более 70 000 авторов. Более 1 000 000 работ уже выполнено. StudyBay – это онлайн биржа для англоязычных студентов и авторов! Студент получает уникальную работу любого уровня сложности и больше свободного времени, в то время как у автора появляется дополнительный заработок и бесценный опыт.

Русская Википедия:Квантитативная лингвистика

Содержание

История

Языковые законы в квантитативной лингвистике

Некоторые языковые (лингвистические) законы

Стилистика

Примечания

Литература

Навигация

Действия на странице

Действия на странице

Персональные инструменты

Навигация

Поиск

Инструменты