История из жизни:9279

Материал из Онлайн справочника
Перейти к навигацииПерейти к поиску

Господа, в том числе Дима Вернер!По роду деятельности я - биостатистик (то же самое, что матстатистик,только работаю в медицине). В свободное от работы время я провел анализсайта, основные результаты которого привожу ниже.МАТЕРИАЛЫ И МЕТОДЫПроизведен анализ оценок, выставленных анекдотам за период январь-март1999 года. Каждому анекдоту приписана переменная "ранг", равная месту,занятому анекдотом в день, когда он был рассказан (все места исследованыне в тот же день, а в период с 15 по 30 апреля, т.е. когда оценка вышлана плато). В качестве независимых переменных выбраны _слова_ (лексическиеединицы) и _понятия_ (логические единицы). Каждый анекдот принимаетпо каждой из переменных значение 1 или 0 (есть в анекдоте или нет данное_слово_ или _понятие_. Кроме того, были созданы некоторые дополнительныепеременные, функции от основных (см. дальше) Расчеты проводились по моделилинейной регрессии с учетом взаимодействий между переменными. Например,совместное употребление слова X и понятия Y может быть новой переменной.РЕЗУЛЬТАТЫВыделена группа наиболее сильных предикторов, т.е. слов и/или понятий,положительно связанных с успехом анекдота, т.е. с его рангом (местомв данный день). В следующей таблице эти переменные приведены вместес величиной R квадрат, характеризующей, какую часть успеха (грубо говоря,в процентах или в долях единицы) объясняет предиктор.слово "хуй" 0.15понятие "гинекология" 0.14слово "поручик" 0.12понятие "Windows 95" 0.11слово "жопа" 0.11понятие "импичмент" 0.08понятие "программист" 0.08более одного слова "хуй" 0.06более 6 матерных слов 0.06слово "девушка" 0.05Остальные слова и понятия не достигли статистически значимого уровня.ОБСУЖДЕНИЕОбращает на себя внимание тот факт, что слово "хуй" оказалось, в рамкахданного исследования, смешнее слова "жопа", что противоречит мнению,например, Ю.Олеши ("Я никогда не видел ничего смешнее, чем слово "жопа",написанное печатными буквами"). Возможно, Юрий Карлович не видел хуя,написанного таким же образом.Слово "Поручик" вошло в модель, а слово "Ржевский" - нет. Это связанос высокой взаимной встречаемостью этих слов (т.е. их коллинеарностью),и тем, что иногда герои анекдотов употребляют обращения типа: "Скажите,поручик..."Ни Клинтон, ни ЕБН отдельно не вошли в список предикторов, но понятие"импичмент" вошло. На наш взгляд, это подтверждает ранее высказаннуюПелевиным догадку о приоритете функции Президента над его личностью.Интересно, что из исследованных дополнительных переменных в модель вошлитолько немногие. Например, употребление в анекдоте двух хуев заметноповышает его успех, а третий, четвертый и т.д. хуи оказываются лишними,т.е. снижают шансы на успех. Обращает на себя внимание несколько загадочноечисло 6 (матерных слов) - 5 или 7 не имеют такого эффекта.Кластерный анализ позволил также выделить два довольно сильно разделенныхкласса анекдотов: в один входят понятия Windows95, "программист" и дваслова "хуй" (обычно в словосочетании "на хуй"), в другой - прочие понятияи их комбинации.Оптимальный анекдот для данной таргет-группы должен звучать примерно так:"Приходит поручик Ржевский на прием к гинекологу. А тот сидит не отрываясьперед монитором с Windows и говорит: на хуй, на хуй"ОГРАНИЧЕНИЯДанное исследование не затрагивает вопроса о более долгосрочном успехе.Так, лучший анекдот 1999 года за тот же период (("Знайте, пора остановиться,если...") включает только 2 понятия из нашего списка.

[[Текст истории из жизни::Господа, в том числе Дима Вернер!По роду деятельности я - биостатистик (то же самое, что матстатистик,только работаю в медицине). В свободное от работы время я провел анализсайта, основные результаты которого привожу ниже.МАТЕРИАЛЫ И МЕТОДЫПроизведен анализ оценок, выставленных анекдотам за период январь-март1999 года. Каждому анекдоту приписана переменная "ранг", равная месту,занятому анекдотом в день, когда он был рассказан (все места исследованыне в тот же день, а в период с 15 по 30 апреля, т.е. когда оценка вышлана плато). В качестве независимых переменных выбраны _слова_ (лексическиеединицы) и _понятия_ (логические единицы). Каждый анекдот принимаетпо каждой из переменных значение 1 или 0 (есть в анекдоте или нет данное_слово_ или _понятие_. Кроме того, были созданы некоторые дополнительныепеременные, функции от основных (см. дальше) Расчеты проводились по моделилинейной регрессии с учетом взаимодействий между переменными. Например,совместное употребление слова X и понятия Y может быть новой переменной.РЕЗУЛЬТАТЫВыделена группа наиболее сильных предикторов, т.е. слов и/или понятий,положительно связанных с успехом анекдота, т.е. с его рангом (местомв данный день). В следующей таблице эти переменные приведены вместес величиной R квадрат, характеризующей, какую часть успеха (грубо говоря,в процентах или в долях единицы) объясняет предиктор.слово "хуй" 0.15понятие "гинекология" 0.14слово "поручик" 0.12понятие "Windows 95" 0.11слово "жопа" 0.11понятие "импичмент" 0.08понятие "программист" 0.08более одного слова "хуй" 0.06более 6 матерных слов 0.06слово "девушка" 0.05Остальные слова и понятия не достигли статистически значимого уровня.ОБСУЖДЕНИЕОбращает на себя внимание тот факт, что слово "хуй" оказалось, в рамкахданного исследования, смешнее слова "жопа", что противоречит мнению,например, Ю.Олеши ("Я никогда не видел ничего смешнее, чем слово "жопа",написанное печатными буквами"). Возможно, Юрий Карлович не видел хуя,написанного таким же образом.Слово "Поручик" вошло в модель, а слово "Ржевский" - нет. Это связанос высокой взаимной встречаемостью этих слов (т.е. их коллинеарностью),и тем, что иногда герои анекдотов употребляют обращения типа: "Скажите,поручик..."Ни Клинтон, ни ЕБН отдельно не вошли в список предикторов, но понятие"импичмент" вошло. На наш взгляд, это подтверждает ранее высказаннуюПелевиным догадку о приоритете функции Президента над его личностью.Интересно, что из исследованных дополнительных переменных в модель вошлитолько немногие. Например, употребление в анекдоте двух хуев заметноповышает его успех, а третий, четвертый и т.д. хуи оказываются лишними,т.е. снижают шансы на успех. Обращает на себя внимание несколько загадочноечисло 6 (матерных слов) - 5 или 7 не имеют такого эффекта.Кластерный анализ позволил также выделить два довольно сильно разделенныхкласса анекдотов: в один входят понятия Windows95, "программист" и дваслова "хуй" (обычно в словосочетании "на хуй"), в другой - прочие понятияи их комбинации.Оптимальный анекдот для данной таргет-группы должен звучать примерно так:"Приходит поручик Ржевский на прием к гинекологу. А тот сидит не отрываясьперед монитором с Windows и говорит: на хуй, на хуй"ОГРАНИЧЕНИЯДанное исследование не затрагивает вопроса о более долгосрочном успехе.Так, лучший анекдот 1999 года за тот же период (("Знайте, пора остановиться,если...") включает только 2 понятия из нашего списка.]]

См.также

Внешние ссылки