Русская Википедия:Облако тегов

Материал из Онлайн справочника
Перейти к навигацииПерейти к поиску

Файл:Web 2.0 Map.svg
Облако тегов ключевых понятий, относящихся к Веб 2.0

О́блако те́гов (облако слов, или взвешенный список, представленное(-ый) визуально) — это визуальное представление списка категорий (или тегов, также называемых метками, ярлыками, ключевыми словами и т. п.)Шаблон:Sfn Обычно используется для описания тегов (метаданных) на веб-сайтах или для представления неформатированного текста. Ключевые слова чаще всего представляют собой отдельные слова, и важность каждого ключевого слова обозначается размером шрифта или цветомШаблон:Переход. Такое представление удобно для быстрого восприятия наиболее известных терминов и для распределения терминов по популярности относительно друг другаШаблон:Переход. При использовании ключевых слов для упрощения навигации по веб-сайтам, термины снабжаются гиперссылками на понятия, которые подразумеваются под ключевыми словами. Тем не менее, облако не может быть единственным элементом навигации, а пользоваться текстовым поиском удобнее для поиска при наличии более конкретной информации об искомомШаблон:Sfn.

История

На языке визуального дизайна, облако тегов (или облако слов) это один из видов «взвешенного списка», обычно оно используется на географических картах для отображения относительного размера городов, с помощью размера шрифтов. Одним из первых примеров взвешенного списка английских ключевых слов является список «подсознательных файлов компьютера» в романе Дугласа Коупленда «Рабы Майкрософта» (1995). Список слов немецкого языка появился в 1992Шаблон:Sfn.

Особое визуальное представление и распространение термина «облако тегов» началось в первом десятилетии 21 века. Как особенность сайтов и блогов эры Веб 2.0, использовалось, в основном, для визуализации частотного распределения ключевых слов метаданных, описывающих содержание веб-сайта и помогающих в навигации.

Первые облака тегов на известных веб-сайтах появились на сайте сервиса хранения и распространения цифровых фотографий Flickr. Создателем облаков тегов был соучредитель и проектировщик Flickr Стюарт Баттерфилд в 2004. Эта реализация была основана на книге Джеймса Фланагана Search Referral ZeitgeistШаблон:Sfn, в котором описывается визуализация ссылок на веб-сайт. Примерно в то же время распространению облака тегов способствовали сайты Delicious и Technorati.

Перенасыщение облаками тегов и двоякие чувства в отношение их полезности как помощников в навигации по веб-сайтам привели к заметному снижению их использования на сайтах-первопроходцахШаблон:Sfn. (Создатели Flickr впоследствии «извинились» перед веб-сообществом в своей речи на премии Webby Awards, где они просто сказали «простите за облака тегов»Шаблон:Sfn.)

Второе поколение развития программного обеспечения выявило широкий круг применения облаков тегов как основных методов визуализации текстовых данных. Также были предложены некоторые расширения для этих элементов навигации. Например, параллельные облака теговШаблон:Sfn, sparkCloudsШаблон:Sfn, и префиксные облака теговШаблон:Sfn.

В данный момент облако тегов не имеет такой популярности, а в некоторых случаях даже негативно сказывается на поисковом продвижении сайта. Так что если и делать облако, то для некой конкретной цели, чтобы оно несло смысловую нагрузку для пользователей интернет ресурса.Шаблон:Нет АИ

Типы применения тегов

Файл:Word population tagcloud 2011.png
Облако данных показывает население всех стран мира. Создано с помощью языка программирования R с помощью пакета облако слов. Данные получены из списка, содержащего название стран и количество жителей. Обратите внимание, что относительные размеры Китая и Индии были разделены пополам.

Существует три основных типа применения облаков тегов в социальном программном обеспечении, различающихся скорее по назначению, чем по внешнему виду:

  • в первом типе есть тег для частоты каждого элемента,
  • во втором типе есть глобальные облака тегов, где частоты агрегированы по всем элементам и пользователям,
  • в третьем типе облако содержит категории, размер которых обозначает количество подкатегорий.

В первом типе облаков тегов размер представляет собой количество применений тега к элементуШаблон:Sfn. Это полезно в качестве способа отображения метаданных о предмете, за который сколько-то раз «проголосовали», и когда точные данные не предусмотрены. Примером такого применения является Last.fm (для определения жанра музыки группы) и LibraryThing (для определения ключевых слов книги).

Во втором типе размер соответствует числу предметов, к которым был применен тег, что обозначает популярность тега. Примеры данного типа облаков тегов можно найти на сайте сервиса хранения и распространения цифровых фотографий Flickr, RSS-агрегатора Technorati и введя в поисковый запрос Google DeeperWeb.

Категоризация путём создания кластера тегов

В третьем типе теги используются как способ категоризации элементов. Теги представлены в облаке, где бо́льшие теги представляют количество элементов в этой категории.

Есть несколько подходов для построения кластера тегов вместо облака тегов, например, применяя теги совместной встречаемости в документахШаблон:Sfn.

Более обще, то же самое визуальное представление может быть использовано для отображения не теговШаблон:Sfn например, облако тегов или облака данных.

Термин облако ключевых слов иногда используется как термин поисковый маркетинг, где он обозначает группы ключевых слов, относящихся к некоторому веб-сайту. В последние годы облака тегов стали популярны из-за своей значимости в поисковом маркетинге веб-страниц, наряду с помощью пользователям в эффективной навигации по сайтамШаблон:Sfn. Облака тегов, как средства навигации, позволяют связать ресурсы веб-сайта более тесноШаблон:Sfn,обход таких ресурсов поисковым роботом может улучшить позицию сайта в результатах выдачи поисковой системыШаблон:Sfn. С точки зрения пользовательского интерфейса облака тегов часто используются, чтобы помочь пользователю найти информацию в конкретной системе более быстро, обобщая результаты поискаШаблон:Sfn.

Визуальное представление

Файл:Top 500 by volume on the NYSE.png
Облако данных показывает изменение цены на акции. Цвет указывает на рост или падение цены, размер шрифта указывает на процентное изменение.

Облака тегов обычно представлены в виде встроенных HTML элементов. Теги могут быть распределены в алфавитном порядке, в случайном порядке, по весу, и т. д. Иногда изменяют прочие визуальные свойства, такие как цвет, яркость, или ширина, в дополнение к размеру шрифтаШаблон:Sfn. Наиболее распространено представление в виде прямоугольника, в котором теги упорядочены по алфавиту и выводятся построчно. Выбор расположения тега в строках соответствует целям пользователя. Иногда предпочтение отдается семантической кластеризации тегов (похожие по смыслу теги будут выводиться рядом)Шаблон:SfnШаблон:SfnШаблон:Sfn. Допускается применение эвристик для уменьшения размера облака тегов, независимо от того — выполняется кластеризация или нет.

Облако данных

Облако данных — это данные, в которых используется другой цвет и/или размер шрифта для обозначения числовых данныхШаблон:Sfn. Облака данных похожи на облака теговШаблон:Sfn, но вместо подсчета слов, выводятся такие данные, как плотность населения или цены на рынке ценных бумаг.

Облако текста

Файл:State of the union word clouds.png
Сравнение облаков текста речи Президента США Д. Буша и Президента США Б. ОбамыШаблон:Sfn.

Облако текста или облако слов — это визуализация частоты слов в тексте в виде взвешенного спискаШаблон:Sfn. В последнее время эта техника используется для визуализации тематического контента политических речейШаблон:Sfn.

Облака словосочетаний

Развивая принципы облаков текста, облака словосочетаний дают более сфокусированный вид текста или набора текстов. Вместо всего текста, облако словосочетаний фокусируется на использовании отдельных слов. Полученное облако содержит слова, которые часто используются в сочетании с исходным словом. Эти словосочетания представляют частоту, выделяемую размером шрифта, наряду с силой связи, выделяемой яркостью. Это позволяет интерактивно изучать языкШаблон:Sfn.

Особенности восприятия облаков тегов

Облака тегов изучались в нескольких исследованиях на предмет удобства использования. Следующий перечень основан на результатах исследований компании Lohmann и др.:

  • Размер тега: крупные теги привлекают больше внимания, чем маленькие теги (эффект зависим от таких свойств, как: количество символов, расположение, соседние теги).
  • Просмотр: пользователи обычно просматривают облако, а не читают его полностью.
  • Центрирование: теги в середине облака привлекают больше внимания, чем теги, расположенные по краям (эффект обусловлен особенностью расположения текста в облаке).
  • Позиционирование: верхний левый квадрант получает больше внимания, чем остальные (обусловлено чтением слева-направо).
  • Исследование: облака тегов помогают найти специфические теги (которые не выделены большим размером шрифта).

Создание облака тегов

В общем размер шрифта тега в облаке тегов обусловлен распространенностью тега. Для облака слов, например, категорий блога, частота соответствует количеству записей в блоге, которым присвоена данная категория. Для меньших частот можно указать размеры шрифта непосредственно, от единицы до максимально используемого размера шрифта. Для больших частот необходимо провести масштабирование. Например, используя линейное преобразование, вес <math>t_i</math> тега масштабируется по шкале множителей от of 1 до f, где <math>t_{min}</math> и <math>t_{max}</math> определяют диапазон разрешенных весов.

<math>s_i = \left \lceil \frac{f_{\mathrm{max}}\cdot(t_i - t_{\mathrm{min}})}{t_{\mathrm{max}}-t_{\mathrm{min}}} \right \rceil</math> для <math>t_i > t_{\mathrm{min}}</math>; иначе <math>s_{i}=1</math>

Файл:Wikipedia Wordle - Top 1000 vital article hits.png
Набор слов из списка 1000 избранных статей Википедии, упорядоченный по количеству просмотровШаблон:Sfn, доступный в галерее Wordle gallery.Шаблон:Sfn
  • <math>s_i</math>: размер шрифта
  • <math>f_{\mathrm{max}}</math>: максимальный размер шрифта
  • <math>t_i</math>: вес тега
  • <math>t_{\mathrm{min}}</math>: минимальный вес
  • <math>t_{\mathrm{max}}</math>: максимальный вес

Так как число учтённых элементов на каждый тег обычно распределено по экспоненциальному закону распределенияШаблон:Sfn, поэтому для больших диапазонов значений имеет смысл использовать логарифмическое представлениеШаблон:Sfn.

Реализация облака тегов также включает синтаксический анализ фильтрацию ненужных тегов, таких как предлоги, местоимения, чи́сла и знаки препинания.

Также существуют веб-сайты, которые создают искусственные или случайно распределённые облака тегов для рекламы или с юмористической целью.

См. также

Примечания

Шаблон:Примечания

Литература

Ссылки