Русская Википедия:ImageNet

Материал из Онлайн справочника
Перейти к навигацииПерейти к поиску

База данных ImageNet — проект по созданию и сопровождению массивной базы данных аннотированных изображений, предназначенная для отработки и тестирования методов распознавания образов и машинного зрения. По состоянию на 2016 год в базу данных было записано около десяти миллионов URL с изображениями, которые прошли ручную аннотацию для ImageNet, в аннотациях перечислялись объекты, попавшие на изображение, и прямоугольники с их координатами.[1] База данных с аннотацией и URL изображений от третьих лиц доступна непосредственно через ImageNet, но при этом сами изображения не принадлежат проекту[2]. С 2010 года ведётся проект ILSVRC (Шаблон:Lang-en — Кампания по широкомасштабному распознаванию образов в ImageNet), в рамках которого различные программные продукты ежегодно соревнуются в классификации и распознавании объектов и сцен в базе данных ImageNet.

Состав базы данных

ImageNet использует краудсорсинг для аннотирования изображений.

Аннотации на уровне самих изображений показывают наличие или отсутствие объекта данного класса (например, «на картинке имеется тигр» или «на картинке нет тигров»). На уровне объекта в аннотацию включается прямоугольник с координатами видимой части объекта. ImageNet использует вариант семантической сети WordNet для категоризации объектов, которая достаточно детализирована, например, породы собак представлены 120 классами. Каждому узлу сети WordNet сопоставлены сотни или тысячи изображений, но в среднем на 2016 год — около 500 изображений[3].

На август 2017 года в ImageNet Шаблон:Val изображения, разбитых на Шаблон:Val категорию.

Кампания ImageNet

С 2010 года в рамках проекта ILSVRC проводятся соревнования между исследовательскими группами по классификации объектов. ILSVCR возникла по аналогии с небольшой кампанией 2005 года PASCAL VOC, которая располагала набором из 20 тысяч изображений и 20 классов объектов[3]. Существенный прогресс в распознавании образов был достигнут в 2010 году. В 2011 году хорошим результатом считалась ошибка классификации 25 %. В 2012 году система глубокого обучения на основе свёрточной нейронной сети смогла достичь 16 % ошибки; а в следующие годы ошибка упала до нескольких процентов[4]. В 2015 году исследователи констатировали, что программы в определённых задачах проекта ILSVRC превзошли человеческие способности[5]. Однако, как указывала Ольга Руссаковская, одна из организаторов кампании, программы пока должны определять объекты для одной из тысячи категорий, а люди могут распознать большее количество категорий и (в отличие от программ) могут ещё и обозначить контекст изображений[6].

В 2014 году к кампании подключилось более 50 организаций[3]. В 2015 году исследователей из проекта Baidu дисквалифицировали на год, потому что они вошли в проект под несколькими разными именами, чтобы обойти ограничения по двум поставкам в неделю[7][8]. Позднее Baidu заявило, что руководитель группы был уволен, и что будет собрана специальная научно-консультативная группа[9].

См. также

Примечания

Шаблон:Reflist

Ссылки

  1. Шаблон:Cite web
  2. Шаблон:Cite web
  3. 3,0 3,1 3,2 Olga Russakovsky*, Jia Deng*, Hao Su, Jonathan Krause, Sanjeev Satheesh, Sean Ma, Zhiheng Huang, Andrej Karpathy, Aditya Khosla, Michael Bernstein, Alexander C. Berg and Li Fei-Fei. (* = equal contribution) ImageNet Large Scale Visual Recognition Challenge. IJCV, 2015.
  4. Шаблон:Cite news
  5. Шаблон:Cite news
  6. Шаблон:Cite news
  7. Шаблон:Cite news
  8. Шаблон:Cite news
  9. Шаблон:Cite news