Русская Википедия:Google (поисковая система)

Материал из Онлайн справочника
Перейти к навигацииПерейти к поиску

Шаблон:О Шаблон:Другие значения Шаблон:Сайт Google (МФА Шаблон:МФА2[1][2]) — крупнейшая в мире поисковая система интернета, принадлежащая корпорации Google Inc.. Основана в 1998 году Ларри Пейджем и Сергеем Брином.

Первая по популярности система (77,05 %[3]), обрабатывает 41 млрд 345 млн запросов в месяц (доля рынка 62,4 %[4][5][6]), индексирует более 25 миллиардов веб-страниц[7] (на закрытой конференции в начале мая 2014[8] представитель Google упомянул, что на данный момент проиндексировано 60 триллионов документов, и как можно заметить в результате тестов, счётчик в поиске Google ограничен числом 25 270 000 000, также на это число при выдаче влияют фильтры, встроенные в алгоритм ранжирования выдачи). Поддерживает поиск в документах форматов PDF, RTF, PostScript, Microsoft Word, Microsoft Excel, Microsoft PowerPoint и других.

История создания

Шаблон:Main Поисковая система Google была создана в качестве учебного проекта студентов Стэнфордского университета Ларри Пейджа и Сергея Брина. Они в 1996 году работали над поисковой системой BackRub, а в 1998 году на её основе создали новую поисковую систему Google. С первого же года существования в Google стали применять метод прозрачного управления OKR, который определил подход к планированию развития компании и способ корпоративного управления.

Хотя корпорация была основана 2 сентября 1998 года, а домен Google.com зарегистрирован 15 сентября 1997 года, поисковик (с 2000 года) иногда отмечает свой день рождения и в другой день: как 7, так и 27 сентября[9][10].

Слово Google произошло от искажённого googol (гугол) — названия числа десять в сотой степени (10100)[11][12][13].

Индексация сайтов

Поисковый робот Google имеет User Agent — Googlebot (Поисковый робот), который является основным роботом, сканирующим содержание страницы для поискового индекса. Помимо него существуют ещё несколько специализированных роботов:

  • Googlebot-Mobile — робот, индексирующий сайты для мобильных устройств, ноутбуков
  • Google Search Appliance (Google) gsa-crawler[14] — поисковый робот нового аппаратно-программного комплекса Search Appliance,
  • Googlebot-Image — робот, сканирующий страницы для индекса картинок,
  • Mediapartners-Google — робот, сканирующий контент страницы для определения содержания AdSense,
  • Adsbot-Google — робот, сканирующий контент для оценки качества целевых страниц Ads.

Также эти роботы помогают определить страницы низкого качества. Критерии определения низкокачественных страниц:

  • Уникальность контента
  • Поведение пользователя
  • Ссылки на страницу
  • Интуитивно понятный и удобный дизайн

Проблемы с авторскими правами

KaZaA и Церковь саентологии использовали Закон об авторском праве в цифровую эпоху (DMCA), чтобы потребовать от Google удалить ссылки на материалы на их сайтах, якобы защищённые авторским правом[15][16]. Google по закону обязан удалить эти ссылки, но вместо того, чтобы убрать результаты поиска, предпочитает связать результаты с жалобами, которые подали эти организации[16].

The New York Times жаловалась на то, что кэширование их содержания поисковым роботом — особенность, используемая поисковиками, в том числе Google Web Search, нарушает авторские права[17]. Google соблюдает стандартные Интернет-приёмы для запросов об отключении кэширования посредством файла robots.txt — стандартного механизма, позволяющего администраторам веб-сайта потребовать исключения своего сайта или его части из результатов поиска — или через мета-теги, позволяющие редактору контента указать, можно ли индексировать или архивировать документ и можно ли проходить по ссылкам в документе. Окружной суд США штата Невада постановил, что кэши компании Google не нарушают авторских прав согласно американскому законодательству в делах Field vs Google и Parker vs Google[18][19].

Проблемы с неприкосновенностью личной жизни

Впервые у Google начались проблемы в связи с нарушением прав человека ещё в 2005 году. При создании карт Google Earth были использованы изображения крыши американского Белого дома, что представляет угрозу для национальной безопасности Соединённых Штатов. Американская общественность была глубоко возмущена тем, что потенциальные террористы впервые получили шанс детально рассмотреть системы защиты Белого дома, расположенные на крыше[20].

В 2008 году американская семья Боринг из штата Пенсильвания обвинила компанию Google в нарушении неприкосновенности их частной жизни. При создании общемировых городских виртуальных карт Google Street View были использованы изображения дома и бассейна супружеской четы. Боринги незамедлительно подали в суд и потребовали от Google 25 000 долларов в качестве компенсации за причинённый моральный ущерб. Однако по решению суда в 2010 году они получили от компании компенсацию в размере всего лишь 1 доллар[21].

Против Google также выступил Американский Национальный Юридический и Политический Центр (NLPC). В качестве доказательства нарушения сервисом частных прав члены центра предоставили информацию об одном из руководителей Google, собранную при помощи сервисов компании менее чем за полчаса — изображения его дома, номера машин, припаркованных возле него, название фирмы, занимающейся благоустройством его территории и даже название охранной фирмы, клиентами которой являются его соседи[22].

Кроме того, в 2010 году стало известно, что во время работы над сервисом Street View компания Google сканировала IP адреса и пароли граждан. Во время съёмок улиц и площадей разных городов со специальных автомобилей, оборудованных видеокамерами, специалисты Google также занимались сканированием сигнала беспроводных сетей Wi-Fi. В результате компания получила пароли и другую информацию конфиденциального характера, необходимую для входа в электронную почту частных и юридических лиц[23].

В настоящее время компанию Google серьёзно критикуют за нарушения прав человека, связанные с реализацией проекта Google Glass. Ношение очков Google уже запрещено в американских кинотеатрах, казино и стрип-клубах. Их владельцы опасаются, что посетители в таких очках будут записывать происходящее на видео. Кроме того, решение о запрете очков в скором времени могут принять американские банки и дирекции парков[24].

Проблемы, связанные с нечестной конкуренцией

В феврале 2022 года шведский сервис сравнения цен PriceRunner подал на компанию в суд, обвинив ее в нарушении закона о конкуренции. Якобы компания отдавала предпочтение своему сервису по поиску товаров в Интернете [25]. Сумма иска составляет 2,1 миллиарда евро.

Выдача данных пользователей

В 2012 году Google выдала властям США данные нескольких работников WikiLeaks: содержание почтовых отправлений, метаданные, информацию о подписках и другие данные и только через 2,7 года уведомила пользователей об этом[26][27][28].

Летом 2013 года благодаря бывшему сотруднику американских спецслужб Эдварду Сноудену стало известно о том, что американское правительство платило Google, Yahoo!, Microsoft и Facebook миллионы долларов за раскрытие информации об интернет-пользователях (в рамках программы PRISM). Расходы, согласно документам, были покрыты подразделением Агентства национальной безопасности, известным как Отдел по работе со специальными источниками[29]. В ответ на это главный юрист Google Дэвид Драммонд опубликовал в блоге компании открытое письмо, адресованное генпрокурору США и директору ФБР, в котором просил разрешить обнародовать в регулярном отчёте Transparency Report подробную информацию о правительственных запросах, в том числе о запросах, основанных на Законе о надзоре за деятельностью иностранных спецслужб (FISA). По утверждению Драммонда, ответы на эти запросы не обеспечивали правительству США прямого доступа к данным пользователей[30].

Защита прав человека

Некоторые специалисты Google приняли участие в событиях Арабской весны, выступая за «демократические ценности и защиту прав человека». Так, директор по маркетингу Google на Ближнем Востоке и в Северной Африке Ваиль Гоним выступал за свержение режима Хосни Мубарака в Египте во время беспорядков в стране в 2011 году. Он создал страницу в социальной сети Facebook, где осуждалось насилие над гражданами Египта со стороны правящей власти и происходила координация действий демонстрантов. Гоним охарактеризовал египетское протестное движение как «Facebook revolution» и отметил, что интернет играл в ней чрезвычайно важную роль[31].

Кроме того, вскоре после событий Арабской весны представители Google заявили, что они работают над облегчением доступа к информации и продуктам компании на Ближнем Востоке и в Северной Африке. В этой связи целью американской компании является обеспечение доступа к ещё большему числу своих продуктов на арабском языке. За 2011 год компания запустила версию Google Voice и Google+ на арабском и представила в Art Project два музея, расположенных в Катаре (Музей исламского искусства и Арабский музей современного искусства Матхаф), а в 2012 году пригласила президента Туниса выступить посредством сервиса видеовещания Google+ Hangout On Air[32]. У компании Google есть также серьёзные претензии к руководству Китая в связи с попытками ограничить доступ китайских граждан к информации в интернете.

25 мая 2021 года компания анонсировала новую возможность поставить пароль на историю действий на сайтах, в приложениях и сервисах Google, поисковые запросы, историю просмотров YouTube и вопросы «Google Ассистенту»[33].

Алгоритм ранжирования

С июля 2022 года Google стал вести историю официальных апдейтов поискового алгоритма на соответствующей странице в разделе справочной документации Google Search Central. Список не полный, он начинается с января 2020 года. Информацию об остальных апдейтах поискового алгоритма можно получить из записей в официальном блоге Google.

Метатег Keywords не учитывается при ранжировании сайтов[34].

PageRank

Шаблон:Main

Файл:PageRanks-Example.svg
Иллюстрация алгоритма PageRank

Google использует алгоритм расчёта авторитетности PageRank. PageRank является одним из вспомогательных факторов при ранжировании сайтов в результатах поиска. PageRank не единственный, но очень важный способ определения положения сайта в результатах поиска Google. Основная идея — чем больше ссылок на страницу, тем она важнее и соответственно попадает в число первых результатов поиска.Шаблон:MainGoogle учитывает персональные данные пользователей для выдачи только тех результатов, которые ему нужны. Это явление имеет негативные стороны, например, если пользователь критикует президента в социальных сетях, то на запрос о гражданском мнении о президенте он получит только результаты с негативными характеристиками последнего, вообще на любой запрос пользователь будет получать не противоречащую его мнению информацию, что разумеется не очень хорошо влияет на его гражданское мнение. Илай Парайзер назвал это пузырём фильтров.

Сейчас в Google возможна функция отключения просмотра персональных результатов при просмотре сайтов.

Поисковые запросы

Синтаксис запросов

Интерфейс Google содержит довольно сложный язык запросов (поисковые операторы), позволяющий ограничить область поиска отдельными доменами, языками, типами файлов и т. д. Например, поиск «intitle:Google site:wikipedia.org» выведет все статьи Википедии на всех языках, в заголовке которых встречается слово Google[35][36][37][38][39].

Мощный язык запросов в руках взломщиков может быть использован для исследования веб-сайтов на уязвимости[40].

Поиск по картинкам

Поисковая система Google предоставляет возможность осуществлять поиск в Интернете, используя в качестве запросов графические изображения. Поиск выполняется через страницу images.google.com.

В феврале 2018 года Google отключил функцию полноразмерного просмотра картинок. Теперь для просмотра нужно перейти непосредственно на сайт[41].

Поиск в найденном

Для результатов поиска Google ранее предоставлял возможность повторного поиска, что позволяло производить поиск более детально. Для более детального поиска пользователям необходимо было указывать дополнительные параметры, по которым происходил отбор результатов, что позволяло сразу отобразить не только запрос, но и контекст, где он применяется. Данная возможность упрощала процедуру поиска, исключив необходимость в открытии каждого результата.

Википоиск

Поисковая технология, позволяющая пользователю настраивать результаты выдачи по поисковым запросам. Пользователь может удалять результаты из списка и поднимать вверх списка. Технология была запущена компанией Google весной 2009 года и проработала до осени. В настройках поиска осталась настройка для включения «википоиска», но в выдаче соответствующие элементы управления отсутствуют. Другие поисковые системы подобной функциональности пока не предоставляли.

Голосовой поиск

22 сентября 2010 года компания запустила голосовой поиск в России[42]. Чтобы осуществить поиск, необходимо нажать в телефоне кнопку рядом со строкой поиска и произнести свой запрос, телефон отправит ваш голос на сервер, и браузер выдаст строку с распознанным вашим запросом и результатами поиска по нему. С 2014 года доступна активация голосового поиска без прикосновения к экрану. На телефонах с установленным Android не ниже версии 4.3 достаточно сказать «окей, Гугл», чтобы активировать функцию[43].

Поиск по вакансиям

13 марта 2019 года Google запустила в России сервис Google Jobs — агрегатор вакансий в поисковой выдаче. Пользователи увидят вакансии в отдельном окне в поисковой выдаче после соответствующего запроса. Поисковик также предлагает фильтры по городу, дате публикации объявления, типу занятости и компаниям. Пользователи также смогут сохранять вакансии, видеть их на карте и получать уведомления[44].

Поиск в соцсетях

24 июня 2023 года Google запустила альтернативную поисковую ленту «Perspectives», которая призвана представлять различные точки зрения, основываясь на публикациях реальных пользователей социальных платформ. Выдача службы включает короткие и длинные видео с TikTok и YouTube, публикации веб-сайтов, платформ Quora и Reddit. При разработке этой функции в компании руководствовались тем, что для людей более востребована информация от реальных лиц, чем от компаний или брендов. Впервые технология была продемонстрирована в мае на конференции Google I/O. Функция в настоящий момент внедряется для пользователей в США[45][46].

Логотип Google

Шаблон:Main Текущий официальный логотип Google действует с 1 сентября 2015 года. В отличие от прежнего логотипа, в новом используется шрифт без засечек, а также более мягкие цвета[47]. По случаю праздника или круглой даты какой-нибудь широко известной личности стандартный логотип Google у некоторых или, реже, у всех[48] региональных доменов может меняться на праздничный, имеющий определённую тематику, смысл, но в стиле Google (Шаблон:Lang-en)[49].

Искусственный интеллект

В апреле 2023 года NYT объявила, что Google планирует внедрить ИИ в свою поисковую систему, чтобы сделать результаты более персонализированными. Проект получил название Magi. Также ведётся работа над новой поисковой системой, но процесс пока только в самом начале[50]. В мае 2023 года на ежегодной конференции разработчиков I/O было объявлено, что Google начинает внедрение генеративного ИИ в поиск. Новый продукт будет называться Converse, и он позволит получать результаты по сложным запросам. Для получения доступа к нему нужно подать заявку в Google Labs. Тестирование продукта будет доступно в ближайшие недели, но пока в США и на английском языке[51].

Калькулятор

Калькулятор, встроенный в поисковый сервис Google, позволяет выполнять арифметические вычисления, перевод множества величин. Кроме того, с его помощью можно строить графики математических функций по их формулам, причём, наряду с двумерными графиками[52] возможно построение графиков некоторых поверхностей в трёхмерном пространстве[53].

Сленг «Гуглить»

Из-за популярности поисковой системы в английском языке появился неологизм to google или to Google (аналог в русском компьютерном сленге — гуглить), использующийся для обозначения поиска информации в Интернете с помощью Google. Именно с таким определением глагол занесён в наиболее авторитетные словари английского языка — Оксфордский словарь английского языка и Merriam-Webster[54], хотя в других источниках[55] приводятся примеры его использования для обозначения поиска вообще чего-либо в Интернете.

Первым, кто использовал слово как глагол, был сам Лэрри Пэйдж, 10 июля 1998 года подписавший одно из своих сообщений для списка рассылки: «Have fun and keep googling!»[56] Американское диалектическое сообщество назвало глагол «to google» словом десятилетия[57].

Опасаясь возможной утраты товарного знака, Google не одобряет использование глагола google, особенно когда подразумевается поиск в Интернете вообще[58]. Например, 23 февраля 2003 года компания направила письмо[59] «прекратить и воздерживаться» (Шаблон:Lang-en) Полу МакФедрису, основателю Word Spy — сайта, отслеживающего неологизмы[60]. Также, в своей статье в «Вашингтон пост», Фрэнк Арэнс обсуждал письмо, полученное от юристов Google, иллюстрирующее «правильное» и «неправильное» употребление глагола google[61]. В ответе на эту статью лексикографы словаря Merriam-Webster заметили, что записали глагол to google со строчно́й буквы, но для обозначения поисковой системы Google употребили заглавную букву (Шаблон:Lang-en — пользоваться Google для поиска информации в Интернете), впрочем, редакторы оксфордского словаря не стали сохранять обе «версии» для истории[62]. В 2006 году Google выпустил публичное заявление с требованием «использовать слова, образованные от Google, только когда речь идёт о Google Inc. или его сервисах»[63].

См. также

Шаблон:Кол

Примечания

Шаблон:Примечания

Ссылки

Шаблон:Родственные проекты

Шаблон:Google Шаблон:Поисковые машины

  1. Шаблон:Cite web
  2. Шаблон:Cite web
  3. Шаблон:Cite web
  4. Шаблон:Cite web
  5. «Яндекс» — девятый поисковик мира / Яндекс / Хабрахабр Шаблон:Webarchive
  6. Шаблон:Cite web
  7. Шаблон:Cite web
  8. Шаблон:Cite web
  9. Шаблон:Cite web
  10. Шаблон:Cite web
  11. Шаблон:Cite web
  12. QI: Quite Interesting facts about 100 Шаблон:Wayback // The Telegraph, 15 апреля 2009 года
  13. 10 things you might not know about misspellings Шаблон:Wayback // Chicago Tribune, 4 августа 2013 года
  14. Шаблон:Cite web
  15. Шаблон:Cite web
  16. 16,0 16,1 Шаблон:Cite web New York Times
  17. Шаблон:Cite web
  18. Case No. CV-S-04-0413-RCJ-LRL Шаблон:Wayback Шаблон:Webarchive United States District Court (District of Nevada). Filed on January 19, 2006
  19. Case No. 04-CV-3918 Шаблон:Wayback United States District Court (Eastern District of Pennsylvania). March 10, 2006
  20. Шаблон:Cite web
  21. Шаблон:Cite web
  22. Шаблон:Cite web
  23. Шаблон:Cite web
  24. В США запретили пользоваться очками дополнительной реальности в кафе Шаблон:Wayback Шаблон:Webarchive
  25. Шаблон:Cite web
  26. Шаблон:Cite web
  27. Шаблон:Cite web
  28. Шаблон:Cite web
  29. Шаблон:Cite web
  30. Шаблон:Cite web
  31. Шаблон:Cite web
  32. Шаблон:Cite web
  33. Шаблон:Cite web
  34. Шаблон:Cite web
  35. Шаблон:Cite web
  36. Шаблон:Cite web
  37. Шаблон:Cite web
  38. Описание операторов и встроенных функций расширенного поиска: общая страница Шаблон:Wayback; операторы и функции расширенного поиска Шаблон:Wayback; Advanced Operators Шаблон:Wayback (подробное описание операторов на английском); «шпаргалка» по языку поисковых запросов Google Шаблон:Wayback
  39. Шаблон:Cite web
  40. Шаблон:Cite web
  41. Шаблон:Cite web
  42. Шаблон:Cite news
  43. Шаблон:Cite web
  44. Шаблон:Cite web
  45. Шаблон:Cite web
  46. Шаблон:Cite web
  47. Шаблон:Cite web
  48. В Шаблон:Cite web указана географическая область, для которой меняется логотип, если меняется глобально — указано «Global».
  49. Шаблон:Cite web
  50. Шаблон:Cite web
  51. Шаблон:Cite web
  52. Двумерный график трёх функций, построенный одним запросом в Google
  53. Параболоид, построенный запросом в Google
  54. Шаблон:Cite web
  55. Шаблон:Cite web
  56. Шаблон:Cite web
  57. Шаблон:Cite web
  58. Шаблон:Cite web
  59. Шаблон:Cite web
  60. Duffy, Jonathan. Шаблон:Cite webШаблон:Ref-en Би-би-си, 20 июня 2003
  61. Frank Ahrens. Шаблон:Cite webШаблон:Ref-en Washington Post, 5 августа 2006
  62. Chris Noon. Шаблон:Cite webШаблон:Ref-en Forbes, 6 июля 2006
  63. Michael Krantz. Шаблон:Cite webШаблон:Ref-en The Official Google Blog, 25 октября 2006