Русская Википедия:Google Code Search
Шаблон:Distinguish Шаблон:Карточка сайта
Google Code Search — проект поисковой машины от Google Labs, индексировавшей исходные коды открытых программ, и позволявшей использовать в поисковых запросах регулярные выражения[1]. В виде бета-версии работал с 5 октября 2006 года по 15 января 2012 года[2]. Закрыт в связи с закрытием Google Labs.
Кроме поддержки регулярных выражений[1], имелась возможность более точного поиска с помощью специальных операторов. Среди них: lang: (указание языка программирования[1]), package: (имя проекта), license: (лицензия[1]) и file: (имя файла).
Индексировался код программ, хранившихся в различных форматах, включая tar.gz, tar.bz2, .tar, .zip, репозитории CVS и Subversion.
В ограниченном виде наработки Google Code Search продолжают использоваться для поиска в рамках кодов проекта Chromium, код которого расположен на сайте Google Code.[3]
Автором проекта, Russ Cox, была опубликована пара консольных утилит Cindex/Csearch, предоставляющая возможность индексирования и поиска по исходным кодам. Утилиты используют схожие с Google Code Search принципы, хотя не могут масштабироваться более чем на несколько десятков гигабайт исходников.[4]
Движок регулярных выражений
Сайт позволял использовать регулярные выражения в запросах и искал любые символы (в отличие от обычных поисковиков, которые игнорируют нетекстовые символы[5]). На момент создания такими возможностями не обладали другие поисковые системы. Это делало его похожим на программу grep, который выполняет поиск по огромной базе открытого исходного кода. Используется поиск на базе индекса триграмм и собственной реализации POSIX-совместимых регулярных выражений — RE2, написанной Russ Cox.[6] Исходные коды RE2 были открыты в марте 2010 .[7]
Google Code Search поддерживал POSIX-расширенный синтаксис регулярных выражений, за исключением обратных ссылок, сопоставления элементов и сортировки классов.[8]
Интересные факты
- Некоторое время в 2008 году результаты поиска Code Search могли интегрироваться в основную поисковую выдачу Google[9].
- Google code search использовался в комитете ISO при выборе имен некоторых новых функций в стандарте языка программирования Си (стандарт C11 от 2011 года)[10].
- Code Search применялся хакерами для поиска уязвимостей в программах[11][12][13]. Были найдены тысячи небезопасных фрагментов кода[14]
Примечания
Ссылки
- http://www.google.com/codesearch — Архивная копия страницы, ноябрь 2010 года.
- Cindex/Csearch — command-line file search tool, based on ideas from GCS (Russ Cox)
- Вариант Code Search для поиска по кодам проекта Chromium на Google Code
- Debian code search — сходный поиск по исходным кодам Debian
Шаблон:Нет источников Шаблон:Google
- ↑ 1,0 1,1 1,2 1,3 Шаблон:Cite web
- ↑ Google Shuts Ten Services Шаблон:Wayback // The Register, 2011-09-05
- ↑ Code search Шаблон:Wayback по проекту Chromium.
- ↑ Cindex/Csearch Шаблон:Wayback — command-line file search tool, based on ideas from GCS
- ↑ A Big Loss Шаблон:Wayback
- ↑ Шаблон:URL, Russ Cox, January 2012
- ↑ Шаблон:Cite web
- ↑ Google Code Search: FAQ // Google, архивная копия от 2008 года
- ↑ Шаблон:Cite news
- ↑ P.J. Plauger, Abandoning a Process Шаблон:Wayback, ISO/IEC JTC1 SC22 WG14 N1327: "while there are no occurances of quick_exit in a Google code search. "
- ↑ Шаблон:Книга
- ↑ Google Code Search gives security experts a sinking feeling Шаблон:Wayback // Dennis Fisher, Executive Editor, TechTarget, Oct 11, 2006
- ↑ Шаблон:Cite news
- ↑ insecurity stats via google codesearch Шаблон:Wayback Шаблон:Webarchive // Jose Blog