Русская Википедия:База данных

REDIRECT БД

Ба́за да́нных — совокупность данных, хранимых в соответствии со схемой данных, манипулирование которыми выполняют в соответствии с правилами средств моделирования данных^[1]^[2]^[3].

Многие специалисты указывают на распространённую ошибку, состоящую в некорректном использовании термина «база данных» вместо термина «система управления базами данных», и указывают на необходимость различения этих понятий^[4].

Проблемы определения

В литературе предлагается множество определений понятия «база данных», отражающих скорее субъективное мнение тех или иных авторов, однако общепризнанная единая формулировка отсутствует.

Определения из нормативных документов, в том числе стандартов:

База данных — представленная в объективной форме совокупность самостоятельных материалов (статей, расчётов, нормативных актов, судебных решений и иных подобных материалов), систематизированных таким образом, чтобы эти материалы могли быть найдены и обработаны с помощью электронной вычислительной машины (ЭВМ)^[5]
База данных — совокупность данных, организованных в соответствии с концептуальной структурой, описывающей характеристики этих данных и взаимоотношения между ними, которая поддерживает одну или более областей применения^[6].

Определения из авторитетных монографий:

База данных — организованная в соответствии с определёнными правилами и поддерживаемая в памяти компьютера совокупность данных, характеризующая актуальное состояние некоторой предметной области и используемая для удовлетворения информационных потребностей пользователейШаблон:Sfn.
База данных — некоторый набор перманентных (постоянно хранимых) данных, используемых прикладными программными системами какого-либо предприятияШаблон:Sfn.
База данных — совместно используемый набор логически связанных данных (и описание этих данных), предназначенный для удовлетворения информационных потребностей организацииШаблон:Sfn.

В определениях наиболее часто (явно или неявно) присутствуют следующие отличительные признаки^[7]:

БД хранится и обрабатывается в вычислительной системе.
Таким образом, любые внекомпьютерные хранилища информации (архивы, библиотеки, картотеки и т. п.) базами данных не являются.
Данные в БД логически структурированы (систематизированы) с целью обеспечения возможности их эффективного поиска и обработки в вычислительной системе.
Структурированность подразумевает явное выделение составных частей (элементов), связей между ними, а также типизацию элементов и связей, при которой с типом элемента (связи) соотносится определённая семантика и допустимые операции^[8].
БД включает схему, или метаданные, описывающие логическую структуру БД в формальном виде (в соответствии с некоторой метамоделью).
В соответствии с ГОСТ Р ИСО МЭК ТО 10032-2007, «постоянные данные в среде базы данных включают в себя схему и базу данных. Схема включает в себя описания содержания, структуры и ограничений целостности, используемые для создания и поддержки базы данных. База данных включает в себя набор постоянных данных, определённых с помощью схемы. Система управления данными использует определения данных в схеме для обеспечения доступа и управления доступом к данным в базе данных»^[1].

Из перечисленных признаков только первый является строгим, а другие допускают различные трактовки и различные степени оценки. Можно лишь установить некоторую степень соответствия требованиям к БД.

В такой ситуации не последнюю роль играет общепринятая практика. В соответствии с ней, например, не называют базами данных файловые архивы, Интернет-порталы или электронные таблицы, несмотря на то, что они в некоторой степени обладают признаками БД. Принято считать, что эта степень в большинстве случаев недостаточна (хотя могут быть исключения).

История

История возникновения и развития технологий баз данных может рассматриваться как в широком, так и в узком аспекте.

В широком смысле понятие истории баз данных обобщается до истории любых средств, с помощью которых человечество хранило и обрабатывало данные. В таком контексте упоминаются, например, средства учёта царской казны и налогов в древнем Шумере (4-e тысячелетие до н.э.)^[9], узелковая письменность инков — кипу, клинописи, содержащие документы Ассирийского царства и т. п. Следует помнить, что недостатком этого подхода является размывание понятия «база данных» и фактическое его слияние с понятиями «архив» и даже «письменность».

История баз данных в узком смысле рассматривает базы данных в традиционном (современном) понимании. Эта история начинается с 1955 года, когда появилось программируемое оборудование обработки записей. Программное обеспечение этого времени поддерживало модель обработки записей на основе файлов. Для хранения данных использовались перфокарты^[9].

Оперативные сетевые базы данных появились в середине 1960-х. Операции над оперативными базами данных обрабатывались в интерактивном режиме с помощью терминалов. Простые индексно-последовательные организации записей быстро развились к более мощной модели записей, ориентированной на наборы. За руководство работой Data Base Task Group (DBTG), разработавшей стандартный язык описания данных и манипулирования данными, Чарльз Бахман получил Тьюринговскую премию.

В это же время в сообществе баз данных Кобол была проработана концепция схем баз данных и концепция независимости данных.

Следующий важный этап связан с появлением в начале 1970-х реляционной модели данных, благодаря работам Эдгара Кодда. Работы Кодда открыли путь к тесной связи прикладной технологии баз данных с математикой и логикой. За свой вклад в теорию и практику Эдгар Ф. Кодд также получил премию Тьюринга.

Сам термин база данных (Шаблон:Lang-en) появился в начале 1960-х годов, и был введён в употребление на симпозиумах, организованных компанией SDC в 1964 и 1965 годах, хотя понимался сначала в довольно узком смысле, в контексте систем искусственного интеллекта. В широкое употребление в современном понимании термин вошёл лишь в 1970-е годы^[10].

Виды баз данных

Существует огромное количество разновидностей баз данных, различающихся по различным критериям. Например, в «Энциклопедии технологий баз данных»^[11], по материалам которой написан данный раздел, определяются свыше 50 видов БД.

В классификацию по модели данных обычно включают:

Классификация по среде хранения различает базы данных, хранящие данные во вторичной памяти («традиционные», Шаблон:Lang-en), резидентные (все данные на стадии исполнения находятся в оперативной памяти) и третичные (Шаблон:Lang-en), хранящие данные на отсоединяемых устройствах массового хранения — на основе магнитных лент или оптических дисков. При этом во всех классах так или иначе используются все среды хранения, например, для резидентных баз данных СУБД записывает в постоянную память журналы предзаписи, а для традиционных баз используется кэш в оперативной памяти.

Также базы данных могут классифицироваться по содержимому, например, могут быть географическими, историческими, научными, мультимедийными. Для некоторых форм содержания строятся специализированные СУБД, либо добавляются специализированные возможности в СУБД общего назначения, среди таковых баз данных:

пространственные (Шаблон:Lang-en): базы с пространственными свойствами сущностей предметной области, используются в геоинформационных системах;
временны́е (темпоральные, Шаблон:Lang-en): поддерживают какой-либо аспект времени, не считая времени, определяемого пользователем.

По степени распределённости базы данных подразделяются на следующие классы:

централизованные (сосредоточенные; Шаблон:Lang-en) — полностью поддерживаемые на одном компьютере
распределённые (Шаблон:Lang-en), составные части котороых размещаются в различных узлах компьютерной сети в соответствии с каким-либо критерием.

Среди распределённых баз данных выделяют:

сегментированные: разделённые на независимые сегменты, каждый из которых управляется отдельным экземпляром сервера базы данных, размещаемым, как правило, на отдельном вычислительном узле;
тиражированные (реплицированные; Шаблон:Lang-en): одни и те же данные разнесены под управление различных экземпляров СУБД;
неоднородные (Шаблон:Lang-en): фрагменты распределённой базы в разных узлах сети поддерживаются средствами более одной СУБД.

Возможны смешанные варианты, например, для одной и той же распределённой базы для больших объектов используется сегментирование, а для небольших — репликация.

По способам организации хранения могут выделяться циклические базы данных (записывают новые данные вместо устаревших), потоковые базы данных.

Сверхбольшие базы данных

Сверхбольшая база данных (Шаблон:Lang-en) — это база данных, которая занимает чрезвычайно большой объём на устройстве физического хранения. Термин подразумевает максимально возможные объёмы БД, которые определяются последними достижениями в технологиях физического хранения данных и в технологиях программного оперирования данными.

Количественное определение понятия «чрезвычайно большой объём» меняется во времени. Так, в 1997 году самой большой в мире была текстовая база данных Knight Ridder’s DIALOG объёмом 7 терабайт^[12]. В 2001 году самой большой считалась база данных объёмом 10,5 терабайт, в 2003 году — объёмом 25 терабайт^[13]. В 2005 году самыми крупными в мире считались базы данных с объёмом хранилища порядка сотни терабайт^[14]. В 2006 году поисковая машина Google использовала базу данных объёмом 850 терабайт^[15].

К 2010 году считалось, что объём сверхбольшой базы данных должен измеряться по меньшей мере петабайтами^[14].

В 2011 году компания Facebook хранила данные в кластере из 2 тысяч узлов суммарной ёмкостью 21 петабайт^[16]; к концу 2012 года объём данных Facebook достиг 100 петабайт^[17], а в 2014 году — 300 петабайт^[18].

К 2014 году по косвенным оценкам компания Google хранила на своих серверах до 10—15 эксабайт данных в совокупности^[19].

По некоторым оценкам, к 2025 году генетики будут располагать данными о геномах от 100 миллионов до 2 миллиардов человек, и для хранения подобного объёма данных потребуется от 2 до 40 эксабайт^[20].

В целом, по оценкам компании IDC в 2018 году, суммарный объём данных «цифровой вселенной» удваивается каждые два года и изменится от 4,4 зеттабайта в 2013 году до 44 зеттабайт в 2020 году^[21].

Исследования в области хранения и обработки сверхбольших баз данных VLDB всегда находятся на острие теории и практики баз данных. В частности, с 1975 года проходит ежегодная конференция International Conference on Very Large Data Bases («Международная конференция по сверхбольшим базам данных»). Большинство исследований проводится под эгидой некоммерческой организации VLDB Endowment (Фонд целевого капитала «VLDB»), которая обеспечивает продвижение научных работ и обмен информацией в области сверхбольших БД и смежных областях.

См. также

Примечания

Шаблон:Примечания

Литература

Шаблон:Книга
Шаблон:Книга
Шаблон:Книга
Шаблон:Книга
Шаблон:Книга
Шаблон:БРЭ
Шаблон:Книга
Шаблон:Книга
Beynon-Davies P. (2004). Database Systems 3rd Edition. Palgrave, Basingstoke, UK. ISBN 1-4039-1601-2

Ссылки

CITForum — материалы на сайте Центра информационных технологий
Very Large Data Base — Endowment Inc.
ACM SIGMOD — Association for Computing Machinery: Special Interest Group On Management of Data.

Шаблон:ВС Шаблон:- Шаблон:Databases Шаблон:Хранилище данных

↑ ^1,0 ^1,1 Ошибка цитирования Неверный тег <ref>; для сносок ISO10032 не указан текст
↑ ГОСТ 33707-2016 (ISO/IEC 2382:2015) Информационные технологии (ИТ). Словарь
↑ Шаблон:Cite web
↑ Ошибка цитирования Неверный тег <ref>; для сносок confusing не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок codex не указан текст
↑ Шаблон:Cite web
↑ Ошибка цитирования Неверный тег <ref>; для сносок mir не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок struct не указан текст
↑ ^9,0 ^9,1 Ошибка цитирования Неверный тег <ref>; для сносок gray не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок Haigh не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок KogMR не указан текст
↑ Шаблон:Cite web
↑ Riedewald M., Agrawal D., Abbadi A. Dynamic Multidimensional Data Cubes for Interactive Analysis of Massive Datasets // In: Encyclopedia of Information Science and Technology, First Edition, Idea Group Inc., 2005. ISBN 9781591405535
↑ ^14,0 ^14,1 Ошибка цитирования Неверный тег <ref>; для сносок ibmrep не указан текст
↑ Alex Chitu. How Much Data Does Google Store? Шаблон:Wayback, 2006
↑ Шаблон:Статья
↑ Josh Constine. How Big Is Facebook’s Data? Шаблон:Wayback // TechCrunch, 23.08.2012
↑ Wiener, J., Bronson N. Facebook’s Top Open Data Problems Шаблон:Wayback, 22.10.2014
↑ Colin Carson. How Much Data Does Google Store? Шаблон:Wayback, 2014
↑ Ася Горина. Увеличивающийся объем генетических данных стал проблемой для науки Шаблон:Wayback
↑ Шаблон:Cite web

[ISO10032-1] 1,0 ^1,1 Ошибка цитирования Неверный тег <ref>; для сносок ISO10032 не указан текст

[2] ГОСТ 33707-2016 (ISO/IEC 2382:2015) Информационные технологии (ИТ). Словарь

[3] Шаблон:Cite web

[confusing-4] Ошибка цитирования Неверный тег <ref>; для сносок confusing не указан текст

[codex-5] Ошибка цитирования Неверный тег <ref>; для сносок codex не указан текст

[6] Шаблон:Cite web

[mir-7] Ошибка цитирования Неверный тег <ref>; для сносок mir не указан текст

[struct-8] Ошибка цитирования Неверный тег <ref>; для сносок struct не указан текст

[gray-9] 9,0 ^9,1 Ошибка цитирования Неверный тег <ref>; для сносок gray не указан текст

[Haigh-10] Ошибка цитирования Неверный тег <ref>; для сносок Haigh не указан текст

[KogMR-11] Ошибка цитирования Неверный тег <ref>; для сносок KogMR не указан текст

[12] Шаблон:Cite web

[13] Riedewald M., Agrawal D., Abbadi A. Dynamic Multidimensional Data Cubes for Interactive Analysis of Massive Datasets // In: Encyclopedia of Information Science and Technology, First Edition, Idea Group Inc., 2005. ISBN 9781591405535

[ibmrep-14] 14,0 ^14,1 Ошибка цитирования Неверный тег <ref>; для сносок ibmrep не указан текст

[15] Alex Chitu. How Much Data Does Google Store? Шаблон:Wayback, 2006

[16] Шаблон:Статья

[17] Josh Constine. How Big Is Facebook’s Data? Шаблон:Wayback // TechCrunch, 23.08.2012

[18] Wiener, J., Bronson N. Facebook’s Top Open Data Problems Шаблон:Wayback, 22.10.2014

[19] Colin Carson. How Much Data Does Google Store? Шаблон:Wayback, 2014

[20] Ася Горина. Увеличивающийся объем генетических данных стал проблемой для науки Шаблон:Wayback

[21] Шаблон:Cite web

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

Партнерские ресурсы
Криптовалюты	Обмен криптовалют - www.bestchange.ru Криптовалютная биржа CoinEx Криптовалютная биржа Binance HIVE OS - операционная система для майнинга e4pool - Мультивалютный пул для майнинга.
Магазины	AliExpress — глобальная виртуальная (в Интернете) торговая площадка, предоставляющая возможность покупать товары производителей из КНР; computeruniverse.net - Интернет-магазин компьютеров(Промо код 5 Евро на первую покупку:FWWC3ZKQ);
Хостинг	DigitalOcean - американский провайдер облачных инфраструктур, с главным офисом в Нью-Йорке и с центрами обработки данных по всему миру;
Разное	Викиум - Онлайн-тренажер для мозга Like Центр - Центр поддержки и развития предпринимательства. Gamersbay - лучший магазин по бустингу для World of Warcraft. Ноотропы OmniMind N°1 - Усиливает мозговую активность. Повышает мотивацию. Улучшает память. Санкт-Петербургская школа телевидения - это федеральная сеть образовательных центров, которая имеет филиалы в 37 городах России. Lingualeo.com — интерактивный онлайн-сервис для изучения и практики английского языка в увлекательной игровой форме. Junyschool (Джунискул) – международная школа программирования и дизайна для детей и подростков от 5 до 17 лет, где ученики осваивают компьютерную грамотность, развивают алгоритмическое и креативное мышление, изучают основы программирования и компьютерной графики, создают собственные проекты: игры, сайты, программы, приложения, анимации, 3D-модели, монтируют видео. Умназия - Интерактивные онлайн-курсы и тренажеры для развития мышления детей 6-13 лет SkillBox - это один из лидеров российского рынка онлайн-образования. Среди партнеров Skillbox ведущий разработчик сервисного дизайна AIC, медиа-компания Yoola, первое и самое крупное русскоязычное аналитическое агентство Tagline, онлайн-школа дизайна и иллюстрации Bang! Bang! Education, оператор PR-рынка PACO, студия рисования Draw&Go, агентство performance-маркетинга Ingate, scrum-студия Sibirix, имидж-лаборатория Персона. «Нетология» — это университет по подготовке и дополнительному обучению специалистов в области интернет-маркетинга, управления проектами и продуктами, дизайна, Data Science и разработки. В рамках Нетологии студенты получают ценные теоретические знания от лучших экспертов Рунета, выполняют практические задания на отработку полученных навыков, общаются с экспертами и единомышленниками. Познакомиться со всеми продуктами подробнее можно на сайте https://netology.ru, линейка курсов и профессий постоянно обновляется. StudyBay Brazil – это онлайн биржа для португалоговорящих студентов и авторов! Студент получает уникальную работу любого уровня сложности и больше свободного времени, в то время как у автора появляется дополнительный заработок и бесценный опыт. Автор24 — самая большая в России площадка по написанию учебных работ: контрольные и курсовые работы, дипломы, рефераты, решение задач, отчеты по практике, а так же любой другой вид работы. Сервис сотрудничает с более 70 000 авторов. Более 1 000 000 работ уже выполнено. StudyBay – это онлайн биржа для англоязычных студентов и авторов! Студент получает уникальную работу любого уровня сложности и больше свободного времени, в то время как у автора появляется дополнительный заработок и бесценный опыт.

Русская Википедия:База данных

Содержание

Проблемы определения

История

Виды баз данных

Сверхбольшие базы данных

См. также

Примечания

Литература

Ссылки

Навигация

Действия на странице

Действия на странице

Персональные инструменты

Навигация

Поиск

Инструменты