Подпишитесь на наши новости
Вернуться к началу с статьи up
 

БА́ЗА ДА́ННЫХ

  • рубрика
  • родственные статьи
  • image description

    В книжной версии

    Том 2. Москва, 2005, стр. 647-648

  • image description

    Скопировать библиографическую ссылку:




Авторы: А. Б. Антопольский

БА́ЗА ДА́ННЫХ, объ­ек­тив­ная фор­ма пред­став­ле­ния и ор­га­ни­за­ции со­во­куп­но­сти дан­ных (ста­тей и др.), сис­те­ма­ти­зи­ро­ван­ных та­ким об­ра­зом, что­бы эти дан­ные мог­ли быть най­де­ны и об­ра­бо­та­ны ЭВМ. Цен­траль­ным по­ня­ти­ем тео­рии Б. д. яв­ля­ет­ся мо­дель дан­ных (МД), под ко­то­рой по­ни­ма­ет­ся со­во­куп­ность пра­вил струк­ту­ри­ро­ва­ния дан­ных в Б. д., до­пус­ти­мых опе­ра­ций над ни­ми и ог­ра­ни­че­ний це­ло­ст­но­сти, ко­то­рым они долж­ны удов­ле­тво­рять. Це­ло­ст­ность Б. д. – свой­ст­во Б. д., оз­на­чаю­щее, что она со­дер­жит пол­ную и не­про­ти­во­ре­чи­вую ин­фор­ма­цию, не­об­хо­ди­мую для кор­рект­но­го функ­цио­ни­ро­ва­ния при­ло­же­ний.

Раз­ли­ча­ют осн. ти­пы МД: ие­рар­хи­че­ские, се­те­вые, ре­ля­ци­он­ные, объ­ект­ные.

Ие­рар­хи­че­ская МД пред­став­ля­ет со­бой дре­во­вид­ный граф (см. Гра­фов тео­рия), вер­ши­ны ко­то­ро­го со­сто­ят из за­пи­сей оп­ре­де­лён­ных ти­пов и свя­зей ме­ж­ду ни­ми, при­чём один тип за­пи­си оп­ре­де­ля­ет­ся как кор­не­вой, а ос­таль­ные свя­за­ны с ним или друг с дру­гом от­но­ше­ни­ем «один-ко-мно­гим». Ие­рар­хич. Б. д. – со­во­куп­ность та­ких дре­во­вид­ных гра­фов. Се­те­вая МД пред­став­ля­ет со­бой граф об­ще­го ви­да, вер­ши­на­ми ко­то­ро­го яв­ля­ют­ся дан­ные раз­ных ти­пов, про­стые (ато­мар­ные) или со­став­ные за­пи­си, а ду­га­ми – свя­зи ме­ж­ду эти­ми дан­ны­ми. За­пи­си – уча­ст­ни­ки свя­зей – со­еди­ня­ют­ся в спи­сок, ко­то­рый на­зы­ва­ет­ся на­бо­ром. Наи­бо­лее из­вест­ная вер­сия – МД CODASYL (Conference on Data System Languages – Кон­фе­рен­ция по язы­кам сис­тем об­ра­бот­ки дан­ных). Се­те­вая Б. д. со­сто­ит из на­бо­ра за­пи­сей и на­бо­ра свя­зей ме­ж­ду эти­ми за­пи­ся­ми. Ре­ля­ци­он­ная МД пред­став­ля­ет со­бой на­бор таб­лиц, на­зы­вае­мых от­но­ше­ния­ми. Т. к. в ре­ля­ци­он­ной МД мож­но ор­га­ни­зо­вать очень боль­шое чис­ло свя­зей, зна­чит. часть ко­то­рых из­бы­точ­на, то та­кая МД ус­та­нав­ли­ва­ет че­ты­ре фор­мы (ва­ри­ан­та) нор­ма­ли­за­ции от­но­ше­ний. От­но­ше­ния вклю­ча­ют ат­ри­бу­ты и кор­те­жи, со­став­ляю­щие со­от­вет­ст­вен­но столб­цы и стро­ки таб­ли­цы. Мно­же­ст­во зна­че­ний ат­ри­бу­тов на­зы­ва­ет­ся до­ме­ном. Ре­ля­ци­он­ная МД по­слу­жи­ла ос­но­вой стан­дар­та язы­ка ре­ля­ци­он­ной Б. д. SQL (Structured Query Language – Язык струк­ту­ри­ро­ван­ных за­про­сов). Объ­ект­ная МД ос­но­ва­на на по­ня­тии объ­ек­та, т. е. сущ­но­сти, об­ла­даю­щей со­стоя­ни­ем и по­ве­де­ни­ем. Со­стоя­ние объ­ек­та оп­ре­де­ля­ет­ся со­во­куп­но­стью его ат­ри­бу­тов, а по­ве­де­ние – со­во­куп­но­стью опе­ра­ций, до­пус­ти­мых для объ­ек­та. Ме­ж­ду объ­ек­та­ми ус­та­нав­ли­ва­ют­ся свя­зи. Объ­ек­ты ти­пи­зи­ру­ют­ся, при­чём обыч­но пре­ду­смат­ри­ва­ет­ся воз­мож­ность свя­зи ме­ж­ду ти­па­ми объ­ек­тов. Объ­ект­ная МД пред­став­ле­на в стан­дар­те ODMG (Object Database Management Group – Груп­па управ­ле­ния объ­ект­но-ори­ен­ти­ро­ван­ны­ми ба­за­ми дан­ных).

По при­ме­няе­мой МД раз­ли­ча­ют Б. д.: иерар­хи­че­ские, се­те­вые, ре­ля­ци­он­ные, объ­ект­ные, а так­же сме­шан­ные (объ­ект­но-ре­ля­ци­он­ные и т. п.). В кон. 1990-хгг. поя­вил­ся но­вый вид Б. д., пред­на­зна­чен­ный для хра­не­ния и об­ра­бот­ки XML-до­ку­мен­тов (XML-до­ку­мент пред­став­ля­ет со­бой обыч­ный тек­сто­вый файл, в ко­то­ром при по­мо­щи спец. мар­ке­ров соз­да­ют­ся эле­мен­ты дан­ных, по­сле­до­ва­тель­ность и вло­жен­ность ко­то­рых оп­ре­де­ля­ют струк­ту­ру до­ку­мен­та и его со­дер­жа­ние). По прин­ци­пу ор­га­ни­за­ции в те­ле­ком­му­ни­кац. сре­де раз­ли­ча­ют Б. д. ло­каль­ные, с се­те­вым дос­ту­пом, рас­пре­де­лён­ные, фраг­мен­ти­ро­ван­ные, цен­тра­ли­зо­ван­ные, ти­ра­жи­ро­ван­ные и мо­биль­ные; по спо­со­бу ото­бра­же­ния пред­мет­ной об­лас­ти вы­де­ля­ют Б. д. пред­мет­ные, ин­тег­ри­р., кон­цеп­ту­аль­ные, внеш­ние и внут­р.; по ха­рак­те­ру ис­поль­зо­ва­ния – встро­ен­ные (слу­жеб­ные) и об­ще­дос­туп­ные, пред­на­зна­чен­ные для внеш­него ис­поль­зо­ва­ния; по ре­жи­му до­сту­па – от­кры­тые и кон­фи­ден­ци­аль­ные. Б. д. ис­поль­зу­ют­ся в рам­ках бан­ков дан­ных.

Для соз­да­ния и ис­поль­зо­ва­ния Б. д. важ­ное зна­че­ние име­ет по­ня­тие «ме­та­дан­ные». Это све­де­ния о дан­ных, хра­ня­щих­ся в ба­зе, опи­сы­ваю­щие их струк­ту­ру, со­став, фор­мат пред­став­ле­ния, ме­то­ды дос­ту­па, пол­но­мо­чия поль­зо­ва­те­ля или ад­ми­ни­ст­ра­то­ра и др. Ме­та­дан­ные под­раз­де­ля­ют на сис­тем­ные и поль­зо­ва­тель­ские. Пер­вые пред­на­зна­че­ны для под­держ­ки сис­тем­ных функ­ций, сре­ди них осн. роль иг­ра­ют схе­мы Б. д. Вто­рые опи­сы­ва­ют свой­ст­ва дан­ных, пред­став­ляю­щие ин­те­рес для ко­неч­ных поль­зо­ва­те­лей, пре­ж­де все­го для по­ис­ка в Б. д. В со­став ме­та­дан­ных вхо­дят ин­фор­ма­ци­он­но-по­ис­ко­вые язы­ки, оп­ре­де­ляю­щие воз­мож­но­сти и ка­че­ст­во по­ис­ка в ба­зе дан­ных.

Осн. па­ра­мет­ра­ми Б. д. при­ня­то счи­тать её фи­зич. или ло­гич. объ­ё­мы. Фи­зич. объ­ём Б. д. вы­ра­жа­ет­ся в бай­тах и про­из­вод­ных ве­ли­чи­нах (ки­ло­бай­тах, ме­га­бай­тах и др.), ло­гич. объ­ём оп­ре­де­ля­ет­ся чис­лом за­пи­сей (объ­ек­тов, до­ку­мен­тов), пред­став­лен­ных в Б. д. Од­на­ко оба па­ра­мет­ра яв­ля­ют­ся не­стро­ги­ми, по­это­му срав­ни­вать по объ­ё­му мож­но толь­ко Б. д. с оди­на­ко­вой струк­ту­рой. Сред­ний объ­ём об­ще­дос­туп­ных Б. д. со­став­ля­ет ок. 1 млн. за­пи­сей, объ­ём од­ной за­пи­си для тек­сто­вых Б. д. варь­и­ру­ет­ся в пре­де­лах 200–2000 слов. Объ­ё­мы круп­ней­ших Б. д. со­став­ля­ют де­сят­ки те­ра­байт, или де­сят­ки млрд. за­пи­сей. Важ­ный по­ка­за­тель ка­че­ст­ва Б. д. и эф­фек­тив­но­сти вло­жен­ных в них средств – чис­ло поль­зо­ва­те­лей или за­про­сов к Б. д., од­на­ко этот по­ка­за­тель при­ме­ним толь­ко к об­ще­дос­туп­ным ба­зам дан­ных.

Тер­мин «Б. д.» вве­дён в 1963 на пер­вом сим­по­зиу­ме, по­свя­щён­ном про­бле­ме ор­га­ни­за­ции дан­ных, со­сто­яв­шем­ся в г. Сан­та-Мо­ни­ка (Ка­ли­фор­ния, США). Зна­чит. влия­ние на раз­ви­тие тех­но­ло­гий Б. д. ока­за­ли дос­ти­же­ния в смеж­ных об­лас­тях – опе­ра­ци­он­ных сис­те­мах, язы­ках и тех­но­ло­ги­ях про­грам­ми­ро­ва­ния. Фун­дам. раз­ра­бот­ка­ми пер­во­го перио­да ста­ли се­те­вая МД Ко­ми­те­та CODASYL (фак­ти­че­ски пер­вый стан­дарт в об­лас­ти Б. д.), ие­рар­хич. МД с язы­ком DL-1 (Data Language 1), раз­ра­бо­тан­ная ком­па­ни­ей IBM, и ре­ля­ци­он­ная МД Э. Код­да (он же ввёл са­мо по­ня­тие «мо­дель дан­ных»). В этот же пе­ри­од поя­ви­лись пер­вые ком­мерч. сис­те­мы управ­ле­ния ба­за­ми дан­ных (СУБД). В 1970-х гг. сфор­ми­ро­ва­лась нау­ка о Б. д., бы­ла раз­ра­бо­та­на тех­но­ло­гия Б. д., на­ча­лось ин­ду­ст­ри­аль­ное про­из-во СУБД. Соз­да­на тео­рия ре­ля­ци­он­ных Б. д. и ос­но­ван­ные на ней тех­но­ло­гии ре­ля­ци­он­ных СУБД, ко­то­рые с 1980-х гг. до­ми­ни­ру­ют на миро­вом рын­ке. Ком­мерч. СУБД это­го клас­са раз­ра­бо­та­ны для всех ап­па­рат­ных средств вы­чис­лит. тех­ни­ки, вклю­чая пер­со­наль­ные ком­пь­ю­те­ры. Пик раз­ра­бо­ток язы­ков про­грам­ми­ро­ва­ния Б. д. при­шёл­ся на кон. 1980-х гг., сре­ди ко­то­рых наи­боль­шее рас­про­стра­не­ние по­лу­чил объ­ект­ный язык С++. С сер. 1990-х гг. ак­ти­ви­зи­ро­ва­лось раз­ви­тие стан­дар­тов и тех­но­ло­гий объ­ект­ных Б. д., это свя­за­но в т. ч. с по­яв­ле­ни­ем язы­ков про­грам­ми­ро­ва­ния Java и UML (Unifi­ed Modeling Language – Уни­фи­ци­ро­ван­ный язык мо­де­ли­ро­ва­ния). В 1999 при­нят Стан­дарт SQL. В кон. 1990-х гг. поя­ви­лись ба­зо­вые тех­но­ло­гии управ­ле­ния дан­ны­ми для сис­тем под­держ­ки при­ня­тия ре­ше­ний: ин­те­рак­тив­ная ана­ли­тич. об­ра­бот­ка дан­ных (OLAP – On-line Ana­lytical Processing), тех­но­ло­гии хра­ни­лищ дан­ных (Data Warehousing), тех­но­ло­гии глу­бин­но­го ана­ли­за дан­ных (Data Mining). Соз­да­ны спец. тех­но­ло­гии для очень боль­ших Б. д., ори­ен­ти­ро­ван­ных на те­ра­бай­ты и да­же пе­та­бай­ты ин­фор­ма­ции. В 1990-е гг. в свя­зи с соз­да­ни­ем от­кры­той рас­пре­де­лён­ной не­од­но­род­ной ги­пер­ме­дий­ной ин­фор­мац. сис­те­мы World Wide Web (Все­мир­ная пау­ти­на, или WWW, W3, Web), ис­поль­зую­щей ком­му­ни­кац. сре­ду Ин­тер­нет, про­ис­хо­дит ак­тив­ное взаи­мо­дей­ст­вие тех­но­ло­гий Б. д. и тех­но­ло­гий WWW, сре­ди ко­то­рых наи­боль­шее зна­че­ние для Б. д. име­ет рас­ши­рен­ный язык раз­мет­ки XML (Extensible Markup Language – Рас­ши­ря­е­мый язык раз­мет­ки). С кон. 1990-х гг. на ба­зе тех­но­ло­гий WWW ве­дут­ся мно­го­числ. ис­сле­до­ва­ния, свя­зан­ные с ин­те­гра­ци­ей ин­фор­мац. ре­сур­сов, в т. ч. не­од­но­род­ных.

Б. д. – ин­фор­мац. про­дукт, ко­то­рый мож­но при­об­ре­сти ли­бо не­по­сред­ст­вен­но на разл. но­си­те­лях (ча­ще все­го на оп­тич. дис­ках ти­па CD-ROM), ли­бо че­рез Ин­тер­нет или по др. про­то­ко­лам, оп­ла­тив ус­лу­ги по дос­ту­пу к Б. д. По со­дер­жа­нию вы­де­ля­ют Б. д. биб­лио­гра­фи­че­ские, ре­фе­ра­тив­ные, но­во­ст­ные, пра­во­вые, сло­вар­ные, био­гра­фи­че­ские, ад­рес­но-спра­воч­ные, Б. д. о пром. про­дук­ции, хи­мич. со­еди­не­ни­ях и ми­не­ра­лах, ди­на­мич. ря­ды ста­ти­стич. и де­мо­гра­фич. дан­ных и др. До сер. 1980-х гг. до­ми­ни­ро­ва­ли Б. д. на­уч­но-тех­нич. ин­фор­ма­ции, за­тем рез­ко воз­рос­ло зна­че­ние Б. д. ком­мерч. и де­ло­вой ин­фор­ма­ции, в т. ч. бир­же­вой и фи­нан­со­вой.

Б. д. – важ­ней­ший вид ин­фор­ма­ци­он­ных ре­сур­сов, ко­ли­че­ст­во, ка­че­ст­во и ха­рак­тер ис­поль­зо­ва­ния ко­то­рых во мно­гом оп­ре­де­ля­ют уро­вень раз­ви­тия стра­ны как ин­фор­ма­ци­он­но­го об­ще­ст­ва. По­это­му соз­да­ние и ис­поль­зо­ва­ние Б. д. в раз­ви­тых стра­нах, вклю­чая Рос­сию, яв­ля­ет­ся объ­ек­том пра­во­во­го ре­гу­ли­ро­ва­ния (см. Ин­фор­ма­ци­он­ное пра­во).

Лит.: Directory of online databases. Detroit; L., 1979–1992. [Vol. 1–13]; Gale directory of databases. Detroit; L., 1993–2004– . [Vol. 1–12–]; Ко­га­лов­ский М. Р. Эн­цик­ло­пе­дия тех­но­ло­гий баз дан­ных. М., 2002; Ро­дио­нов И. И. и др. Ры­нок ин­фор­ма­ци­он­ных ус­луг и про­дук­тов. М., 2002.

Вернуться к началу