Лекція 6
.docТема 6. Бази геопросторових даних (БД) і системи управління базами даних (СУБД) – загальні поняття і визначення, структура, характеристики та основні функції
План
Загальні поняття і визначення.
Основні характеристики і моделі БД.
Передумови виникнення та еволюція розвитку БД.
Структура БД.
Системи управління базами даних.
Основні функції, можливості, компоненти та вимоги до СУБД.
Однією з найважливіших функцій ГІС є збереження даних про просторові об’єкти та їх атрибути з метою їх подальшого пошуку, відбору, аналізу та відображення.
Визначальне місце баз даних у структурній схемі ГІС представлено на рисунку нижче:
Просторова інформація в ГІС організована у вигляді бази даних.
Ядром будь-якої інформаційної системи є файл бази даних.
База даних (БД) — це впорядкована сукупність спеціально організованих і логічно взаємопов’язаних інформаційних елементів, яка відображає стан об’єктів, їх характерні параметри та зв’язки між ними в одній розглядуваній предметній області.
БД – це сукупність даних, організованих за певними правилами, які передбачають загальні принципи опису, збереження і маніпулювання даними, незалежно від програмного забезпечення.
Головне завдання БД — гарантоване збереження значних обсягів інформації (т. зв. записи даних) та надання доступу до неї користувачеві або ж прикладній програмі.
Бази даних створюють тоді, коли є потреба регулярно опрацьовувати великі обсяги однорідної інформації.
БД складаються з двох частин: збереженої інформації та системи керування нею.
Для БД характерним є:
однократне введення та багатократне використання інформації;
введена інформація застосовується для багатоцільових проблем;
БД існують незалежно від конкретних прикладних програм;
в БД підтримуються стандарти представлення даних, що спрощує їх створення та обслуговування:
в БД забезпечується централізоване управління інформацією, включаючи мови запитів і засоби захисту.
Структурований опис даних передбачає схему даних, більш відому як модель даних.
Модель даних описує об'єкти та взаємовідношення між ними.
Цілісність даних - їх відповідність схемі БД.
Існує декілька структурованих моделей (чи типів) баз даних, основні:
плоска
ієрархічна
мережна
реляційна
об’єктно-орієнтована
До неструктурованих БД належать повнотекстові бази даних, які містять неструктуровані тексти статей чи книг у формі, що дозволяє здійснювати швидкий пошук (наприклад, Вікіпедія).
Приблизно з 2000 року більше половини БД використовують реляційну модель.
Передумови виникнення та еволюція розвитку БД
Еволюція організації даних для машинної обробки даних представлена на схематичному рисунку 1. На перших етапах розвитку інформаційних систем (70-80-і р.р.) масив даних був частиною програми. При зміні чи переформатуванню даних треба було змінювати їх код і опис, тобто переписувати саму програму. Згодом опис даних розмістили в ізольований блок даних, і це забезпечило незалежність даних від програм. Так виникли бази даних.
Р
Рис.1 .Еволюція організації даних для
машинної обробки
Склалося два підходи до організації інформаційних масивів:
– файлова організація інформаційних масивів;
– організація інформаційних масивів у вигляді бази даних.
Файлова організація інформаційних масивів (даних) – це розміщення даних у файли певної структури.
Файл – це іменована частина зовнішньої пам’яті, в якому можна записувати і з якої можна зчитувати дані. Структура запису файлу відома тільки програмі, яка з ним працює. При зміні структури файлу потрібно було змінювати структуру програми, а це вимагало нової компіляції, тобто процесу перекладу програми у виконувані машинні коди. Така ситуація характеризується як залежність програм від даних.
Характерна риса файлового підходу – вузька спеціалізація як програм обробки, так і файлів даних, що є причиною великої надлишковості (одні й ті ж елементи даних зберігаються в різних системах). Оскільки керування здійснюється різними особами (групами осіб), відсутня можливість виявити порушення суперечливості збереженої інформації. Крім того, файлова організація даних внаслідок відмінностей структури записів і форматів представлення даних не забезпечує виконання багатьох інформаційних запитів.
Тому виникає потреба відокремити дані від їхнього опису, визначити таку організацію збереження даних з урахуванням існуючих зв’язків між ними, яка б дозволила використовувати ці дані одночасно для багатьох додатків (прикладних програм, застосувань). Зазначені причини й обумовили появу баз даних.
1960-ті рр. розроблення перших БД. CODASYL — мережева модель даних та одночасно незалежне розроблення ієрархічної БД фірмою North American Rockwell, яка пізніше взята за основу IMS — власної розробки IBM.
1970-ті рр. наукове обґрунтування Едгаром Ф. Коддом основ реляційної моделі, котра на початку зацікавила лише наукові кола. Уперше цю модель було використано у БД Ingres (Берклі) та System R (IBM), що були лише дослідними прототипами, анонсованими протягом 1976 року.
1980-ті рр. поява перших комерційних версій реляційних БД Oracle та DB2. Реляційні БД починають успішно витісняти мережеві та ієрархічні. Дослідження децентралізованих (розподілених) систем БД, проте вони не відіграють особливої ролі на ринку БД.
1990-ті рр. увага науковців спрямовується на об'єктно-орієнтовані БД, які знайшли застосування в першу чергу в тих галузях, де використовуються комплексні дані: інженерні, мультимедійні БД.
2000-ні рр. головним нововведенням є підтримка та застосування XML у БД. Розробники комерційних БД, які панували на ринку у 1990-их рр., отримують все більшу конкуренцію з боку руху відкритого програмного забезпечення. Реакцією на це стає поява безкоштовних версій комерційних БД.
Структура бази даних – сукупність правил та обмежень, які відображають зв’язки, що існують між окремими частинами даних.
Можлива модифікація структури БД та редагування БД(внесення змін та виправлень, оновлення даних)
Розрізняють структуру файлу і власне дані. Структура – незмінна, а дані (інформація) змінюються при кожному введенні.
Нижче наведений приклад БД “Класний керівник».
|
|
Робота з базами передбачає такі етапи:
Системи управління (керування) базами даних (СУБД або СКБД)
Для легкого і простого маніпулювання величезним обсягом даних програмісти і математики створили спеціальні програми, т. зв. системи керування базами даних (СУБД). Якщо їх порівнювати із простими текстовими базами даних, то СУБД мають величезні переваги:
СКБД – комплекс програмних і мовних засобів, призначених для організації, супроводу та надання доступу до БД користувачам.
Рис. 3. Структурна схема СКБД
Системи управління базами даних (СУБД) – це сукупність мовних та програмних засобів, які призначені для створення, ведення і сумісного використання баз даних багатьма користувачами для зберігання і обробки кількох взаємопов'язаних наборів однотипних даних. Системи управління (керування) базами даних - це програми, що забезпечують можливість створення БД та виконання з ними різних операцій. Відомі СУБД - Access, FoxPro, dBase, Paradox, Oracle, Sybase, Informix та ін.
Вимоги до СУБД:
З СУБД можуть працювати не лише люди, а й прикладні програми (клієнти). Завдяки використанню СУБД, дані в БД є більш захищеними.
Важливою перевагою СУБД є:
Основиними функціями СУБД є:
Основні функції СУБД
Можливості СУБД
- системи забезпечення захисту, яка запобігає несанкціонованому доступу до БД; - системи керування паралельною роботою прикладних програм, яка контролює процеси спільного доступу до БД; - системи відновлення — дозволяє відновлювати БД до попереднього несуперечливого стану, що був порушений в результаті збою апаратного або програмного забезпечення
Основні компоненти середовища СКБД
Архітектура СКБД Існує трирівнева система організації СКБД ANSI-SPARC, при якій існує незалежний рівень для ізоляції програми від особливостей представлення даних на нижчому рівні. Рівні:
Логічна незалежність — повна захищеність зовнішніх моделей від змін, що вносяться в концептуальну модель. Фізична незалежність — захищеність концептуальної моделі від змін, які вносяться у внутрішню модель.
Банк даних – це система спеціальним чином організованих даних (баз даних), програмних, технічних, мовних, організаційно-методичних засобів, призначених для забезпечення централізованого накопичення і колективного багатоцільового використання даних. Нижче наведена структурна схема банку даних.
Рис. 4. Структурна схема банку даних: БД - одна чи декілька БД; ПЗ, ТЗ - програмні та технічні засоби обчислювальної системи; ОП - обслуговуючий персонал
Нижче наведений приклад реалізації бази геопросторових даних у ГІС.
База даних адміністративно-територіального устрою України (БД АдмТер)
БД АдмТер є засобом інтеграції даних про населені пункти та інші об’єкти адміністративно-територіального устрою держави. БД містить коди КОАТУУ (скорочення від "Класифікатор об’єктів адміністративно-територіального устрою України") та назви адміністративно-територіальних об’єктів України станом на 01 грудня 2014 року, а також інформацію про адміністративне підпорядкування та деяку додаткову інформацію.
До БД входить інформація про такі адміністративно-територіальні об’єкти:
Для всіх типів об’єктів представлені такі атрибути:
Схематичний рисунок структури та функціонування БД АдмТер :
Усі зміни в базі даних виконуються розробником. Розробник сповіщає зареєстрованих користувачів про вихід нових версій та про виявлені під час експлуатації помилки. Розробник приймає також зауваження та пропозиції щодо покращання повноти, достовірності та інших характеристик БД. БД АдмТер інформаційно сумісна з електронною топографічною картою України. БД АдмТер фізично поставляється у форматі СУБД MS ACCESS. За допомогою інструментів продукту користувач може виконати пошук об’єкту АдмТер (області, району, населеного пункту тощо) за його назвою, за адміністративно-територіальним кодом або за його глобальним ідентифікатором (GID). Сценарій використання:
Для отримання детальної інформації та можливості покупки або співпраці звертайтеся до нашого менеджера company@isgeo.kiev.ua, isgeo@ukr.net або до магазину on-line http://shop.isgeo.com.ua Наші контакти: м. Київ, 02094, вул. Попудренка, 54, тел. (044) 338 01 82, (044) 338 01 83
|
|