Класифікація БД: варіанти, моделі даних і основні характеристики

394 0 Новини високих технологій

В якості БД позначається набір даних, які необхідно упорядкувати, а система управління базою даних (СУБД) відповідає за її адміністрування, визначаючи, таким чином, структуру, порядок, права доступу і залежності. Для цієї мети використовується власний компілятор і відповідна модель, яка визначає архітектуру системи бази даних. На базі архітектури проводять класифікацію БД.

Історія створення

Бази даних (БД) являють собою логічно структуровані системи для електронного адміністрування, яке здійснюється за допомогою системи управління базами даних (СУБД), додавши її в репозиторій. Більшість БД можна відкривати, редагувати і консультувати тільки з використанням конкретних додатків. За цим принципам виконують класифікацію БД. У 1960-х роках концепція електронної інформаційної бази стала розроблятися як окремий шар програмного забезпечення між ОС і прикладної програмою. Ідея системи електронних БД стала одним з найбільш актуальних нововведень у комп'ютерних розробках. Першими моделями, які були розроблені, були ієрархічні і мережні бази даних. IBM в сімдесятих зробила революцію в цьому секторі, з розробкою моделі реляційних БД. Найбільш успішними продуктами в той час були мову запитів БД Oracle SQL і наступники IBM, SQL/DS і DB2.

Поняття БД і класифікація БД

Сьогодні системи баз даних мають важливе значення в багатьох областях науки, техніки і користувальницького застосування. Будь-який тип програмного забезпечення, розроблений для компаній, заснований на надійних БД з великою кількістю опцій і інструментів для системних адміністраторів. Безпека даних також набуває все більшого значення, в електронних БД зберігаються і зашифровані паролі, особисті дані і навіть електронні валюти.

Сучасна фінансова система являє собою не що інше, як мережа баз даних, в якій більша частина грошових сум існує тільки у вигляді електронних одиниць інформації, захист яких за допомогою безпечних БД є однією з основних завдань фінансових установ.
Класифікація БД: варіанти, моделі даних і основні характеристики
В залежності від мінливості бази даних її тип за класифікацією відносять до БД статичному або динамічному. Функції статичних БД:
  • Дозволяють тільки читання даних, виключаючи модифікацію.
  • Застосовуються для біографій та історичних фактів або сценаріїв, до яких можна звертатися для дослідження, без необхідності зміни змісту.
  • Вони безпечні і прості у використанні при підключенні до мережі.
  • Функції динамічних БД:
  • Вони мають поняттям самоврядування.
  • Можуть бути пов'язані з динамічними мережами.
  • Ця структурна асоціація дозволяє зберігати і оновлювати інформацію бази даних.
  • Використовує HTML як мови зв'язку між мережею і динамічної БД.
  • Найбільш використовувані мови для створення динамічних мереж, пов'язаних з BBDD: Perl, CGI, PHP, JSP і ASP.
  • Основними СУБД, які працюють з динамічними веб-сторінками, є PostgresQL, MySQL, Oracle і Microsoft SQL.

    Для того щоб зрозуміти, які існують варіанти класифікації БД, що використовуються в науковій та освітній середовищі, розглядають:
  • бібліографічні;
  • документальні;
  • спеціалізовані;
  • довідники.
  • Функціональні можливості бібліографічних БД:
  • Пов'язані зі старими записами, які містять інформацію про місцезнаходження книги або документа.
  • Не містять повний текст, тільки посилання.
  • Завдяки таким форматів, як PDF, дозволяє отримувати доступ до оригінальних статей, на які є посилання.
  • З розвитком технологій включаються посилання з інших ЗМІ.
  • Особливості спеціалізованих БД:
  • Містять точну інформацію і орієнтовані на конкретну тему.
  • Використовуються в академічної та наукової середовищі.
  • Для деяких випадків не розглядаються як правильні BBDD: наприклад, телефонний довідник, список контактів компанії або міжнародної компанії.
  • Моделі електронної обробки

    Для того щоб детально вивчити питання, які існують варіанти класифікації БД, не можна обійти тему моделей. Ієрархічні бази даних були першими, розробленими в 60-х роках у працях Холлеріта, вони залежали від типу зберігання інформації 1N/NN у формі перевернутого дерева. Відносини мають тип 1N, коли батьківський вузол може мати кілька дочірніх підвузлів, але дочірній вузол не може належати кільком батьківським. Їх недолік в тому, що надмірність даних представлена не дуже добре. Модель бази даних в мережі, запропонована CODASYL, є його першою системою управління (IMS), з'явилася вона в 1968 році для програми НАСА "Аполлон". Вона вирішувала деякі проблеми попередньої ієрархічної моделі, які вже практично не використовуються в сучасному IT-процесі.
    Для того щоб зрозуміти сучасну модель, потрібно розглянути, які в класифікації БД існують відносини між батьківськими і дочірніми вузлами. Сьогодні використовуються відносини типу NN, коли дочірньому подузлу дозволено належати кільком батьківським вузлів. Разом з ієрархічною моделлю вона формує перше покоління БД. Переваги моделі: вони пропонують відмінну стабільність, хорошу продуктивність і кращу надмірність обробки. Недоліком моделі є складність системи, яка вимагає знань в області програмування. Особливості транзакційних баз даних:
  • Єдина мета - відправка і отримання даних з високою швидкістю.
  • Вони націлені на якісний аналіз і виробничі дані.
  • Унікальним призначенням є збір і відновлення даних з максимально можливою швидкістю, тому надмірність і дублювання інформації не є проблемою, як з іншими БД.
  • Дозволяють з'єднання з реляційними БД.
  • Операції є атомарними, в цьому типі можливо тільки те, що вони виконуються повністю (цілісність) або не виконуються взагалі.
  • Основні відмінності в базах даних

    Документальні - повертають вміст, працюють з когнітивними і концептуальними документами, що належать до інтелектуальної та академічному середовищі. У них є менеджери документів і контенту, такі, як CDS/ISIS, Filemaker, Knosys або Imagic Text для термінологічного контролю. Вони досяжні при використанні стандартизованих мов запитів і мають класифікацію БД за типом моделі даних.
    Реляційні засновані на встановленні зв'язків між наборами даних, організовані у вигляді таблиць, які відповідають деяким важливим вимогам. Вони мають фіксовану кількість полів. У кожного атрибута є ім'я і безліч можливих значень. Кожна запис унікальна і ідентифікується з допомогою ключа. Вони реалізують мова запитів SQL і засновані на моделі, розробленій Едгаром Коддом в 70-х роках.
    Класифікація БД: варіанти, моделі даних і основні характеристики
    Об'єктно-орієнтовані бази даних повертають фізичні файли або програмний код, з'явилися вони в кінці ХХ століття. Використовуються в промисловому виробництві та дизайні. Працюють з об'єктно орієнтованою мовою, таким як C++ або Python. Дотримуються "золоте правило": сталість, менеджер вторинного сховища, паралелізм, відновлення і об'єкт запиту.

    Системи управління СУБД

    Класифікація БД: варіанти, моделі даних і основні характеристики
    Система управління базами даних (СУБД) - термін для опису функцій і вимог транзакцій в системі управління БД, скорочено це ACID (АСИД) від атомарности, узгодженості, ізоляції і довговічності. Ці чотири параметри охоплюють найбільш важливі вимоги до СУБД, сумісні з ACID:

  • Atomicity (атомарність) позначає властивість "все або нічого" менеджерів БД для того, щоб запит був дійсним, транзакція була виконана правильно і реалізована з правильним порядком процедур.
  • Консистенція, або когерентність, коли угода БД залишається стабільною, що вимагає постійного контролю всіх операцій.
  • Ізоляція є умовою і гарантією, що транзакції не заважають один одному, що зазвичай досягається шляхом блокування певних функцій, які ізолюють дані, що беруть участь в угоді.
  • Довговічність означає, що в СКБД всі дані зберігаються в довгостроковій перспективі навіть після укладення угоди, а також у разі аварії системи, якщо падає СУБД. Для цього умови необхідні записи транзакцій, які протоколюють всі процеси, що відбуваються.
  • Класифікація функцій і вимог

    База даних зберігає інформацію і пов'язує її в логічну одиницю разом з метаданими, необхідними для обробки. Це дуже корисний інструмент для управління великими файлами з простим запитом, володіє системою дозволів, яка визначає, які користувачі програми мають право доступу.
    Класифікація БД: варіанти, моделі даних і основні характеристики
    Класифікація БД:

    Функція





    Призначення





    Зберігати дані




    В БД зберігаються тексти, документи, паролі. В електронному форматі, доступ до даних через консультації.



    Змінити дані



    В залежності від того, які дозволу доступні, більшість БД дозволяють редагувати фільтри захисту даних.



    Очистити дані



    Записи в більшості варіантів класифікації БД можуть бути повністю видалені, не залишаючи прогалин. У деяких випадках видалені дані можуть бути відновлені, але в інших вони видаляються назавжди.



    Управління метаданими



    Зазвичай інформація зберігається з метаданими або метатегами, які підтримують порядок в БД і роблять можливою функцію пошуку. Метадані також часто використовуються для регулювання дозволів.



    Безпека даних



    БД повинні бути захищені, щоб запобігти доступу неуповноважених осіб до інформації, яку вони зберігають.



    Цілісність даних



    Цілісність даних означає, що вони повинні відповідати певним правилам для забезпечення їх коректності та визначення бізнес-логіки банку даних.



    Багатокористувацька функція



    Додатка БД забезпечують доступ до різних пристроїв. Розподіл дозволів і безпека даних є елементарними в многопользовательском використанні.



    Оптимізувати запити



    Технічно БД повинна бути в змозі обробляти запити найкращим чином, щоб гарантувати хорошу продуктивність.



    Тригери і збережені процедури



    Ці дві процедури являють собою міні-програми, що зберігаються в СУБД. Тригери і збережені процедури є типовими процесами реляційних баз даних.



    Прозорість системи



    Прозорість системи актуальна, особливо в розподілених моделях класифікації БД.

    Ієрархічна модель

    Класифікація БД: варіанти, моделі даних і основні характеристики
    Відмінності між найбільш поширеними моделями БД є результатом технічної еволюції електронної передачі даних, яка не тільки переслідувала мети ефективності та керованості, а також розширювала можливості найбільш відомих виробників. Це найстаріша модель, яка сьогодні значно перевершує реляційну, хоча останнім часом спостерігається зростання її популярності. XML використовує цю систему для зберігання інформації. Деякі страхові компанії і банки звертаються до ієрархічним баз даних в найбільш старих додатках. Найбільш відома - це база IBM IMS/DB. В ієрархічній моделі класифікації даних БД існують строгі і однозначні залежності. Кожна запис має тільки один прецедент (Parent-Child Relationships, PCR), за винятком кореня (root), що становить деревоподібну схему. Хоча кожний дочірній вузол може мати тільки один батьківський, «батьки» можуть мати стільки дочірніх вузлів, скільки вони хочуть. Враховуючи жорстке ієрархічне впорядкування, рівні, не мають прямого зв'язку, не взаємодіють один з одним, тому з'єднати два різних дерева непросто. При цьому ієрархічні структури баз даних надзвичайно згинання і зрозумілі. Записи з "дітьми" називаються записами, а ті, які без, - листям, і зазвичай є документами в запису для листя в класифікації БД. Запити до ієрархічній базі даних досягають листя, починаючи з кореня і проходячи через різні записи.

    Графічно орієнтована DMS

    Мережева модель розвивалася майже одночасно з реляційною, хоча з часом вона була переможена конкурентами. На відміну від ієрархічної моделі тут записи не розкривають суворих відносин "батько - нащадок", але кожна може мати кілька прецедентів, що дає їй мережеву структуру свого імені. Для доступу до запису також існує унікальний і незмінний шлях. У моделі мережевої бази даних немає фіксованої ієрархії, і тому існує кілька шляхів, які ведуть до одного і того ж пункту призначення. Запис, розташована у центрі зображення, може бути теоретично доступна з п'яти інших, а отримавши доступ до неї, можна отримати доступ до п'яти іншим записам. У мережевий моделі також можуть бути визначені залежності - регістр, розташований вище. Він не пов'язаний безпосередньо з регістром у крайньому правому положенні, тому для його досягнення має проходити через регістр в центрі, який може прийняти або відхилити. Можна зв'язатися з розташованим зліва вгорі. У мережевий моделі записи додаються або видаляються без впливу на глобальну структуру. Сьогодні ця модель використовується на великих комп'ютерах. В інших областях і раніше покладаються на ієрархічну модель або звертаються до реляційної моделі, набагато більш гнучкою і простий у використанні. Деякі відомі моделі мережевих баз даних - це UDS Siemens і DMS Sperry Univac. Згодом обидва виробника також розробили цікаві змішані форми між мережевою моделлю і реляційної. Графічно орієнтована база даних завдяки своїй ретикулярної структурі вважається сучасної еволюцією мережевий моделі.
    Класифікація БД: варіанти, моделі даних і основні характеристики

    Масштабованість сховищ

    У документноориентированной моделі бази даних документи є основною одиницею зберігання інформації. Ці одиниці є тими, які структурують дані, і їх не слід плутати з документами програм обробки тексту. Тут дані зберігаються в так званих парах "ключ - значення". Оскільки ні структура, ні кількість пар не визначені, документи, що становлять базу даних, орієнтовану на документи, можуть сильно відрізнятися один від одного. Кожен документ сам по собі є закритою одиницею, і встановити відносини між документами непросто. В останні роки завдяки успіху NoSQL документарні бази даних пережили великий бум, особливо завдяки хорошій масштабованості. Прикладом системи баз даних цього типу є MongoDB. У моделі бази даних, орієнтованої на документи, дані зберігаються в окремих документах, а не в таблицях, як в реляційній моделі. Ці системи особливо цікаві для веб-додатків, оскільки вони дозволяють зберігати повні HTML-форми. Необхідно підкреслити, що серед різних заснованих на документі систем є помітні відмінності від синтаксису до внутрішньої структури, тому не всі орієнтовані на документи бази даних підходять для цього сценарію. Саме з цих відмінностей існує кілька систем баз даних, орієнтованих на репутаційні документи Lotus Notes, Amazon SimpleDB, MongoDB, CouchDB, Riak, ThruDB і OrientDB.

    Переваги і недоліки

    Класифікація БД: варіанти, моделі даних і основні характеристики
    Належні системи управління базами даних допомагають отримати кращий доступ до інформації, а також оптимізувати управління ними. У свою чергу, точковий доступ допомагає кінцевим користувачам швидко і ефективно обмінюватися даними в рамках виконання завдань організації.

    Модель бази даних



    Рік створення



    Переваги



    Недоліки



    Ієрархічна



    1960-й



    Дуже швидкий доступ для читання, чітка структура, технічно простий.



    Виправлена структура в дереві, яка не допускає зв'язку між деревами.



    Мережева



    Початок 1970-х



    Підтримує декілька способів доступу до запису, без суворої ієрархії.



    Поганий огляд з великими базами даних.



    Реляційна



    1970-й



    Просте, гнучке створення і редагування, легко розширювана, швидке введення в експлуатацію, просте розширення, швидкий запуск, дуже динамічний контекст.



    Некерований з великими обсягами даних, поганий сегментацією, атрибутами штучного ключа, зовнішнім інтерфейсом програмування, погано відображає властивості і поведінку об'єктів.



    Орієнтована на об'єкти



    Кінець 1980-х



    Найкраща підтримка объектноориентированных мов програмування, зберігання мультимедійного контенту. Підтримує объектноориентированные мови програмування, дозволяє зберігати мультимедійний контент.



    Більш низька продуктивність з великими обсягами даних, мало сумісних інтерфейсів.



    Орієнтована на документи



    1980-е



    Відповідні дані зберігаються централізовано в незалежних документах, вільної структурі, концепції мультимедіа, відноситься до класифікації сутностей БД.



    Організаційна робота щодо висока, часто вимагає навичок програмування.

    Області застосування

    Класифікація БД: варіанти, моделі даних і основні характеристики
    Людина можете не усвідомлювати цього, але бази даних є скрізь. Незалежно від того, чи знає він про них що-небудь чи ні, їх вплив на повсякденне життя дуже велика. Від погодних додатків до фільмів онлайн, бази даних відповідають за багато послуги, якими люди користуються щодня, і щоб не заплутатися в збільшеному обсязі інформації, використовують класифікацію даних в БД. Області застосування СУБД:
  • Банківська справа - для інформації про клієнтів, рахунків і позик, а також банківських операцій.
  • Авіакомпанії - для бронювання та інформації про розклад. Авіакомпанії були одними з перших, хто використовував бази даних в географічно розподіленому порядку: термінали, розташовані по всьому світу, зверталися до центральної системи баз даних через телефонні лінії і інші мережі передачі даних.
  • Університети - для інформації про студентів, реєстрації курсів і оцінок.
  • Операції з кредитними картами - для покупки по кредитних картах і формування щомісячних виписок.
  • Телекомунікації - для ведення записів про здійснені дзвінки, складання щомісячних рахунків, підтримання балансу на телефонних картках з передоплатою і зберігання інформації про мережах зв'язку.
  • Фінанси - для зберігання інформації про запаси, продажах і покупках фінансових інструментів, таких як акції та облігації.
  • Продажу - інформація про клієнта, продукт і покупці.
  • Виробництво - для управління ланцюжком поставок і для відстеження виробництва товарів на фабриках, запасів товарів на складах, в магазинах і замовлень на товари.
  • Людські ресурси - для отримання інформації про працівників, заробітної плати, податки на заробітну плату та пільги, а також для отримання зарплат.
  • Майбутні тенденції

    Класифікація БД: варіанти, моделі даних і основні характеристики
    В майбутньому світогляді баз даних як і раніше важливим аспектом буде залишатися World Wide Web (WWW, або, у скороченому вигляді, веб) як засіб публікації документів і як засіб обміну інформацією. WWW надає одну із самих різнорідних і складних середовищ в області взаємодії. Останнім часом з'явилися технології та стандарти, спрямовані на те, щоб зробити мережу масштабованої і керованої інфраструктурою. Однією з таких технологій є XML, яка перетворена в Інтернет, в систему бази даних, в стилі обробників традиційної БД, яка дає набагато кращі результати, ніж машини пошуку. Завдання полягає в тому, щоб інтегрувати цю функціональність у XML і максимально використовувати стратегічну інформацію, яку користувач може знайти в Інтернеті. Новими тенденціями є випереджальний і прогнозувальний аналіз продуктивності, навантажувальне тестування бази даних, використання NOSQL - mongodb і cassandra і BigData (Hadoop) в корпоративних і хмарних середовищах.

    Популярі новини
    Загрузка...