Vision

De wereld van Morgen
Hans Goedvolk
 

4.7 Database-managementsystemen

vorigevolgende

Multimedia en objectoriëntatie stellen nieuwe eisen aan de wijze van opslaan van gegevens in databases. Op dit moment slaan de meeste gebruikers documenten op in aparte bestanden en niet in een database-managementsysteem (DBMS). De huidige relationele database-managementsystemen (RDBMS) zijn geschikt voor het opslaan en toegankelijk houden van alfanumerieke velden in tabelvorm, maar nog niet of nauwelijks voor documenten. Op dit moment zien we de ontwikkeling van DBMS'en die geschikt zijn opslag van multimediadocumenten. Voordeel voor de gebruiker is dat het DBMS hem betere zoekmogelijkheden en beveiliging voor zijn documenten biedt.

Daarnaast ondersteunen DBMS'en het gedistribueerd opslaan van gegevens en objecten in een netwerk steeds beter. Hierdoor is het voor de gebruiker mogelijk vanaf een werkstation op verschillende servercomputers in het netwerk gegevens en objecten te raadplegen en te wijzigen.

Afbeelding 4.9 Ontwikkeling bestanden en databases.

De overgang van alfanumerieke gegevens naar multimediadocumenten heeft ook gevolgen voor de manier waarop gegevens worden opgeslagen in bestanden en databases.

De opslag van alfanumerieke gegevens vindt in de jaren zestig aanvankelijk plaats in sequentiële bestanden. Gegevens worden gegroepeerd in records - zoals klantgegevens in klantrecords - en staan in het bestand gesorteerd op een sleutel (key), bijvoorbeeld klantnummer of klantnaam. De sequentiële bestanden passen bij de dan gebruikelijke opslag op tapes.

Met de opkomst van de schijf als opslagmedium begint men de records direct toegankelijk te maken op sleutel. Een voorbeeld is het index-sequentiële bestand waarin bijvoorbeeld klantrecords via aparte indexen toegankelijk zijn op klantnummer. In plaats van alle klanten te moeten doorlezen, kan men nu direct de juiste klant opzoeken met behulp van het klantnummer. Dit sluit aan bij de overgang van batch-verwerking naar on line-verwerking waarbij het mogelijk moet zijn de klantgegevens direct op te vragen op de terminal en vervolgens te wijzigen.

Het begin van de jaren zeventig luidt de opkomst van de databases in met de hiërarchische databases zoals IMS van IBM. Daarna volgen de netwerk-databases zoals IDMS en vervolgens de relationele databases zoals DB2 en Oracle. Op dit moment is de relationele database de standaard.

Relationele databases
De basis voor de opslag van gegevens in de relationele database is een gegevensmodel volgens het entiteit/relatie-principe. Entiteiten zijn bijvoorbeeld klant en order. Tussen de entiteiten bestaan relaties. Een order hoort bij één klant en bij een klant horen verschillende orders. In de relationele database wordt iedere entiteit een tabel met records (rijen genoemd). De entiteit 'klant' wordt een tabel met een rij voor iedere klant. De relaties tussen de entiteiten worden gelegd met sleutels. Ieder orderrecord bevat het klantnummer van de klant waar hij bij hoort. Het voordeel van relationele databases is dat de records in een tabel niet alleen toegankelijk zijn op een sleutel, zoals klantnummer, maar ook op andere zoekcriteria zoals woonplaats of adres.

Een database doet meer dan gegevens opslaan en opzoeken. Databases zorgen ook voor zaken als:

  • toegangsbeveiliging, welke gebruikers mogen welke gegevens raadplegen of wijzigen;
  • beveiliging van de inhoud van gegevens door regelmatig een kopie te maken en door het bijhouden van een journaal van wijzigingen;
  • herstellen van de inhoud van de database bij storingen.

Het zijn deze extra faciliteiten die ons doen spreken van een Database Management Systeem (DBMS).

Opslag van multimediadocumenten
Met de opkomst van de PC en multimedia moeten we inmiddels naast gestructureerde alfanumerieke gegevens ook ongestructureerde gegevens zoals tekst, tekeningen, beeld en geluid opslaan. Op dit moment slaan de meeste gebruikers deze gegevens op in de vorm van afzonderlijke documenten waarbij ieder document één bestand is. De gebruiker heeft dus voor iedere tekst of tekening een afzonderlijk bestand. Hij kan tekeningen ook in een tekst opnemen, maar dan zit de tekening gekopieerd in het tekstbestand. De gebruiker kan de documenten nog groeperen in directories of folders.

Toegankelijkheid van multimediadocumenten
Op dit moment is een aantal softwarepakketten beschikbaar waarmee de gebruiker de toegang tot documenten en de relaties ertussen kan verbeteren. Dit betreft software voor tekstgeoriënteerd zoeken en voor hypertext.

Software voor tekstgeoriënteerd zoeken is software die het zoeken van teksten op basis van de inhoud van de tekst ondersteunt (de zogenaamde full text retrieval). De software ondersteunt ook het zoeken in teksten van diverse tekstformaten en het zoeken over verschillende computers in een netwerk.

Met hypertextsoftware kan de gebruiker in teksten en tussen teksten verwijzingen en relaties leggen. Hypertext ondersteunt het interactief navigeren door documenten. De gebruiker ziet verwijzingen (de zogenaamde hyperlinks) in de documenten doordat bijvoorbeeld een woord een andere kleur heeft. Wil hij meer weten over dat woord, dan moet hij het woord aanwijzen met de muis en erop klikken. Hij krijgt vervolgens tekst te zien die betrekking heeft op dat woord. Terugkeren naar de oorspronkelijke tekst is mogelijk. De documenten bestaan uit tekst en illustraties. Illustraties kunnen in de tekst zijn opgenomen of er kunnen in de tekst verwijzingen naar aparte illustraties zijn opgenomen.

Multimedia databases
De volgende fase is het opnemen van multimediadocumenten in relationele databases. Een voorbeeld is Oracle Media Server, een relationele database waarin ook tekst, stilstaande en bewegende beelden en geluid worden opgeslagen. Voordeel van het opnemen van documenten in de database is dat een relatie gelegd kan worden tussen de gestructureerde gegevens en de documenten.

Een tweede voordeel is dat de documenten ook gebruik maken van de diverse beveiligingen van het DBMS.

Objectbases
De tot nu toe beschreven databases slaan alleen gegevens op. De bijbehorende toepassingen staan als programma's apart opgeslagen in bestanden of programmabibliotheken. Dit hangt nog samen met de werkwijze waarbij de gebruiker eerst een toepassing in de vorm van een programma opstart en dan pas de gegevens of documenten opzoekt die hij wil bewerken. Bij de objectgeoriënteerde benadering werkt dit omgekeerd. De gebruiker zoekt eerst de documenten en daarin de objecten op die hij wil bewerken en krijgt het document gepresenteerd. Om deze werkwijze te ondersteunen zijn speciale objectgeoriënteerde databases nodig. Hierin zijn toepassingen opgeslagen als documenten en objecten met een verwijzing naar de functies (methoden) waarmee ze bewerkt kunnen worden.

De leveranciers van relationele DBMS'en zoals Oracle, IBM en Sybase zijn begonnen hun DBMS uit te breiden voor multimediadocumenten. Daarnaast komen er objectgeoriënteerde extensies waarmee het mogelijk is gegevens en documenten op te slaan als objecten met een verwijzing naar de functies die erop uitgevoerd kunnen worden. De programmatuur wordt in de database opgenomen als functies (methoden) van objecten en niet meer als afzonderlijke programma's. Uiteindelijk verandert het RDBMS geleidelijk in een Objectbase Management System voor alle soorten objecten.

Parallelle verwerking
Een aantal leveranciers is begonnen parallelle verwerking toe te passen om het zoeken en bijwerken van gegevens in de database te versnellen. Oracle kent reeds een parallelle versie voor bijvoorbeeld parallelle nCube-computers. IBM heeft een parallelle versie van DB2 aangekondigd. Parallelle verwerking is ideaal voor toekomstige zware database-servers waarop grote hoeveelheden gegevens zijn opgeslagen.

Gedistribueerde databases
Alle DBMS-leveranciers werken aan of leveren een gedistribueerd DBMS waarin de gegevens verspreid over verschillende computers zijn opgeslagen. Het probleem met de huidige gedistribueerde DBMS'en is dat ze te veel uitgaan van één grote database voor alle gebruikers, waarbij de gebruiker niet hoeft te weten waar de gegevens staan of van wie ze zijn. Deze zogenaamde 'transparantie' voor locatie en organisatie is echter een belangrijke reden dat de huidige gedistribueerde DBMS'en in de praktijk niet voldoen.

Op zich is het juist dat de gebruiker niet hoeft te weten waar de gegevens of objecten zich fysiek bevinden, maar het is wel van groot belang dat het eigenaarschap van gegevens en objecten goed geregeld is. Dit geldt ook voor software zoals programma's, pakketten en methoden van objecten.

Met de groei naar een wereldwijd netwerk waarbij gebruikers (mensen en bedrijven) over en weer elkaars gegevens, documenten en software kunnen gebruiken, moet het gedistribueerde DBMS het juridisch eigenaarschap van deze objecten ondersteunen. Hiervoor geldt een aantal voorwaarden:

  • Iedere gebruiker (individuele mensen, bedrijven en andere organisaties) heeft zijn eigen persoonlijke database met gegevens, objecten en software.
  • De eigenaar bepaalt welke andere gebruikers toegang hebben tot het DBMS en wat voor gebruiksrechten zij hebben.
  • Het DBMS moet methoden voor navigatie bieden waarmee gebruikers in het netwerk op zoek kunnen naar beschikbare gegevens, objecten en software.
  • Het DBMS kan ook het versiebeheer van objecten uitvoeren.

Samenvatting
Wanneer aan alle voorwaarden is voldaan en de laatste problemen met distributie zijn opgelost, kan bij het uitgroeien van de computernetwerken tot een elektronische snelweg één wereldwijde DBMS ontstaan waarin iedereen zijn eigen databases met gegevens, objecten en softwarefuncties kan inrichten. Met behulp van parallelle verwerking is het mogelijk de gelijktijdige toegang van veel gebruikers tot zeer omvangrijke databases te ondersteunen. Via publikatie in het navigatiesysteem kan men anderen toegang geven tot zijn database en het recht geven objecten te kopiëren. Het DBMS houdt de versies van objecten bij. Het controleert ook bij wie kopieën in gebruik zijn en het ondersteunt het betalen van gebruiksrechten van objecten aan de eigenaar ervan.

vorigvolgende
website: Daan Rijsenbrij