Afbeelding 4.9 Ontwikkeling bestanden en databases.
De overgang van alfanumerieke gegevens naar multimediadocumenten heeft
ook gevolgen voor de manier waarop gegevens worden opgeslagen in bestanden
en databases.
De opslag van alfanumerieke gegevens vindt in de jaren zestig aanvankelijk
plaats in sequentiële bestanden. Gegevens worden gegroepeerd in records
- zoals klantgegevens in klantrecords - en staan in het bestand gesorteerd
op een sleutel (key), bijvoorbeeld klantnummer of klantnaam. De sequentiële
bestanden passen bij de dan gebruikelijke opslag op tapes.
Met de opkomst van de schijf als opslagmedium begint men de records
direct toegankelijk te maken op sleutel. Een voorbeeld is het index-sequentiële
bestand waarin bijvoorbeeld klantrecords via aparte indexen toegankelijk
zijn op klantnummer. In plaats van alle klanten te moeten doorlezen,
kan men nu direct de juiste klant opzoeken met behulp van het klantnummer.
Dit sluit aan bij de overgang van batch-verwerking naar on line-verwerking
waarbij het mogelijk moet zijn de klantgegevens direct op te vragen
op de terminal en vervolgens te wijzigen.
Het begin van de jaren zeventig luidt de opkomst van de databases
in met de hiërarchische databases zoals IMS van IBM. Daarna volgen de
netwerk-databases zoals IDMS en vervolgens de relationele databases
zoals DB2 en Oracle. Op dit moment is de relationele database de standaard.
Relationele databases
De basis voor de opslag van gegevens in de relationele database is een
gegevensmodel volgens het entiteit/relatie-principe. Entiteiten zijn
bijvoorbeeld klant en order. Tussen de entiteiten bestaan relaties.
Een order hoort bij één klant en bij een klant horen verschillende orders.
In de relationele database wordt iedere entiteit een tabel met records
(rijen genoemd). De entiteit 'klant' wordt een tabel met een rij voor
iedere klant. De relaties tussen de entiteiten worden gelegd met sleutels.
Ieder orderrecord bevat het klantnummer van de klant waar hij bij hoort.
Het voordeel van relationele databases is dat de records in een tabel
niet alleen toegankelijk zijn op een sleutel, zoals klantnummer, maar
ook op andere zoekcriteria zoals woonplaats of adres.
Een database doet meer dan gegevens opslaan en opzoeken. Databases
zorgen ook voor zaken als:
- toegangsbeveiliging, welke gebruikers mogen welke gegevens raadplegen
of wijzigen;
- beveiliging van de inhoud van gegevens door regelmatig een kopie
te maken en door het bijhouden van een journaal van wijzigingen;
- herstellen van de inhoud van de database bij storingen.
Het zijn deze extra faciliteiten die ons doen spreken van een Database
Management Systeem (DBMS).
Opslag van multimediadocumenten
Met de opkomst van de PC en multimedia moeten we inmiddels naast gestructureerde
alfanumerieke gegevens ook ongestructureerde gegevens zoals tekst, tekeningen,
beeld en geluid opslaan. Op dit moment slaan de meeste gebruikers deze
gegevens op in de vorm van afzonderlijke documenten waarbij ieder document
één bestand is. De gebruiker heeft dus voor iedere tekst of tekening
een afzonderlijk bestand. Hij kan tekeningen ook in een tekst opnemen,
maar dan zit de tekening gekopieerd in het tekstbestand. De gebruiker
kan de documenten nog groeperen in directories of folders.
Toegankelijkheid van multimediadocumenten
Op dit moment is een aantal softwarepakketten beschikbaar waarmee de
gebruiker de toegang tot documenten en de relaties ertussen kan verbeteren.
Dit betreft software voor tekstgeoriënteerd zoeken en voor hypertext.
Software voor tekstgeoriënteerd zoeken is software die het zoeken
van teksten op basis van de inhoud van de tekst ondersteunt (de zogenaamde
full text retrieval). De software ondersteunt ook het zoeken in teksten
van diverse tekstformaten en het zoeken over verschillende computers
in een netwerk.
Met hypertextsoftware kan de gebruiker in teksten en tussen teksten
verwijzingen en relaties leggen. Hypertext ondersteunt het interactief
navigeren door documenten. De gebruiker ziet verwijzingen (de zogenaamde
hyperlinks) in de documenten doordat bijvoorbeeld een woord een andere
kleur heeft. Wil hij meer weten over dat woord, dan moet hij het woord
aanwijzen met de muis en erop klikken. Hij krijgt vervolgens tekst te
zien die betrekking heeft op dat woord. Terugkeren naar de oorspronkelijke
tekst is mogelijk. De documenten bestaan uit tekst en illustraties.
Illustraties kunnen in de tekst zijn opgenomen of er kunnen in de tekst
verwijzingen naar aparte illustraties zijn opgenomen.
Multimedia databases
De volgende fase is het opnemen van multimediadocumenten in relationele
databases. Een voorbeeld is Oracle Media Server, een relationele database
waarin ook tekst, stilstaande en bewegende beelden en geluid worden
opgeslagen. Voordeel van het opnemen van documenten in de database is
dat een relatie gelegd kan worden tussen de gestructureerde gegevens
en de documenten.
Een tweede voordeel is dat de documenten ook gebruik maken van de
diverse beveiligingen van het DBMS.
Objectbases
De tot nu toe beschreven databases slaan alleen gegevens op. De bijbehorende
toepassingen staan als programma's
apart opgeslagen in bestanden of programmabibliotheken. Dit hangt nog
samen met de werkwijze waarbij de gebruiker eerst een toepassing
in de vorm van een programma opstart en dan pas de gegevens of documenten
opzoekt die hij wil bewerken. Bij de objectgeoriënteerde benadering
werkt dit omgekeerd. De gebruiker zoekt eerst de documenten en daarin
de objecten op die hij wil bewerken en krijgt het document gepresenteerd.
Om deze werkwijze te ondersteunen zijn speciale objectgeoriënteerde
databases nodig. Hierin zijn toepassingen opgeslagen als documenten
en objecten met een verwijzing naar de functies (methoden) waarmee ze
bewerkt kunnen worden.
De leveranciers van relationele DBMS'en zoals Oracle, IBM en Sybase
zijn begonnen hun DBMS uit te breiden voor multimediadocumenten. Daarnaast
komen er objectgeoriënteerde extensies waarmee het mogelijk is gegevens
en documenten op te slaan als objecten met een verwijzing naar de functies
die erop uitgevoerd kunnen worden. De programmatuur wordt in de database
opgenomen als functies (methoden) van objecten en niet meer als afzonderlijke
programma's. Uiteindelijk verandert het RDBMS geleidelijk in een Objectbase
Management System voor alle soorten objecten.
Parallelle verwerking
Een aantal leveranciers is begonnen parallelle verwerking toe te passen
om het zoeken en bijwerken van gegevens in de database te versnellen.
Oracle kent reeds een parallelle versie voor bijvoorbeeld parallelle
nCube-computers. IBM heeft een parallelle versie van DB2 aangekondigd.
Parallelle verwerking is ideaal voor toekomstige zware database-servers
waarop grote hoeveelheden gegevens zijn opgeslagen.
Gedistribueerde databases
Alle DBMS-leveranciers werken aan of leveren een gedistribueerd DBMS
waarin de gegevens verspreid over verschillende computers zijn opgeslagen.
Het probleem met de huidige gedistribueerde DBMS'en is dat ze te veel
uitgaan van één grote database voor alle gebruikers, waarbij de gebruiker
niet hoeft te weten waar de gegevens staan of van wie ze zijn. Deze
zogenaamde 'transparantie' voor locatie en organisatie
is echter een belangrijke reden dat de huidige gedistribueerde DBMS'en
in de praktijk niet voldoen.
Op zich is het juist dat de gebruiker niet hoeft te weten waar de
gegevens of objecten zich fysiek bevinden, maar het is wel van groot
belang dat het eigenaarschap van gegevens en objecten goed geregeld
is. Dit geldt ook voor software zoals programma's, pakketten en methoden
van objecten.
Met de groei naar een wereldwijd netwerk waarbij gebruikers (mensen
en bedrijven) over en weer elkaars
gegevens, documenten en software kunnen gebruiken, moet het gedistribueerde
DBMS het juridisch eigenaarschap van deze objecten ondersteunen. Hiervoor
geldt een aantal voorwaarden:
- Iedere gebruiker (individuele mensen, bedrijven en andere organisaties)
heeft zijn eigen persoonlijke database met gegevens, objecten en software.
- De eigenaar bepaalt welke andere gebruikers toegang hebben tot het
DBMS en wat voor gebruiksrechten zij hebben.
- Het DBMS moet methoden voor navigatie bieden waarmee gebruikers
in het netwerk op zoek kunnen naar beschikbare gegevens, objecten
en software.
- Het DBMS kan ook het versiebeheer van objecten uitvoeren.
Samenvatting
Wanneer aan alle voorwaarden is voldaan en de laatste problemen met
distributie zijn opgelost, kan bij het uitgroeien van de computernetwerken
tot een elektronische snelweg
één wereldwijde DBMS ontstaan waarin iedereen zijn eigen databases met
gegevens, objecten en softwarefuncties kan inrichten. Met behulp van
parallelle verwerking is het mogelijk de gelijktijdige toegang van veel
gebruikers tot zeer omvangrijke databases te ondersteunen. Via publikatie
in het navigatiesysteem kan men anderen toegang geven tot zijn database
en het recht geven objecten te kopiëren. Het DBMS houdt de versies van
objecten bij. Het controleert ook bij wie kopieën in gebruik zijn en
het ondersteunt het betalen van gebruiksrechten van objecten aan de
eigenaar ervan.