Dublin Core metadata

Van VBI8 Wiki Over Search

Ga naar: navigatie, zoek

Inhoud

[bewerk] Inleiding

Zoals op de pagina ontsluitingsmethoden videobestanden is aangegeven is het toevoegen van metadata één van de manieren om de videobestanden te ontsluiten. In dit stuk willen we dieper ingaan op één van de standaards die op dit terrein is opgezet, namelijk de Dublin Core methode. Deze methode richt zich niet alleen op de beschrijving van videomaterialen, maar biedt ook de mogelijkheid om bijvoorbeeld foto’s, websites en muziekfragmenten te voorzien van de benodigde metadata.

[bewerk] Wat is metadata?

Voor er dieper op de Dublin Core methode ingaan wordt, wordt eerst getracht een bondige beschrijving te geven van het aspect metadata.

Wat is metadata? Men kan metadata omschrijven als “Data about data” (gegevens over de content van een bepaald product / ‘ding’) Het gaat vaak over "Wat?, Wie?, Waar?, Waarmee?, Waarom? en Hoe?"-data van een object. Het beschrijft zodoende de karakteristieken van informatie, zoals inhoud, kwaliteit en de conditie van informatie. Door middel van deze kenmerken is het mogelijk om een document terugvindbaar te maken. Indien voor elk document de metadata consistent is bijgevoegd kunnen zoekvragen als: “wie is de auteur van document x?” zonder problemen worden beantwoord, mits de zoeksoftware deze functionaliteit ondersteund. Daarnaast zijn de meeste metadatastandaarden mediaonafhankelijk. Zowel tekst, audiovisuele middelen, foto’s, cd’s, videobanden als postzegelverzamelingen kunnen ermee beschreven worden. Door middel van metadata kunnen geschreven bestanden worden beheerd, gekanaliseerd, gepersonaliseerd en gedistribueerd.

[bewerk] Dublin Core methode

De Dublin Core methode is opgezet door The Dublin Core Metadata Initiative. De methode onderkent vijftien elementen voor het beschrijven van elektronische informatie. In het onderstaande schema worden de vijftien elementen genoemd en verder uitgewerkt.

Indien men een volledige Dublin Core metadata beschrijving van een videofragment aan wil maken, moet men de onderstaande vijftien elementen opnemen en nader specificeren.

Dublin Core metadataset versie 1.1
Nummer: Element: Beschrijving:
1 Titel De naam waaronder het document of de informatiebron formeel gekend is; gewoonlijk toegekend door de auteur of de maker.
2 Auteur of maker De persoon of organisatie die in de eerste plaats verantwoordelijk is voor het creëren van de inhoud van het document.
3 Onderwerp en sleutelwoorden Het onderwerp wordt meestal weergegeven door een lijst van woorden of classificatiecodes, gescheiden door komma's of spaties, die de inhoud van het document beschrijven. Het gebruik van gecontroleerde vocabulaires en formele classificatieschema's (zoals gebruikt in bibliotheken) wordt aangeraden. (Het is aan te raden niet meer dan 1000 karakters te gebruiken, anders is er voor zoekmachines sprake van spamming)
4 Beschrijving Een beschrijving van de inhoud van de bron, bijvoorbeeld in de vorm van een korte samenvatting, een inhoudstabel, een verwijzing naar een grafische weergave van de inhoud.
5 Uitgever De entiteit die verantwoordelijk is voor het beschikbaar stellen van het document. Dit kan een persoon, een organisatie of een dienst zijn. De naam van de 'uitgever' wordt gebruikt om de entiteit aan te duiden.
6 Contribuant De entiteit die verantwoordelijk is voor het leveren van bijdragen aan de inhoud van het document. Dit kan een persoon, een organisatie of een dienst zijn. De naam van de contribuant wordt gebruikt om de entiteit aan te duiden.
7 Datum Een datum of een gebeurtenis in de levenscyclus van het document. Deze datum verwijst gewoonlijk naar de creatie of de publicatie van het document.
8 Formaat bron Soort publicatie, b.v. homepagina, roman, gedicht, technisch rapport, essay, woordenboek. Voor de goede gang van zaken zou het type gekozen moeten worden uit een vastgelegde lijst, b.v. het DCMI Type Vocabulary (dublincore.org/documents/dcmi-type-vocabulary/; recentste lijst: dublincore.org/usage/terms/dcmitype/ ).
9 Formaat De fysieke of digitale manifestatie van het document. Formaat bevat gewoonlijk het medium of afmetingen van het document. Formaat kan gebruikt worden om de software en eventuele hardware te identificeren die nodig zijn om het document weer te geven of te gebruiken. Voorbeelden van dimensies zijn grootte en duur. Het is aangeraden om een waarde uit een gecontroleerd vocabularium te kiezen, bijvoorbeeld de lijst van Internet Media Types voor het definiëren van mediaformaten voor computers.
10 Uniek kenmerk Een binnen een gegeven context ondubbelzinnige referentie naar het document; een uniek kenmerk gevormd door een reeks letters of cijfers, dat het document identificeert. Het is aangeraden om hiervoor een formeel identificatiesysteem te gebruiken. Voorbeelden van dergelijke systemen zijn URL's, URI's en URN's; ISBN en DOI.
11 Bron Een verwijzing naar een 'resource' (informatiebron) waarvan het document afgeleid is. Het huidige document kan geheel of gedeeltelijk afgeleid zijn van de 'Bron'. Het is aangeraden om de 'Bron' te identificeren met behulp van een string of een nummer volgens een formeel identificatiesysteem. Men kan hier hetzelfde systeem gebruiken als bij Uniek kenmerk; URI wordt het meest gebruik.
12 Taal Een taal van de intellectuele inhoud van het document. Het is aangeraden om gebruik te maken van RFC 3066 die, in combinatie met ISO 639 codes voor talen definieert. De taalcode kan eventueel gevolgd worden door een landcode van twee letters, zoals gedefinieerd in ISO 3166. Voorbeelden: 'nl' voor Nederlands, 'de' voor Duits, 'en-GB' voor het Engels gesproken in het Verenigd Koninkrijk.
13 Relatie Een verwijzing naar verwante 'resources' of documenten. Het is aangeraden om de verwante 'resources' te identificeren met een string of een nummer volgens een formeel identificatiesysteem. (Voordien werden dergelijke verbanden tussen HTML-pagina's dikwijls aangeduid binnen het LINK-element in plaats van het META-element.)
14 Bereik Het 'Bereik' (extent or scope) van de inhoud van het document. Meestal gaat het over het spatiale of temporele bereik van de inhoud. Het spatiale bereik verwijst naar een fysiek gebied door middel van plaatsnamen of geografische coördinaten. Het temporeel bereik wordt typisch aangeduid door middel van een periode (b.v. neolythicum) of het tijdformaat dat gebruikt wordt voor het Datum-element. Het is aangeraden om waarden te kiezen uit gecontroleerde vocabulaires.
15 Rechten Informatie over rechten in en over het document. ‘Rechten’ bevat typisch een statement over rechtenbeheer voor het document of een verwijzing naar een dienst die dergelijke informatie levert. Deze rechten kunnen intellectuele eigendomsrechten, auteursrechten en/of eigendomsrechten zijn.

De bovengenoemde vijftien elementen zijn onderling te verdelen in drie afzonderlijke groepen

Dublin Core metadataset versie 1.1
Content Intellectueel eigendom Concretisering
Titel Auteur of maker Datum
Onderwerp en sleutelwoorden Uitgever Formaat
Beschrijving Contribuant Uniek kenmerk
Formaat bron Rechten Taal
Bron
Relatie
Bereik

[bewerk] Scheme

Daar waar de waarden van de methode zijn voorgedefinieerd blijft het aanvullen met itemspecifieke informatie mensenwerk. Indien meerdere mensen berust zijn met de taak om metadata aan de bestanden te koppelen loopt men het risico dat dit beschrijvingsverschillen met zich mee brengt. Denk hierbij aan meerdere mogelijkheden tot het beschrijven van een datum (YYYY-MM-DD of DD-MM-YYYY). Om dit probleem te vermijden wordt een zogehete ‘scheme’ toegepast. In het onderstaande kader wordt een verdere uitleg gegeven rondom dit aspect.

“Scheme (schema) wordt gebruikt om de notatiewijze of de toegestane waarde van inhoud te beschrijven. Een voorbeeld is de notatie van datum in het W3C DTF formaat: YYYY-MM-DD.

Als de notatie volgens een gegeven schema gebeurt, kunnen (indexerings)applicaties hier zinvol mee omgaan. Als het schema niet wordt gebruikt, dan wordt de ingevulde string als een stukje vrije tekst beschouwd dat alleen door menselijke intelligentie geïnterpreteerd en gemanipuleerd kan worden.

Scheme kan daarnaast gebruikt worden om te verwijzen naar een lijst met toegestane waarden, een controlled vocabulary. Ook in dit geval is er geen sprake van vrije tekst, de inhoud moet overeen komen met een van de waarden in de controlled vocabulary.”

[bewerk] HTML-notatie

Indien het toekennen van de metadata geheel volgens regels is verlopen dient deze uiteraard gekoppeld te worden aan het product. Eén van de mogelijkheden om deze beide te koppelen is het gebruik van HTML-tekst. In het onderstaande kader is een voorbeeld gegeven met een deel van de Dublin Core elementen verwerkt in HTML tekst.

<html>
<head>
<title>GBO</title>
<meta name="DC.Title" content="GBO Arjan Slingerland">
<meta name="DC.Creator" content="Slingerland, Arjan">
<meta name="DC.Type" content="Text">
<meta name="DC.Date" content="2007">
<meta name="DC.Format" content="text/document">
</head>
<body>
...
</body>
</html>

Op beschreven wijze is het mogelijk een gehele metadata beschrijving te maken aan de hand van de Dublin Core standaard.

[bewerk] Zie ook

[bewerk] Externe informatie

Metadata en META-tags in HTML
Auteur: Katholieke Universiteit Leuven
URL: http://canada.esat.kuleuven.be/user/error404/creatie6.htm#dublincore
Formaat: WWW Taal: Nederlands Datum aanmaak: Onbekend Datum wijziging: 29-09-2006
Trefwoorden: Dublin Core; metadata; uitleg; elementen
Motivatie: De pagina geeft een duidelijke uitleg over de Dublin Core methode. De te gebruiken elementen worden nadrukkelijk uitgelegd en per element wordt weergegeven in welke groep deze geplaatst kan worden.


Dublin Core Metadata
Auteur: Overheid.nl
URL: http://webrichtlijnen.overheid.nl/handleiding/ontwikkeling/productie/metadata/dublin-core/
Formaat: WWW Taal: Nederlands Datum aanmaak: Augustus 2006 Datum wijziging: Onbekend
Trefwoorden: Dublin Core; metadata; uitleg; elementen; scheme
Motivatie: De pagina geeft een duidelijke uitleg over de Dublin Core methode. De te gebruiken elementen worden nadrukkelijk uitgelegd. Tevens wordt aangegeven wat wordt bedoeld met het begrip ‘scheme’.

Aslingerland 6 jun 2007 18:02 (CEST)

Aspecten/acties
Persoonlijke instellingen
content beleid
About us