Praktijkvoorbeelden van ontsluiting

Van VBI8 Wiki Over Search

Ga naar: navigatie, zoek

Inhoud

[bewerk] Inleiding

Met het internet in de huidige situatie zijn er tal van websites die gratis multimediabestanden aanbieden. Tegenwoordig heeft iedereen van de ‘computergeneratie’ wel gehoord over Youtube en Google video. Op deze pagina wordt als eerste een lijst gepubliceerd met voorbeelden van sites die videobestanden aanbieden. Daarna wordt per voorbeeld aangegeven op welke wijze de inhoud is ontsloten en wordt getracht te achterhalen met welke methodiek dit is gerealiseerd.

[bewerk] Openbare aanbieders

Binnen dit onderwerp wordt het onderscheid gemaakt tussen openbare aanbieders en mensen/instellingen die videofragmenten publiceren voor commerciële of educatieve doeleinden. Deze eerste groep wordt in deze paragraaf besproken.

[bewerk] YouTube

Op Youtube heeft iedereen de mogelijkheid om zijn/haar filmpje te uploaden en zo voor elke internetter open te stellen. De enige wijze waarop de filmpjes op de site toegankelijk worden gemaakt is door middel van handmatig toegevoegde metadata.

Upload-formulier YouTube
Upload-formulier YouTube



Wanneer je een filmpje wil uploaden is het noodzakelijk verschillende velden in te vullen. Denk hierbij aan ‘titel’, ‘omschrijving’ en ‘trefwoorden’. Tevens is het noodzakelijk om je filmpje in te delen in één van de twaalf voorgedefinieerde categorieën. Als laatste dient men een taal in te voeren, waarbij men kan kiezen uit: Engels, Spaans, Japans, Duits, Chinees en Frans.





Indien men gebruik maakt van de zoekfunctionaliteit binnen YouTube.com valt het ook op dat deze zijn recalls alleen uit de tekst van dit ingevulde format haalt. De filmpjes worden inhoudelijk verder niet automatisch geanalyseerd en voorzien van (extra) trefwoorden of overige omschrijvingen.

De gebruikte ontsluitingsmethode richt zich alleen op de door de uploader handmatig bijgevoegde informatie (tags). Het voordeel hiervan is dat er weinig tot geen complexe en dure systemen noodzakelijk zijn voor de ontsluiting van de videobestanden. Een nadeel is echter dat, indien de uploader niet de juiste kernbegrippen aan een video heeft meegegeven, hij onvindbaar wordt tussen de vele duizenden overige videobestanden. Tevens is het niet mogelijk om een filmfragment te vinden waarvan men bijvoorbeeld enkel de openingszin van de hoofdpersoon weet, mits deze zin niet is meegenomen in de beschrijving van het fragment.

Eric Sieverts heeft het volgende te melden omtrent het handmatig toekennen van zogenoemde tags:

“Op internet zijn de afgelopen jaren onder de benaming “web 2.0” talloze nieuwe diensten en technieken ontwikkeld, met als belangrijk gemeenschappelijk kenmerk dat gebruikers het op allerlei terreinen zelf voor het zeggen krijgen. Inhoudelijke ontsluiting is één van die terreinen. Vrijwel elke nieuwe dienst biedt gebruikers namelijk de mogelijkheid zogenaamde “tags” toe te voegen. Dat kan bij eigen materiaal dat op internet wordt aangeboden, zoals afleveringen van de eigen weblog, op Flickr neergezette foto’s of bij YouTube aangeboden videomateriaal.

In feite zijn deze tags gewoon ongecontroleerde trefwoorden. Ze hebben dan ook last van alle nadelen die aan ongecontroleerde ontsluitingsmethoden kleven (Macgregor 2006). Ze hebben echter het grote voordeel dat ze berusten op het woordgebruik van de informatiegebruikers zelf. Ontsluitingssystemen met tags worden - naar analogie van het woord “taxonomy” - ook wel aangeduid als “folksonomies”, door mensen zelf (“folks”) opgezette taxonomieën. In het Engelse taalgebied wordt ook wel van “grass-roots” taxonomieën gesproken. De gebruiker wordt daarbij geacht zelf het best te weten waarop hij voor zijn onderwerp moet zoeken.”

Men kan dus concluderen dat de zoekmachine binnen YouTube zijn recalls geeft door de ingevoerde zoekactie te vergelijken met de termen in de alsmaar groeiende folksonomy.

[bewerk] Google- en Altavista Video

Waar YouTube zich puur richt op het verspreiden van video’s, vervullen Google video en Altavista Video meer de rol van zoekmachine op het gebied van videobestanden. Ze halen beide hun informatie uit meerdere informatiebronnen. Google is sterk gericht op de dochteronderneming YouTube en de eigen database met videobestanden. Altavista daarentegen heeft meerdere externe bronnen waar ze naar verwijzen. Denk hierbij aan ‘Internet Archive’ en ‘CBSnews”. Om de bestanden weer te geven die voldoen aan de zoekvraag van de gebruiker dienen deze zoekmachines de ingevoerde zoekwoorden te koppelen aan de filmbestanden uit de verschillende databases. Evenals YouTube maken deze zoekmachines gebruik van de gekoppelde metadatavelden die betrekking hebben op de videobestanden bij het vergaren van de resultaten. Ze maken geen automatische analyse van de inhoudelijke kenmerken en gebruiken deze zodoende ook niet tijdens het zoekproces. De relevantie van de getoonde resultaten hangt zodoende helemaal samen van de mate van nauwkeurigheid waarmee de persoon die de filmpjes heeft geupload de metadatabestanden heeft ingevuld. Dit kan als grootste nadeel van deze methode worden gezien. In veel gevallen ontbreekt bij de personen die de filmbestanden plaatsen de kennis en de interesse om de metadatavelden op een correcte wijze te vullen en zodoende het ontsluitingsmiddel op een juiste wijze te laten functioneren.

[bewerk] Overige voorbeelden

Er zijn nog vele andere voorbeelden te benoemen van internetsites die gebruikers kosteloos de mogelijkheid bieden om filmbestanden te plaatsen of af te spelen. Indien de manier van ontsluiting nader wordt bekeken blijkt toch dat alle sites alleen gebruik maken van de handmatige toegevoegde metadata. Geen enkele aanbieder maakt gebruik van automatische tools die de fragmenten ook ontsluiten op inhoudelijke kenmerken. De belangrijkste reden ligt naar alle waarschijnlijkheid in het feit dat deze tools erg veel geld kosten. De sites bieden daarentegen hun filmbestanden gratis aan ter vertoning. De kans dat de aanbieders zodoende geen mogelijkheid zien om de aangeschafte systemen terug te verdienen zal ervoor zorgen dat deze niet worden ingezet. Daarnaast ontbreekt ook de noodzaak om deze geavanceerde systeem te implementeren, daar de filmbestanden niet voor professionele, of andere commerciële doeleinden worden ingezet. Hieronder nog een kleine lijst met internetsites die gratis filmbestanden aanbieden ter vertoning.

[bewerk] Publicaties voor commerciële/educatieve doeleinden

Daar waar bovengenoemde internetsites gebruikt worden voor publieke doeleinden zijn er ook instellingen/bedrijven die hun eigen database hebben opgezet met relevante multimediabestanden. De grootste voorbeelden hiervan zijn natuurlijk de televisieomroepen en het Nederlands Instituut voor Beeld en Geluid. Maar denk hierbij ook aan universiteiten, grote multinationals en grote overheidsinstellingen. Aangezien veel van de bovengenoemde soort organisaties op een professionele manier gebruik maken van hun filmfragmenten hebben deze zorg gedragen voor een correcte ontsluitingsmethode, om de benodigde informatie binnen afzienbare tijd te achterhalen uit databases met vaak duizenden overige filmbestanden. De ontsluitingsmethode die hiervoor worden gebruikt gaan vaak verder dan het handmatig toedienen van metadata aan de fragmenten. Op de pagina Ontsluitingsmethoden videobestanden hebben al verschillende van deze geavanceerde technieken de revue gepasseerd. Als tastbaar praktijkvoorbeeld is gekozen voor de technische universiteit Delft welke sinds korte tijd werkt met de zoeksoftware Virage van Autonomy.

“Zoeken in beeld- en geluidmateriaal is nog niet zo vanzelfsprekend als zoeken in tekstbestanden. De TU Delft gebruikt sinds kort binnen het nieuwe webcollegesysteem Collegerama een zoekprogramma dat ook in beeld- en geluidsbestanden kan zoeken. Studenten, docenten en geïnteresseerde buitenstaanders kunnen via Collegerama online diverse colleges, lezingen en onderzoekspresentaties volgen, doorzoeken of terugzien. De zoeksoftware Virage van Autonomy analyseert, codeert en indexeert beeld- en geluidsmateriaal dat afkomstig is uit diverse bronnen. Het programma kent automatisch metadata toe aan de bestanden, waardoor het handmatig aanbrengen hiervan overbodig wordt. Virage begrijpt de context van bestanden. Wanneer een student bijvoorbeeld de zoekterm ‘zonne-energie’ invoert, vindt Virage ook bestanden die het onderwerp ‘groene stroom’ behandelen. Leon Huijbers, hoofd Aula Congrescentrum & Multimedia Services aan de TU Delft, is blij met Virage. ‘Het programma biedt twee grote voordelen. Het voegt zelf metadata toe aan opnames van colleges. Dat voorkomt dat de docenten zelf hun content moeten indexeren. Daarnaast is het voor studenten een efficiënt systeem omdat ze snel de juiste informatie vinden.’ Huijbers wil Virage op den duur koppelen aan een ander zoeksysteem van Autonomy, IDOL. ‘We willen ook samenwerken met de bibliotheek. Als je een zoekwoord in Collegerama ingeeft, kun je in de toekomst niet alleen een opname van een college over dat onderwerp bekijken. Je krijgt dan ook passages uit relevante boeken en collegedictaten te zien.’”

Het genoemde webcollegesysteem is te bezoeken door middel van de volgende link:

Zoals in het artikel is weergegeven maakt de TU Delft gebruik van geavanceerde indexeermogelijkheden. Zij zien het snel vinden van de benodigde informatie als een belangrijke reden om te investeren in zulke software. Men kan ervan uitgaan dat de eerder genoemde instellingen/bedrijven ook gebruik maken van een geavanceerd hulpmiddel als Virage om hun videobestanden te ontsluiten en terug te vinden. Toch zijn veel instellingen/bedrijven niet vrijgevig wat betreft informatie over geavanceerde programmatuur die ze gebruiken. Het is zodoende moeilijk te achterhalen waarvan iedereen gebruik maakt. Maar dat ze geavanceerde technieken gebruiken als de vrij toegankelijke sites als Youtube.com moge duidelijk zijn.

[bewerk] Conclusie

Er zijn heden ten dage vele internetsites te vinden die de mogelijkheid bieden om geheel gratis videobestanden op de site te plaatsen en deze te kunnen bekijken. Deze openlijk toegankelijke diensten maken nagenoeg allemaal gebruik van de ontsluitingsmethode door middel van tekstuele informatie. Inhoudelijk gezien worden de filmbestanden niet geanalyseerd, of door andere methoden ontsloten. Grote commerciële instellingen maken daarentegen in sommige gevallen wel gebruik van geavanceerdere technieken. Een voorbeeld hiervan is de TU Delft die sinds kort gebruik maakt van het softwarepakket Virage voor het automatisch toekennen van relevante metadata aan het bestand. Dit pakket voert een inhoudelijke analyse uit op het filmbestand en kan de inhoud ervan zodoende ook in de juiste context plaatsen.

[bewerk] Externe informatie

Inhoudelijk toegankelijk maken van informatiecollecties in een digitale omgeving
Auteur: Eric Sieverts
URL: http://www.library.uu.nl/medew/it/eric/ontsluiting-2007.pdf
Formaat: PDF Taal: Nederlands Datum aanmaak: Februari 2007 Datum wijziging: Onbekend
Trefwoorden: Folksonomy; tags; videobestanden; uploaden
Motivatie: Dhr. Sieverts maakt in zijn stuk de werking van het handmatig toekennen van ‘tags’ aan videobestanden duidelijk en legt uit hoe deze op den duur een eigen folksonomy gaan vormen.


YouTube – Broadcast Yourself -
Auteur: YouTube.com
URL: http://youtube.com/
Formaat: WWW Taal: Engels Datum aanmaak: Onbekend Datum wijziging: Onbekend
Trefwoorden: YouTube; praktijkvoorbeeld; werking van zoekmachine
Motivatie: Een van de bekendste pagina’s voor de plaatsing van video’s van deze tijd. Iedereen heeft de mogelijkheid om zelf videobestanden te uploaden. Door gebruik te maken van de zoekmachine is achterhaald op welke wijze deze zijn recalls produceert.


Altavista Video
Auteur: Altavista
URL: http://nl.altavista.com/video/default
Formaat: WWW Taal: Nederlands Datum aanmaak: Onbekend Datum wijziging: Onbekend
Trefwoorden: Altavista video; multimedia zoekmachine
Motivatie: Om de exacte werking van Altavista video te achterhalen is veelvuldig gebruik gemaakt van de site zelf. Door zoekacties uit te voeren wordt bekend op welke wijze deze aan z’n recalls komt.

Aslingerland 6 jun 2007 15:48 (CEST)

Aspecten/acties
Persoonlijke instellingen
content beleid
About us