Op donderdag 29 januari werd er bij CB in Culemborg de Metadatadag gehouden, waarop het boekenvak werd bijgepraat over de stand van zaken op dit gebied. Sprekers waren Erik-Jan Bulthuis, Emiel van Bockel en Matthijs Suidman (CB) en Jacqueline Remmers (VBK), Marc Barteling (Why I love this Book), Sander Verheijen (Hebban) en Johan Stapel (KB). De presentaties zijn hier te vinden.
De metadatadag is een beetje het kleine zusje van het E-book Event, dat inmiddels op een enorme toeloop kan rekenen. Hoewel CB haar best doet de dag ook interessant te maken voor het hele boekenvak, waren vrijwel alle aanwezigen op een of andere manier betrokken bij het werken met metadata.
Dat is jammer, want een goed begrip van wat metadata is en vooral hoe belangrijk het is geworden voor het boekenvak is noodzakelijk om een goed beeld te kunnen krijgen van waar we als vak naartoe gaan en van wat de digitalisering van het boekenvak nu werkelijk betekent. Vandaar dat ik graag wil beginnen met een kleine uitleggerige omweg voor ik toekom aan wat er op die dag besproken is.
Distributie
In de discussies over het wel en wee van het boekenvak en de crisis waarin het al een aantal jaren verkeerd wordt veel gesproken over het veranderende gedrag van de consument en over de digitale innovatie van uitgeverijen en boekhandel – of het gebrek daaraan – en horen we nauwelijks iets over die andere belangrijke pilaar van het boekenvak: de distributie.
Er wordt vaak vergeten dat als we het hebben over de digitalisering van het boekenvak, dat het dan niet alleen gaat over digitale producten en de platforms waar die gekocht en gelezen kunnen worden. De manier waarop we de boeken maken en distribueren heeft een minstens zo grote ontwikkeling doorgemaakt, zowel print als digitaal. Deze technologische ontwikkeling is niet erg zichtbaar, omdat het zich letterlijk achter de schermen afspeelt.
Metadata
Ik heb het natuurlijk over metadata. De definitie van metadata is eenvoudig: het omvat alle denkbare informatie over een boek behalve de tekst zelf, die het boek identificeerbaar en verkoopbaar maakt. Typische metadata zijn auteursnaam, serienaam, prijs, aantal pagina’s, omvang, omslag, auteursfoto, isbn, druk en prijs.
Dit soort data kunnen we zien als de absolute basisbenodigdheden die absoluut noodzakelijk zijn om het boek correct in alle databases weer te geven en alle titels en versies van dezelfde titels van elkaar te kunnen onderscheiden. We gebruiken de term echter ook voor andersoortige data die meer vertellen over het boek, maar die niet tot de essentiële gegevens behoren, zoals recensies en auteursfilmpjes. Deze gegevens duiden we met de term verrijkte metadata.
Distributie
Metadata speelt een essentiële rol bij de effectieve distributie van een boek. Het zorgt ervoor dat de juiste boeken aan het juiste adres geleverd worden, dat de administratie rond elke titel correct en volledig is, dat de prijs overal correct wordt doorgevoerd, bestellingen goed verlopen en dat de leverdata bij iedereen bekend zijn. De hele boekenketen is gebouwd op een foutloze uitwisseling van metadata.
Metadata is dus altijd al belangrijk geweest, maar voor de digitalisering had het nooit zo’n haast. De invoer was veelal handwerk en foutjes losten zich uiteindelijk met een telefoontje wel op. De groei van online winkelen heeft hier echter een grote invloed op gehad.
Op de eerste plaats, de uitwisseling van metadata tussen de ontelbare systemen die inmiddels het online landschap bepalen is vrijwel geheel geautomatiseerd. Dat betekent dat er geen marge meer is om fouten te corrigeren en dat de druk om alle data steeds eerder en foutloos beschikbaar te hebben steeds verder toeneemt.
Op de tweede plaats, met de explosieve groei van online winkelen is de consument ook steeds meer gebruik gaan maken van zoekmachines om te vinden wat ze zoeken, zowel binnen een winkelomgeving als daarbuiten via google. De vindbaarheid van een boek online is afhankelijk van de kwaliteit van de metadata.
Search versus browsing
Het belang van goede metadata is dus groot en groeiende. Wat dat betreft is het heel goed dat het CB een speciale dag organiseert rondom metadata. Het grote probleem van het onderwerp is echter dat het een zeer technische inslag heeft en dat het niet eenvoudig is om inzichtelijk te maken hoe belangrijk het is.
In dat opzicht sprong de presentatie van Jacqueline Remmers er uit, in die zin dat de cijfers die ze bijeen had gezocht voor eens en altijd duidelijk maakten dat er een rechtstreeks verband bestaat tussen deugdelijke metadata en verkoop.
Zo blijkt uit cijfers van Bol.com dat de aanwezigheid van een omslag leidt tot 400% meer verkoop (vs geen omslag) en dat ook de aanwezigheid van reviews (+15%) en een inkijkexemplaar (+8%) meer verkoop genereert.
Maar het interessante komt nu. Cijfers van het CB laten zien dat dit effect ook waargenomen kan worden in de fysieke boekhandel: de aanwezigheid van een omslag en een flaptekst betekenen respectievelijk 57% en 26% meer verkoop.
De conclusie die hieruit getrokken kan worden ligt voor de hand: goede en volledige metadata zorgt voor meer verkopen. Ik was met name verheugd om deze cijfers nu eens op een rijtje te zien omdat veel mensen in het boekenvak dit verband nog altijd niet wensen te geloven.
Een tweede conclusie die we hier kunnen trekken is dat zelfs de consumenten die hun boek kopen in de boekhandel, hun voorbereiding online doen – want daar komt het effect van metadata op de offline verkoop van boeken vandaan. Het onderstreept het belang dat online search inmiddels heeft, een belang dat aangetoond van cijfers die door Bol zijn vrijgegeven: 90% van het verkopen komen voort uit search en slechts 10% uit browsing.
Communities
Het is daarmee ook duidelijk dat de aard van de metadata verschuift. Het is niet langer een setje gegevens dat bij een boek hoort, het is een volwaardig communicatiemiddel geworden dat er voor zorgt dat we direct op meerdere niveaus met de lezer kunnen communiceren. Of zoals Remmers het uitdrukt, de aard van metadata is verschoven van bijproduct naar volwaardig informatietype met eigen regels. Je zou bijna kunnen zeggen dat het een social media kanaal geworden is, en eentje die veel meer effect op de verkoop heeft dan Twitter of Facebook.
Een community als Hebban – het Goodreads van de Lage Landen – is eigenlijk een goed vormgegeven metadatakanaal. Het laat mensen hun eigen boekenplankjes aanleggen, hun favorieten bepalen en recensies schrijven. Het genereert, in de woorden van general manager Sander Verheijen, lijstjes, lijstjes en nog eens lijstjes. Het is een platform dat gebruik maakt van de metadata die uitgevers aanleveren om deze vervolgens te verrijken met nog meer user generated data, die door uitgevers weer gebruikt kunnen worden om hun boeken te verkopen.
Hoe effectief een dergelijke community in Nederland wordt valt nog te bezien – Verheijen zelf verwacht de komende twee jaar nog geen winst te maken. Wellicht is hun strategie eerder gericht op het vinden van een profijtelijke exit, want de plannen om geld te verdienen overtuigden me niet. Maar dat wil niet zeggen dat het platform zelf geen waardevolle data genereert – dat doet het. Daarover kan met 450.000+ unieke bezoekers sinds juni 2014 en meer dan 30.000 geregistreerde gebruikers geen twijfel over bestaan.
Geld leren verdienen
Het is uiteindelijk aan uitgevers en retailers – zij die de boeken verkopen – om communities als Hebban te leren gebruiken. Dat geldt ook voor het werk van een van de andere sprekers, Marc Barteling van Why I love this book. Dit is een start-up waar je filmpjes kunt vinden van mensen die kort uitleggen waarom ze een bepaald boek goed vinden.
Als je het voor het eerst hoort denk je meteen, wat een interessant concept. Het is heel aanstekelijk om mensen heel enthousiast te horen vertellen over een boek dat ze goed vinden, zeker als de verteller een beroemdheid is zoals Stephen Fry. Toch komt uiteindelijk ook hier de gedachte op dat het moeilijk gaat zijn dit te gelde te maken. De meer dan 750 filmpjes die inmiddels op het platform te vinden zijn, zijn zonder twijfel uitermate waardevol, maar dan vooral voor de verrijking van al bestaande metadata of voor een heel gerichte marketingcampagne.
Het hielp ook niet dat Marc zelf geen enkele grip leek te hebben op zijn eigen metadata en de meest elementaire vragen over zijn initiatief – zoals: wat is de verhouding Engelse en Nederlandse boeken – niet wist te beantwoorden.
NSTC
Erik-Jan Bulthuis kondigde de komst van het NSTC aan, wat we een soort “super-isbn” zouden kunnen noemen. Het NSTC is een code die zal worden gegeven aan een bepaalde titel en waaraan alle versies en varianten van die titel gekoppeld kunnen worden. Dit betekent dat als de consument op deze titel zoekt, alle relevante versies van deze titel automatisch zullen worden getoond: de paperback, de hardcover, het luisterboek, de low price editie, alles met actuele beschikbaarheidinformatie en prijs.
Dit zal vooral heuglijk nieuws zijn voor de e-tailers, die hiermee hun zoekresultaten – en daarmee dus hun verkopen – sterk kunnen verbeteren. Want hoe vollediger de consument bediend kan worden, hoe beter dat is voor de verkoop.
CB Online
Daarnaast was er de mededeling dat CB Online de komende maanden aan een uitputtend usability-onderzoek zal worden onderworpen en dat de resultaten hiervan meegenomen zullen worden in een uitgebreide herziening van de site. Wat inmiddels ook wel nodig is.
Zoals hierboven beschreven, de eisen die inmiddels gesteld worden aan onze metadata en dus ook aan de databases waar we mee werken zijn dusdanig gestegen dat CB Online in de huidige vorm al een tijdje niet meer voldoet. Het is een klassiek voorbeeld van een systeem dat organisch gegroeid is de afgelopen jaren, waar functies en velden aan geplakt zijn op het moment dat het nodig was waardoor het geheel zo ondoorzichtig en complex is geworden dat een grondige herziening noodzakelijk is.
Geautomatiseerd handwerk
Een van de hardnekkigste misverstanden over metadata is dat het alleen maar over technologie gaat. En dat is in zekere zin ook zo. Johan Stapels overzicht van de diverse datastromen tussen de uitgevers, CB en de diverse bibliotheekorganisaties laat zien dat metadata vooral een kwestie is geworden van grotendeels geautomatiseerde systemen die de diverse catalogi in stand houden en daarmee de transacties van meer dan 30 miljoen uitleenbare materialen bijhouden. Stapel demonstreerde hoe een zorgvuldig bijgehouden metadatabestand kan leiden tot goede zoekresultaten die precies laten zien wat de zoeker zocht.
Hoe goed de geautomatiseerde systemen ook zijn, als de invoer niet goed is, zijn ook de zoekresultaten onder de maat. Het belang van het invoeren van data wordt nog steeds door de meeste uitgeverijen onderschat en is in mijn ervaring de belangrijkste reden dat de metadata van boeken nog steeds verre van optimaal is.
Het invoeren van metadata is nooit helemaal te automatiseren. Daarvoor zijn er binnen een uitgeverij te veel afdelingen en te veel mensen die betrokken zijn bij het genereren en het invoeren van data.
Hoeveel moeite het CB ook doet, het is uiteindelijk binnen de uitgeverij zelf dat het besef moet doordringen hoe belangrijk het is om zuivere metadata op te leveren. Dat heeft te maken met invoerdiscipline, maar vooral met kennis. Want als je weet hoe belangrijk het is en welk effect het heeft, komt de discipline uiteindelijk vanzelf wel.
Als er een onderwerp is dat ik gemist heb op de Metadatadag, dan is het dus dit: de rol van data-invoer in de organisatie. Iets voor de volgende keer dus.
Deze tekst verscheen eerder als gastblog op het Vakblog van Raymond Snijders: http://rsnijders.info/vakblog/. Een bezoekje waard.