hans.kaashoek

De inhoud bepaalt de waarde

Blogpost aangemaakt door hans.kaashoek Moderator op 5-feb-2018

Het grote verschil tussen gestructureerde en ongestructureerde informatie is dat je van de eerste direct kan zien wat het is en wat de “waarde” ervan is. Bij de tweede ligt de werkelijke waarde vaak verborgen in de inhoud.

Gestructureerde informatie (data en tekstgegevens) kun je direct lezen en heeft een concrete waarde. Door gegevens binnen de context van een applicatie te brengen wordt de waarde ervan nog concreter en wordt ook de relatieve waarde ten opzichte van andere gegevens duidelijk. 100 is in absolute waarde 100, maar in betekenis gering als de naast volgende waarde in een serie 10.000 is. Gestructureerde informatie kun je sorteren op waarde, analyseren en eenvoudig in relatie brengen tot andere informatie elementen. Business Intelligence en Big data analyse tooling maakt hier dankbaar gebruik van.

Ongestructureerd
Hoe anders is het met de waardebepaling van ongestructureerde informatie. Allereerst staat deze informatie als individuele bestanden ergens in een opslag of beheeromgeving. Afhankelijk van de opslagomgeving kun je zien wat voor objecttype het is, zijn omvang, de titel en mogelijk wat aanvullende gegevensvelden zoals creatiedatum, eigenaar en laatst gebruikt. Ook de plaats van het object binnen de beheeromgeving kan enige informatie geven over de aard van het object. Maar het zijn nog steeds om- of beschrijvende gegevens over het object zelf. Mogelijke informatie over de inhoud van het object kan worden verkregen uit aanvullende metadata of indexvelden. Als deze velden tenminste zijn gedefinieerd en zinvol zijn ingevuld. Iets dat door de gebruiker niet altijd als een plezierige taak werd en wordt ervaren. Nieuwe beheersoplossingen helpen de gebruiker bij het opslaan van nieuwe informatie met suggesties bij het invullen van deze velden. Ze  “kijken mee” naar de aktiviteiten in het werkproces, de rol van de gebruiker en deels ook naar de meest voorkomende woorden in het object. Een volledige automatische analyse en registratie komt ook steeds vaker voor. Informatie wordt zo vollediger en met een bedrijfstaxonomie geregistreerd, gegroepeerd als het gaat om soortgelijke informatie en overeenkomstig de waarde voor langere termijn veiliggesteld. Dit vermindert werk en willekeur van de eindgebruiker en verbetert de terugvindbaarheid van een object, het bonnetje, de bezwaarbrief of de beleidsnota.

Oude bestanden
Maar wat te doen met de reeds aanwezige, oude en vaak slecht geregistreerde files en bestanden in een organisatie? Een beetje organisatie heeft er miljoenen op diverse Fileshare locaties staan. Oudere beheeroplossingen bieden slechts een digitale weergave van de oorspronkelijke fysieke file/folder opslagstructuur in plaats van een metadate gebaseerde ontsluiting. Ook in modernere document- of contentmanagementoplossingen is de inhoud en zo de bedrijfswaarde of risico van de opgeslagen objecten niet tot nauwelijks te bepalen. Dit door niet of foutief ingevulde velden, verschillende in terminologie of het gebruik van de velden voor andere informatie. Alleen afgaan op hoe het oude object is ontsloten maakt de integratie in één bedrijfsinformatiehuishouding risicovol. Enerzijds vanwege het zoekresultaat-overload door de presentatie van alle mogelijke objecten en anderzijds omdat de werkelijke inhoud en waarde daarvan niet bekend is. Dat laatste geeft een reële kans op het niet tonen van wel aanwezige en relevante informatie. Als een cruciale bedrijf- of klantbeslissing op onvolledige informatie wordt genomen kunnen de gevolgen, bij nadere analyse, ingrijpend zijn. Weten wat de werkelijke inhoud en waarde van de bestaande objecten en bestanden voor de bedrijfsvoering is, is meer dan alleen een technisch linkje leggen naar de objecten op basis van de leesbare kenmerken. Een goede inhoudelijke analyse van wat er echt in het object staat en een daarop gebaseerde classificatie en ontsluiting maakt van een oude bestand een waardevol informatie-object.

Resultaten