navigatie overslaan
Alle plaatsen > Information & Process > Blog > 2018 > februari > 05

Ervaart u ook enige jalousie als u door de verkoopbrochure van een huis bladert? Alles functioneel ingericht, mooi strak geordend, geen rommel en je zou er zo in kunnen gaan wonen. Er zijn mensen die bewust vaak verhuizen om zo de aanwas van niet meer noodzakelijke spullen beperken. Dit terwijl ze iedere keer weer een iets groter huis kopen. Automatiseringsafdelingen laten de systeemomgeving en de gegevensverzamelingen maar wat graag (mee)groeien met de nieuwe vereisten van de onderneming. Iedere keer weer een maatje groter en meer functies. Maar het ordenen en opruimen van de reeds aanwezige informatie is niet hun sterkste eigenschap. Een activiteit die door de explosief groeiende informatiemassa zo nu en dan hard nodig is.

Bij een verhuizing worden letterlijk alle kasten en laden opengetrokken en wordt alles wat daarin zit minimaal één keer geanalyseerd. Bij het uitruimen wordt bepaald wat de emotionele of fysieke waarde is en of het behouden moet blijven. Blijft het behouden dan wordt bepaald waar het object in de nieuwe omgeving komt te staan en welke functie het daar krijgt. Objecten die niet op waarde kunnen worden geschat, worden of weggedaan of tijdelijk elders opgeslagen. Bij het uitpakken van de verhuisdozen vindt een tweede waardebepaling plaats. Voldoet het zoals voorgesteld of krijgt het bij nader inzien toch een andere bestemming. Hoe anders gaat het bij de vernieuwing van applicaties. De selectie van de nieuwe functionaliteit en daarbij behorende gebruiksmogelijkheden krijgt alle aandacht. De nieuwe technische en functionele vereisten van de onderneming, nu en in de toekomst, moeten perfect ondersteund worden. Actualisering van de inhoud van de applicatie is daarbij vaak een onderbelicht element. De gestructureerde data wordt met de ETL-aanpak (Extractie, Transformatie en Laden) aangepast en overgezet. Schoning en actualisering wordt niet tot zelden gedaan. Ongestuctureerde content in  fileshares, sharepoint sites of ECM systemen wordt vaak, als een last minute projectactie, één op één overgezet van de oude naar de nieuwe omgeving. Een van de redenen dat een goede analyse van de betekenis en waarde van deze content achterwegen blijft heeft te maken met het eigenaarschap. Ongestructureerde content wordt doorgaans door medewerkers op zelf te kiezen locaties opgeslagen. Dit met zelfgekozen ontsluitingskenmerken en op basis van een eigen ordening. Is de content oud, is medewerkers niet meer in dienst, de afdeling gereorganiseerd of opgeheven dan durft niemand zijn vingers te branden aan de opruiming van deze content. Opslagsystemen worden steeds goedkoper dus het as-is overzetten is financieel geen probleem. Een alternatief is het op read-only zetten van de oude verzameling en alleen de echt  gevraagde content on-demand overzetten. Als men na verloop van tijd nog weet wat daar staat!

Wat bij het as-is overzetten een probleem geeft, is de toegang en het gebruik van de content in de nieuwe omgeving. Nieuwe softwarefuncties komen niet tot hun recht omdat de benodigde registratiekenmerken onvolledig zijn of ontbreken. Het overzetten van dubbele, verouderde of niet meer relevante content vertroebelt de kwaliteit en werkbaarheid van de informatie. De presentatie van relevante objecten betreffende een zaak is onvolledig omdat geen uniforme metadatakenmerken en structuur is toegepast. Dit laatste geeft een bottleneck bij de ondersteuning van cusomerselfservice applicaties. De klant, als buitenstaander, wil direct de juiste en volledige informatie tot zijn beschikking hebben om te voorkomen dat hij/zij bij het uitvoeren van een transactie gefrustreerd raakt en afhaakt.

Als een onderneming inzet op de digitalisering van haar processen en klantinteractie en investeert in nieuwe systemen en applicaties (het nieuwe huis) zal ook terdege aandacht moeten worden besteed aan de kwaliteit, juistheid en actualiteit van de informatie (de inrichting). Dit vraagt serieuze voorbereiding en projectresources. Met het resultaat, een opgeruimd, geactualiseerd, functioneel ingericht en direct inzetbare informatiehuishouding kan de onderneming weer jaren vooruit.

Het grote verschil tussen gestructureerde en ongestructureerde informatie is dat je van de eerste direct kan zien wat het is en wat de “waarde” ervan is. Bij de tweede ligt de werkelijke waarde vaak verborgen in de inhoud.

Gestructureerde informatie (data en tekstgegevens) kun je direct lezen en heeft een concrete waarde. Door gegevens binnen de context van een applicatie te brengen wordt de waarde ervan nog concreter en wordt ook de relatieve waarde ten opzichte van andere gegevens duidelijk. 100 is in absolute waarde 100, maar in betekenis gering als de naast volgende waarde in een serie 10.000 is. Gestructureerde informatie kun je sorteren op waarde, analyseren en eenvoudig in relatie brengen tot andere informatie elementen. Business Intelligence en Big data analyse tooling maakt hier dankbaar gebruik van.

Ongestructureerd
Hoe anders is het met de waardebepaling van ongestructureerde informatie. Allereerst staat deze informatie als individuele bestanden ergens in een opslag of beheeromgeving. Afhankelijk van de opslagomgeving kun je zien wat voor objecttype het is, zijn omvang, de titel en mogelijk wat aanvullende gegevensvelden zoals creatiedatum, eigenaar en laatst gebruikt. Ook de plaats van het object binnen de beheeromgeving kan enige informatie geven over de aard van het object. Maar het zijn nog steeds om- of beschrijvende gegevens over het object zelf. Mogelijke informatie over de inhoud van het object kan worden verkregen uit aanvullende metadata of indexvelden. Als deze velden tenminste zijn gedefinieerd en zinvol zijn ingevuld. Iets dat door de gebruiker niet altijd als een plezierige taak werd en wordt ervaren. Nieuwe beheersoplossingen helpen de gebruiker bij het opslaan van nieuwe informatie met suggesties bij het invullen van deze velden. Ze  “kijken mee” naar de aktiviteiten in het werkproces, de rol van de gebruiker en deels ook naar de meest voorkomende woorden in het object. Een volledige automatische analyse en registratie komt ook steeds vaker voor. Informatie wordt zo vollediger en met een bedrijfstaxonomie geregistreerd, gegroepeerd als het gaat om soortgelijke informatie en overeenkomstig de waarde voor langere termijn veiliggesteld. Dit vermindert werk en willekeur van de eindgebruiker en verbetert de terugvindbaarheid van een object, het bonnetje, de bezwaarbrief of de beleidsnota.

Oude bestanden
Maar wat te doen met de reeds aanwezige, oude en vaak slecht geregistreerde files en bestanden in een organisatie? Een beetje organisatie heeft er miljoenen op diverse Fileshare locaties staan. Oudere beheeroplossingen bieden slechts een digitale weergave van de oorspronkelijke fysieke file/folder opslagstructuur in plaats van een metadate gebaseerde ontsluiting. Ook in modernere document- of contentmanagementoplossingen is de inhoud en zo de bedrijfswaarde of risico van de opgeslagen objecten niet tot nauwelijks te bepalen. Dit door niet of foutief ingevulde velden, verschillende in terminologie of het gebruik van de velden voor andere informatie. Alleen afgaan op hoe het oude object is ontsloten maakt de integratie in één bedrijfsinformatiehuishouding risicovol. Enerzijds vanwege het zoekresultaat-overload door de presentatie van alle mogelijke objecten en anderzijds omdat de werkelijke inhoud en waarde daarvan niet bekend is. Dat laatste geeft een reële kans op het niet tonen van wel aanwezige en relevante informatie. Als een cruciale bedrijf- of klantbeslissing op onvolledige informatie wordt genomen kunnen de gevolgen, bij nadere analyse, ingrijpend zijn. Weten wat de werkelijke inhoud en waarde van de bestaande objecten en bestanden voor de bedrijfsvoering is, is meer dan alleen een technisch linkje leggen naar de objecten op basis van de leesbare kenmerken. Een goede inhoudelijke analyse van wat er echt in het object staat en een daarop gebaseerde classificatie en ontsluiting maakt van een oude bestand een waardevol informatie-object.