Geo-visualisatie/Inleiding GIS: verschil tussen versies

Verwijderde inhoud Toegevoegde inhoud
Nijeholt (overleg | bijdragen)
kGeen bewerkingssamenvatting
Nijeholt (overleg | bijdragen)
k redigeeracties / typefouten / taalfouten
Regel 39:
:# de meer gebruikelijke GIS-definities omvatten minimaal de dataware en de software
:# de meer beperkte definitie omvat alleen het aangeschafte software pakket.
Die laatste definitie is letterlijk (te) beperkt te noemen, omdat de software die de fabrikant levert niets kan zonder data en een logisch model (de gebruikelijkere definities) en iemand die het GIS kan bedienen met de juiste GIS-tools (de bredere definities).
 
Merk op dat de werkelijkheid niet tot een GIS behoort, zoals dat met geen enkel informatiesysteem het geval zal kunnen zijn. In de module [[Geo-visualisatie/Communicatie|Communicatie]] zal hier verder op worden ingegaan, omdat daardoor kennis over het datamodel onontbeerlijk is. Conclusies over de werkelijkheid kunnen alléén getrokken worden indien men weet welk datamodel (met alle beperkinigen van dien) gebruikt is om die werkelijkheid in een kaart / GIS te zetten.
 
==Wat kan met een GIS?==
Regel 49:
# '''Visualisatie''' van informatie die op een locatie betrekking heeft. Dit is de bekendste bijdrage van GIS.
# '''Analyses''' waarbij selecties van ruimtelijke objecten worden bepaald op basis van nabijheid, overlap of mogelijke verbindingen via een (wegen)netwerk van andere objecten.
# '''Berekeningen''' waarbij - geheel geautomatiseerd - aan objecten afstanden, gebiedsbeschrijvingen worden toegekend, op basis van nabijheid of overlap met andere gebieden. Dit is te zien als verrijking van informatie, en maakt het beheer van informatie door de beherende instantie daarvadaarvan vaak veel efficiënter.
# '''Planning en voorspelling'''. Bouwprojecten kunnen begeleid worden. Door kaarten van bodem, klimaat, helling, grondgebruik te combineren kan erosie voorspeld worden, en op basis van sociaal-economische thema's kunnen gunstigste locaties voor bedrijven, wegen, stations en natuurgebieden bepaald worden.
# Het '''beheer''' van geo-informatie. Dat wil zeggen, de totstandkoming van geo-informatie en wijzigingen daarna verwerken.
 
1 tot en met 4 zijn toepassingsmogelijkheden waarbij het GIS ook als zogenaamd 'decision support systeemsystem' (beleidsondersteunend systeem) wordt gebruikt.
 
 
Regel 81:
| [[Afbeelding:Orthogonal-convex-hull.svg|45px]]
| '''patroon'''
| 1)Welke relatie is er tussen de spoorlijn Zwolle - Amersfoort en de A28? 2). Welke ufo-meldingen liggen in de provincie Utrecht?
| 1) Door beide wegen te selecteren, kunnen onder andere de locaties berekend worden waar ze elkaar kruisen: Ze kruisen elkaar drie keer, bij Nijkerkerveen, Harderwijk en Nunspeet. En ze liggen maximaal 8,4 kilometer uit elkaar. 2) Door kaart locaties van ufo-meldingen over de provincie Utrecht te zetten, worden automatisch die meldingen geselecteerd in een lijst en op de kaart.
|-
Regel 102:
:*In de figuur hierboven is te zien van hoe data-lagen in een GIS of GIS-model opgenomen zijn. Tezamen vormen ze een kaart. De informatie (lees: objecten) uit de datalagen wordt op het scherm getekend in een bepaalde volgorde; van onder naar boven.
:*Bij '''kaart A''' kan de gemeente zien welke leidingsoort waar ligt en in welke straten lantaarns zijn.
:*Bij '''kaart B''' is - dankzij een legendawijziging waarbij de data zelf niet wijzigt - te zien welke leidingen wanneer vervangen dienen te worden. De kleur staat plotseling niet meer voor een leidingsoort, maar voor een jaartal. De onderste kaartlaag - in dit voorbeeld bij kaart A en B: 'percelen' - wordt dus het eerst getekend. Datalagen met vlakken, zoals percelen, staan daarom vrijwel zonder uitzondering onderaan, lijnen daar boven en data-lagen met punten staan daar weer boven. Anders zouden de datalagen (vaak thema's of - foutief - kaartlagen genoemd) met vlakken de symbolen bedekken en onzichtbaar maken.
:* Dit laatste is te zien in '''kaart C'''. Leuk detail: merk op dat in het GIS-model de ondergrondse leidingen 'boven' de percelen liggen... Zonder deze 'truc' - lees: zonder de werkelijkheid 'geweld aan te doen' - zouden ondergrondse leidingen nooit gevisualiseerd kunnen worden.
 
Regel 108:
 
'''Ad Analyses:'''<br />
:*'''Kaart D''': Wanneer een leiding vervangen moet worden, is het handig - voor het op de hoogte stellen van de betrokken bewoners - om te weten welke percelen hiermee gemoeid zijn. De betrokken percelen kunnen (per jaar of per leidingsoort) berekend worden. Met een GIS (lees: door het weten van de locaties van zowel de percelen als de leidingen) kunnen dergelijke zaken vrijwel met één druk op de knop gevisualiseerd en berekend worden. Zonder een GIS had de gemeente alle percelen aan alle leidingen moeten koppelen, bijvoorbeeld in een relationele database. Dat was veel kostbeerderkostbaarder en lastiger te beheren geweest.
:*'''Kaart E''': van één perceel kan automatisch berekend worden welke soort objecten (hier: leidingen) er onder liggen. Dat kunnen er meerdere zijn, één, of géén. Ook dat laatste is een antwoord!
 
'''Ad Berekeningen:'''<br />
:* '''Kaart F''': Wanneer de gemaakte analyses worden weggeschreven in de database (bij de geo-informatie wordt opgeslagen) is sprake van verrijking van data. Bij kaart F is de datalaag 'wijken' over de eerder getoonde kaart 'heengelegdheen gelegd'. Met één 'druk op de knop' zijn alle percelen uit de database aangevuld met het 'attribuut' (kenmerk) "wijknummer". De GIS bespaart op deze wijze veel invoertijd bij de beheerders en de kans op fouten neemt af.
:* '''Kaart G''': Hier is te zien hoe percelen worden geselecteerd die binnen 50 meter van lantaarnpalen liggen. Wanneer hier bijvoorbeeld onderhoud bij moet worden gepleegd, of de kleur verandert van wit naar neon, dan zijn die omwonenden 'met een druk op de knop' bekend, zonder handmatige berekeningen.
 
Regel 119:
 
'''Ad planning en voorspelling''': <br />[[Afbeelding:Gis-en-kaartopmaak-inhoudsopgve.PNG|thumb|right|40px]]
:*In de inleiding van dit handboek is eerder getoond hoe bepaald kan worden hoe varianten van een nieuwe weg om en dorp berekend kunnen worden (klik eventueel op de figuur rechts). De GISspecialisten (vaak van ingenieursbureau'singenieursbureaus) gebruiken daartoe hellingkaarten, kaarten met juridische beperkingen, en natuurwaardekaarten om te bepalen welke wegen en varianten mogelijk zijn, en wat de varianten kosten qua natuuropoffering en qua geld. Milieueffectrapportages zijn hier een mooi voorbeeld van. Als het gaat om voorspelling: hoe snel en waar een polder het eerst onderloopt is te bepalen met een GIS, waardoor een evacuatieplan beter kan worden geoptimaliseerd. Ook erosie in Limburg kan zo goed worden voorspeld.
 
Dit zijn voorbeelden van een aantal zeer gangbare functionaliteiten van GIS-software. De werkelijke mogelijkheden zijn véél groter. GIS als software bestaat als sinds de 80-er jaren. De ontwikkelingen zijn met name sinds 1990 zeer hard gegaan, en zijn betaalbaar geworden. Op het gebied van beheer, 3D-visualisatie, geo-statistiek, geo-coderen, cartografie, geo-processing, netwerk-analyses zijn de functionaliteiten zeer breed en specialistisch te noemen.
Regel 127:
:* incidentmanagement, risicomanagement en risicokartering
:* marketing en verzekering; zie bijvoorbeeld [http://www.mappinganalytics.com/gallery.html markt-potentie-kaarten-VS] en [http://www.geo-info.nl/site/Components/FileCP/Download.aspx?id=8451a17e-ffb1-4b01-abf7-6780928c0bd5 Geomarketing in het Openbaar Vervoer in Limburg].
:* mobiele toepassingen (inwinning geo-informatie, politietaken, periodiek inspecteren van van objecten (schouwen))
 
<small>[[Afbeelding:Crystal package settings.png|16px]] Aan deze module wordt nog (heel beperkt) gewerkt! Voor statusinformatie zie [[Geo-visualisatie|startpagina]]</small>:
Regel 135:
 
==Wat is een GIS-model?==
Voordat er een kaart gemaakt kan worden heb je - zoals eerder opgemerkt - een GIS-model nodig. Simpel gezegd is een GIS-model een verzameling (kaart)gegevens, verkregen uit metingen of berekeningen, meestal van een beperkt gebied; geo-informatie.
 
GIS-modellen bestaan uit gestapelde, digitale lagen (geo-)informatie (datasets). De lagen liggen in één overeenkomstig assenstelsel. Elke laag bevat (de locaties) van objecten. Elke locatie of object is gelinkt aan een database met attribuut-informatie (in het figuur de Z-as). De 'Z'-as is in dit verband niet per definitie een 'hoogte'as, maar geeft - voor welke laag dan ook - de attribuutwaarde weer. Bijvoorbeeld de hoogte, het grondgebruik, de onderhoudstatus of de aanwezige of toekomstige infrastructuur. Op basis van overeenkomstige Z- en Y-waarden kunnen de Z-waarden in een model verder verwerkt of gebruikt worden. Het kunnen combineren van de kaartlagen geldt dus niet alleen voor het kaarten maken, maar ook voor verdere analyses. De attribuutwaarden zelf kunnen namelijk geherclassificeerd worden. Of ze kunnen samen met attribuutwaarden van andere lagen gecombineerd worden, door zogenaamde ruimtelijke analyses.
Regel 186:
:* Een punt(object) wordt voorgesteld door één coördinaat.
:* Een lijn bestaat uit minimaal twee met elkaar verbonden coördinaten. Zijn het er méér dan twee dan worden de tussenliggende coördinaten vertices genoemd. Hoe méér vertices, hoe nauwkeuriger de lijn kan worden opgeslagen; De omtrek van een provincie is met 100 punten te beschrijven, maar met 1000 punten is beter wanneer ook op gemeenteniveau moet worden ingezoomd.
:* Een vlak (ook wel een polygoon genoemd) bestaat uit een lijn waarvan het beginpunt gelijk is aan het eindpunt; alle coördinaten ertussen behoren tot dat vlak. Er kunnen ook vlakken met gaten en zogeheten multivlakken (multipolygonen) beschreven worden. Bij multivlakken wordt bijvoorbeeld de provincie Friesland als één object gedefinieerd, dus de vlakken van het vaste land en die van de eilanden worden als één object, een regel, opgeslagen. Dit heeft onder andere als voordeel dat de naam en de afkorting van de provincie niet voor elk onderdeel van zo'n vlak hoeft te worden opgeslagen en beheerd. Maar ook is het oppervlak van de gehele provincie met dat ene multivlak direct te berekenen in een GIS.
 
[[Image:Vector-raster-vector-conversie.PNG|thumb|right|280px|Voorbeeld van (onomkeerbare) conversies van vector- naar raster-data en weer terug.]]
Regel 192:
*Bij '''rasterdata''' worden objecten - onafhankelijk of het lijnen, punten of vlakken zijn - door attribuutwaarden op een (meestal) regelmatig grid (raster) opgeslagen.
:* Een rastercel wordt ook wel pixel genoemd, niet te verwarren met de pixels van een beeldscherm. Pixel is afgeleid van het Engelse 'picture element'.
:* Een object kan nooit nauwkeuriger dan de grootte van één pixel worden beschreven. Is een (punt-, lijn-, of vlak-) object kleiner dan een halve pixel, dan zal dit object niet worden beschreven, óf het object is bewust te groot afgebeeld. Een lijn bestaat uit meerdere losse pixels (zie de rivier in het middelste plaat rechts). Zoals het is opgeslagen is het geen lijn, slechts visueel is dit als lijn te herkennen, omdat de individueel opgeslagen 'lijn/rivier' pixels met dezelfde kleur zijn gevisualiseerd. Merk op dat in het voorbeeld de rivier ergens ook geen aangrenzende pixels kent!
:* In elke pixel wordt één of meerdere attributen gedefinieerd, zoals in het voorbeeld de grondgebruiksklasse. Elke pixelwaarde is onafhankelijk van waarde in de pixel daarnaast, en wordt dus ook onafhankelijk van de andere waarde opgeslagen. Rasterbestanden zijn dan ook vaak groter dan vectorbestanden, waarin de waarde van een groot vlak slechts één keer wordt opgeslagen.
:* In een GIS kunnen rasterbestanden alleen worden ingelezen als deze bestanden ook ruimtelijke context bevatten. Hierin staat meestal de celgrootte van het raster dat gebruikt is, bijvoorbeeld in meters, en de coördinaten van de linker onderhoek. Deze informatie kan in het bestand zelf staan, zoals bij een 'Geo-tiff'-bestand, of er buiten in een apart bestand worden opgeslagen, zoals bij een 'tif-bestand'. Die aparte bestanden worden soms ook world-files genoemd. Houdt dit in de gaten als je rasters aangeleverd krijgt. Zonder deze coördinaten kan je de rasterdata nooit (of zeer onnauwkeurig) op de juiste plek in je GIS / kaart krijgen.
Regel 203:
Rechtsboven een voorbeeld van hoe de kwaliteit van data achteruit kan gaan bij conversies. Hier betreft het eerst een 'vector-naar-raster' conversie, daarna een 'raster-naar-vector' conversie.
 
* Doordat bij de eerste conversie een grof grid is gebruikt, is de middelste rasterdata wellicht niet geschikt voor bepaalde gedetailleerde uitspraken.[[Image:geabios3d.jpg|framed|right|300px|Een digitaal hoogtemodel. Deze kent ook rasterpunten. Deze rasterpunten zijn niet twee- maar drie-dimensionaal deel, en heten daarom niet pixels (2D), maar voxels (3D). Zouden we hier ver op inzoomen, dan zouden we die zéér kleine kubusjes, allen met verschillende kleuren, en wel of niet met een hoogtelijn, kunnen zien.]]
* Het is ook mogelijk dat rasterdata geconverteerd wordt naar vectordata. Wanneer dat het geval is lijkt de nauwkeurigheid misschien groter geworden; er kan op worden ingezoomd zonder dat men de grootte van de originele cellen ziet. Merk op dat in dit voorbeeld de rastergrootte erg groot is, dat de rivier als vlak niet meer één gesloten vlak is en dat (veel detail bij de) bebouwing verdwenen is. Bij oppervlakte berekeningen van het bos zou een dergelijke kaart misschien nog voldoende zijn.
* Bij zowel raster- als vectordata is het ver kunnen inzoomen gelimiteerd. Bij ver inzoomen op rasterdata is de onnauwkeurigheid als snel te zien door de blokkerige structuur. Bij vectordata is de onnauwkeurigheid niet te zien: de objecten zijn in vlakken of lijnen.
* Er gaat altijd informatie verloren, deze kan beperkt worden bij een kleine celgrootte van het raster.
 
Hierboven hadden we het steeds over twee-dimensionale geo-informatie, waarin punten, lijnen en vlakken zowel als vectordata, als als rasterdata kunnen worden opgeslagen. Wanneer drie-dimensionale gegevens als raster worden opgeslagen, kan dat niet met 2-dimensionale (vierkante) vlakjes, maar moet dat met (rechthoekige) kubusjes. Sterk ingezoomingezoomd op zo'n model zal je die kubusjes ook kunnen zien. Deze kubusjes worden voxels genoemd. Voxels is een samentrekking van de twee Engelse woorden 'volume' en 'pixels'; oftweloftewel een 'pixel met een volume'. Je zal deze term en dergelijke bestanden alleen tegen komen als je veel met hoogtemodellen (zie ook de figuur) gaat werken. Niet alle GIS-software-pakketten kunnen met voxels werken.
 
<div style="background:#FFDAB9;">
Regel 252:
:* NB3: Met allerlei GIS-tools zijn deze tekortkomingen (want dat zijn slivers!) op te sporen, en soms ook gedeeltelijk automatisch te verwijderen binnen een bepaalde marge en - helaas - met een risico dat de data toch gewijzigd wordt waar je dat niet wilt. Ook kunnen deze fouten handmatig verbeterd worden. Beter is het om '''topologieregels''' in te voeren. Bijvoorbeeld: "een (gemeente)vlak dient over de gehele omtrek aangrenzend te zijn met een ander (gemeente)vlak (of zee)". Veel, duur en intensief correctiewerk wordt zo voorkomen en analyses zullen daarna betrouwbaar zijn en geen hiaten vertonen, zoals lantaarnpalen die niet aan een beheerder of gemeente worden toebedeeld!
:* NB4: Met allerlei '''snapping'''-tools kunnen - achteraf - of bij het tekenen zelf minieme over- en undershoots, dus ook slivers, voorkomen of verbeterd worden. Bij het gebruik van snapping tijdens het tekenen of wijzigen, wordt door het GIS-programma afgedwongen dat de punten goed worden geplaatst. Punten die je 'op zicht' ongeveer over een vertex (knikpunt) van een naburig vlak of lijn heen legt, komen zo ook daadwerkelijk exact op die ene vertex te liggen.
:* NB5: Meer over slivers, mergen, topologie en het nut van objectgeorriënteerdheidobjectgeoriënteerdheid, zie [[Geo-visualisatie/Vervolg GIS|Vervolg GIS]].)
 
<div style="background:#FFDAB9;">
[[Afbeelding:Leer meer.png|20px]] '''SAMENVATTING: '''Undershoots, overshoots en slivers zijn tekortkomingen in je geo-informatie-bestand, die vaak achteraf, bij wat verder inzoomen of bepaalde analyses, aan het licht komen. Erger is wanneer ze niet aan het licht komen. Voorkom deze tekortkomingen met GIS-tools als snapping en het instellen van topologieregels wanneer je bestanden zelf aanlegt of beheert. Krijg je gegevens van anderen, controleer dan dan of deze tekortkomingen er in voorkomen. Voor veel analyses is het namelijk zeer essentieel dat lijnen en vlakken objectgeorriënteerd zijn opgeslagen. Op kaarten kan het uiteraard ook zeer slordig staan.
</div>
 
Regel 292:
Over de kaart met steden en provinciehoofdsteden:
:* De eerste kaart, links, toont alle steden uit dit bestand (ongelabeld).
:* De tweede kaart toont zowel de labels als het symbool van provinciehoofdsteden anders dan de overige steden. Provinciehoofdsteden zijn bij het labellen apart ''geselecteerd'', en hebben een aparte tekstopmaakttekstopmaak gekregen (onderstreept en met hoofdletters). Dat betekent dat het dus niet nodig was een aparte kolom te maken waarin de steden met hoofdletters zijn geschreven.
:* De derde kaart, rechts, toont alléén de steden waarvan de attribuutwaarde 'Status' (uit in de kolom 'Status') 'provinciehoofdstad'. Hier is dus automatisch door het GIS-pakket ''geselecteerd'' in het bestand met álle steden.
 
In tegenstelling wat een beginnende GIS-ser of - eerder - een buitenstaander misschien zou verwachten, hoeven voor de drie kaarten die gemaakt zijn niet verschillende bestanden (één met hoofdsteden, één met alle steden, en misschien wel één met overige steden) te worden gemaakt. Het mag duidelijk zijn dat de opbouw van zo'n steden bestand moet aangepast zijn op basis van wat nodig is voor analyeseanalyse en kaarten maken. De exacte opbouw van zo'n GIS-bestand is een simpel voorbeeld van een GIS-model. Zonder over die opbouw vooraf goed (en eenmalig) na te denken, kan je later wel eens enorm veel moeite blijken te hebben met het maken van goede analyses en kaarten.
 
In de tweede en derde kaart lijkt het zo in de eenvoudige legenda die linksboven is getoond, dat er sprake is van een tweetal bestanden ('lagen') die worden aan- of uitgevinkt. In werkelijkheid verwijzen ze beide naar dezelfde data: het eerder genoemde bestand met álle steden. Hoe kan het dan zijn dat de laag 'provinciesteden' niet alle objecten/steden laat zien in de kaart, maar slechts die steden die ook echt provinciehoofdstad zijn?
Regel 314:
SELECT * FROM hetnederlandsestedenbestand WHERE [STATUS] = 'provinciehoofdstad'.
 
Dankzij deze 'select-statements' hoeven we niet twee aparte bestandebestanden te beheren; één met provinciehoofdsteden en een ander met de overige steden. Zonder select-statements en zonder bepaalde attribuutkolommen zou je nooit de toegevoegde waarde uit een GIS kunnen halen die er in zit. Door slim gebruik te maken van attribuutkolommen kunnen bestanden bij elkaar worden toegevoegd die voorheen misschien dubbel of separaat van elkaar zouden moeten worden bijgehouden. Dit zorgt voor minder werk en minder fouten aan de kant van het beheer.
 
<div style="background:#FFDAB9;">
Regel 327:
Uit bovenstaande paragrafen zal het nu duidelijk zijn waarom geo-informatie géén kaartlaag genoemd mag worden. Geo-informatie staat in dienst van een GIS-model. Een GIS-model om analyses of kaarten te maken. Een (digitaal gemaakte) kaart bestaat uit één of meer geo-informatie bestanden / datasets, die geheel of gedeeltelijk in een kaart gebruikt of getoond kunnen worden. Zo kan een GIS-data bestand 'topografie' ook gebruikt worden om op een kaart alleen straten weer te geven.
 
Een GIS beschrijft de werkelijkheid - voor zover de mens die al kan kennen - met allerlei beperkingen. Jij als GIS-specialist moet die altijd in het achterhoofd houden. Een GIS beschrijft niet de werkelijkheid. Dat komt omdat de geo-informatie die er in zit (vaak foutiefonterecht dus kaartlagen genoemd; datasets is beter) een gedwongen beperking van die werkelijkheid is.
 
Hier volgen een aantal van die eigenschappen, die beperkingen kunnen zijn.
Regel 413:
 
==Digitalisering (facultatief)==
Voor het maken van kaarten en analyses is dus geo-informatie nodig. Meestal hoeft een GIS-specialist als kaarten maker niet zozeer bij het totale totstandmakingsprocestotstandkomingsproces van geo-informatie stil te staan; de gegevens zijn vaak al aanwezig. Toch is het voor sommige GIS-specialisten - zeker als er geadviseerd dient te worden bij inkoop, digitaliseringstrajecten - om meer van digitalisering af te weten.
 
In het hoofdstuk hiervoor ([[Geo-visualisatie/Inleiding_GIS#Eigenschappen_van_geo-informatie|Eigenschappen van geo-informatie]]) is al besproken dat niet elke soort geo-informatie ''inhoudelijk gezien'' zomaar gebruikt kan worden. Bijvoorbeeld omdat de actualiteit, nauwkeurigheid of toepassingscontext niet in orde is. Voor een GIS-specialist is er echter nog een beperking of geo-informatie wel gebruikt kan worden. Dat is de manier van ''hoe het bestand modelmatig is opgebouwd en hoe het is opgeslagen''. Kort gezegd, de manier van digitaliseren. of de 'mate van' digitalisering. Niet elk digitaal bestand is namelijk geschikt voor goede toepassing in een GIS. Bijvoorbeeld: al is de kaart digitaal beschikbaar (zoals een gedetailleerde topografische (wegen)kaart van Nederland), als deze in een raster-formaat beschikbaar is kan je er lastig in meten en mee ontwerpen. Je kan deze niet / nauwelijks geautomatiseerd analyseren, selecties er in maken (toon alleen grote steden of A- en B-wegen) kan niet, laat staan dat deze voor bijvooreeldbijvoorbeeld [[Geo-visualisatie/Vervolg_GIS#GIS-analyses_.2F_GIS-bewerkingen|GIS-analyses]], [[Geo-visualisatie/Vervolg_GIS#Lineair_refereren|lineair refereren]], [[Geo-visualisatie/Vervolg_GIS#Topologie|routeberekeningen]] gebruikt kunnen worden. We moeten als GIS-specialist dus weten wat de mate van digitalisering is. De functionaliteit hangt af van hoe gedigitaliseerd is.
 
Het is bijna een dogma - een bewering die goed klinkt en door niemand betwist wordt - dat digitaliseren goed is, dat digitalisering vroeg of laat zijn geld wel opbrengt. We 'moeten binnen een organisatie nu eenmaal verder', want 'stilstaan is achteruitgang'. Digitaliseren biedt inderdaad veel meer mogelijkheden dan analoge data. Maar hoever moet je gaan? Want de ene digitaliseringswijze is de andere niet! Bij te veel beleidsmakers, beslissers, managers en soms zelfs ICT-ers is het credo "digitaliseren is goed en logisch" al of niet met de benodigde ''business-case'' helaas al voldoende om hen een 'GO' te ontfutselen, wanneer het bedrijf een analoge gegevenscollectie of objecten buiten denkt te moeten digitaliseren. Welke functionaliteit met die digitaliseringsslag bereikt moet worden, is voor de GIS-specialist / onderzoeker vaak nog wel duidelijk, echter, dat is het meestal niet bij die beslissers. Zowel bij beslissers als zelfs bij specialisten worden termen als digitaliseren, vectoriseren, verrasteren onbewust door elkaar gehaald, waardoor bij beide groepen spraakverwarring aanwezig kan zijn en - erger - verkeerde beslissingen in een digitaliseringsproject of in het digitaliseringsbeleid worden genomen. Dit hoofdstuk brengt daarom zo simpel mogelijk de verschillende termen in beeld. Een simpel plaatje met een wat uitgebreide toelichting kan gebruikt worden om spraakverwarring te voorkomen.
 
'''Digitalisering''' wordt veelal omschreven als het omzetten van data van een analoog naar een digitaal medium<ref>[http://nl.wikipedia.org/wiki/Digitalisering Digitalisering op de Nederlandse Wikipedia]</ref>. Echter, in de literatuur over geo-informatie, wordt óók tot digitalisering gerekend wanneer opgemeten gegevens van objecten (zoals ligging en eigenschappen) uit de (meestal: fysieke) werkelijkheid direct digitaal worden opgeslagen - dus zonder tussenkomst van analoge vastlegging op bijvoorbeeld papier.
 
'''Digitalisering''' is een digitale vorm van '''vastleggen''' (zie figuur hierna). Waar vroeger zaken vooral analoog werden vastgelegd (voor zowel geo-informatie als 'gewone' informatie in documenten), gebeurt dat tegenwoordig vrjwelvrijwel altijd digitaal. (Administratieve) documenten werden in de zeventiger en tachtiger jaren van de vorige eeuw nog wel alleen analoog vastgelegd, maar bij geo-informatie is het, begin één-en-twintigste eeuw, soms nog steeds zo dat er (oude) geo-informatie nog slechts alleen analoog voor handen is. Inmiddels is het wel een zeldzaamheid geworden. De belangrijkste geo-informatie is nu wel digitaal, meestal zelfs gevectoriseerd. De laatste (analoge) collecties zijn nu meestal wel op zijn minst gescand. '''Scannen''' (onder andere in de vormen van verrasteren, '''vertiffen''' (omzetten in een TIF), en '''ver-PDF-en''') is het proces waarbij (teksten, foto's kaarten of andere [[Geo-visualisatie/Communicatie#Visualisatie_en_geo-visualisatie|uitdrukkingsvormen]] op) documenten via een optisch invoerapparaat ('scanner') systematisch afgetast worden in een digitaal formaat. Door dit scannen is het verstrekken en verzenden van een kopie makkelijker. Deze vorm van digitaliseren is voor gewone documenten, regelgeving, besluiten, brieven en zelfs plattegronden, dwarsdoorsneden of projectkaarten misschien prima en genoeg. Deze 'simpelste' en oudste vorm van digitalisering is voor geo-informatie meestal onvoldoende. De kaart (PDF of TIF) kan dan slechts gelinkt worden met een kaart. Klikken op een projectgebied en er verschijnt een nieuw scherm met daarin de tekening. Echt combineren, laat staan de individuele, getekende objecten aanklikken of selecteren kan niet.
 
Het figuur hierna geeft - voor geo-informatie:
Regel 433:
:* Digitaliseren kan direct door objecten uit de werkelijkheid (buiten) op te meten, of door de (eerder analoog vastgelegde data) te digitaliseren. Een voorbeeld van rechtstreeks digitaliseren (en vectoriseren!) is een modern, digitaal waterpasinstrument zoals landmeetkundigen dat gebruiken. Een voorbeeld van rechtstreeks digitaliseren (en verrasteren) is 'remote sensing', een inwinningstechniek waarbij het aardoppervlak -meestal vanuit een satelliet- met een bepaalde resolutie gescand wordt.
:* Een GIS kan alle digitale geo-informatie uit de genoemde stappen gebruiken / lezen, echter, bij gebruik van geo-informatie uit de stappen (1), (2) en min of meer ook (3) is de functionaliteit zeer beperkt.
:* De 7zeven digitaleringsstappen worden in principe ''niet'' volgordelijk uitgevoerd, ook niet bij een bepaald digitaliseringsproject. Bij een bepaalde digitalisering / digitaliseringsproject wordt - vanuit de werkelijkheid of vanuit analoge documenten - één van de genoemde digitaliseringsstappen bereikt. Bij het inrichten van de digitalisering dient vooraf bepaald te worden welke functionaliteit uiteindelijk verkregen dient te worden, en - dus - voor welke toepassingen de geo-informatie uiteindelijk gebruikt kan worden.
:* Door kortzichtigheid, een niet bedrijfsbrede scope, onbekendheid of angst voor digitaliseringsprojecten of om budgettaire redenen, kan het zijn dat gekozen is voor een te lage diitaliseringsstapdigitaliseringsstap.
:* Door voortschrijdend inzicht, of nadat geconstateerd is dat de geo-informatie niet de juiste stap ('gradatie in digitalisering') bereikt heeft bij een vorige digitalisering / vorig digitaliseringsproject, kan men besluiten om de digitalisering één of meer stappen toe te voegen, waardoor de digitale geo-informatie alsnog méér toepassingswaarde krijgt. De historie laat daarom zien dat - ondanks dat je zou verwachten dat er vóór de aanvang van dure digitaliseringstrajecten goed wordt nagedacht - de volgende digitaliseringstrajecten voor dezelfde geo-informatie (soort) voorkomen; het digitaliseren moet daardoor blijkaarblijkbaar toch in twee stappen.
:::* Van stap (0) naar stap (1), waarna 10 jaar later blijkt dat er een behoefte is aan gevectoriseerde bestanden; stap (3). Geld, aangepaste bedrijfsdoelstellingen en goedkopere technieken spelen hierbij een rol.
:::* Van stap (0) of (1) naar stap (3), waarna 2 jaar later blijkt dat er behoefte is aan (met bedrijfsprocessen) koppelbare bestanden; stap (5). Geld en een te beperkte scope of onbekendheid met mogelijke digitaliserings-stappendigitaliseringsstappen speelt hierbij mogelijk een rol.
 
[[Afbeelding:Digitaliseringsstappen.PNG|thumb|center|900px|'''Digitaliseringsstappen bij geo-informatie (zie tekst)''']]
 
'''Opmerkingen over de 7zeven getoonde digitaliseringsstappen:'''
:* '''STAP (1): Verrasteren''' is een (oude) vorm van digitalisering, waarbij slechts een beperkte toepassingsmogelijkheden bereikt worden. Voor geo-informatie is verrasteren meestal niet, zeker niet op langere termijn, een goede keuze. Dat komt omdat de geo-informatie nauwelijks gecombineerd kan worden. Héél zelden zijn zijn (geografische) rasterbestanden intelligent (zie stap 5). Denk bijvoorbeedbijvoorbeeld aan remote-sensing beelden (zie met name Lillesand, Kiefer, en Chipman; Remote Sensing and Image Interpretation, 2003, 5e editie) van het aardoppervlak, waarbij de waargenomen golflengtes via analyses vertaald zijn naar een legenda (oordeel); braakliggend terrein, gezonde of niet gezonde bomen, etceteraet cetera. In de praktijk bedoelt men bij het digitaliseren met het begrip 'rasterbestanden' de niet intelligente versie zoals die het resultaat zijn van het 'vertiffen' van analoge tekeningen. (Meer over intelligente en niet intelligente rasterbestanden is hierboven al besproken bij [[Geo-visualisatie/Inleiding_GIS#Objectsoorten_en_opslag_van_geo-informatie|Objectsoorten en opslag van geo-informatie]].)
:* '''STAP (2): Geo-refereren''', zie ook [[Geo-visualisatie/Vervolg_Cartografie#Europa|georefereren; (zie het Intermezzo, onderaan in -)]], is het zodanig juist verschalen, draaien en koppelen aan een coördinatenstelsel, dat het (raster)bestand in de juiste positie in de ruimte kijgtkrijgt. Op deze wijze kan een rasterbestand (of het nu een tif, een pdf of een ander raster-formaat betreft) dienen als onderliggende kaart, waarna andere digitale (vector)data / geo-informatie in datzelfde coördinatenstelsel over de kaart heen kan worden gelegd.
:* '''STAP (3): vectoriseren'''. Meestal wordt bij het digitaliseren vanuit de werkelijkheid direct de objecten als vectoren opgeslagen. Punten, lijnen en vlakken worden daarbij opgeslagen als (met lijnen verbonden) punten. Deze stap is voor ontwerp en constructie doeleinden vaak al voldoende. Het vectorbestand is vrijwel altijd noordgericht en in een (juist) coördinatenstelsel en op schaal getekend. Is dat niet zo, dan dient het bestand - om het te kunnen combineren met andere bestanden - alsnog gegeorefereerd te worden, zie stap (2). Meestal gaat het om CAD-tekeningen (met als opslagformaten meestal DWG en DGN. (Zie ook eerder deze module, in [[Geo-visualisatie/Inleiding_GIS#CAD-data_en_GIS-data|CAD-data en GIS-data]].) Echter, voor beheerdoeleinden, GIS-analyses en het produceren van uiteenlopende cartografische afbeeldingen is de simpelste vorm van vectoriseren meestal niet voldoende. Vandaar dat bij de volgende vormen van vectoriseren, enkele extra eisen aan de opgeslagen data wordt toegevoegd, zie stappen (4), (5), (6) en (7).
:* '''STAP (4): objectgeoriënteerd tekenen'''. Bij stap (3) zou de manier van tekenen wel eens als [[Geo-visualisatie/Inleiding_GIS#Objectgeori.C3.ABnteerd|spaghetti-digitalisering]] kunnen worden betiteld. In stap (4) wordt door de afgedwongen dat de digitalisering van één object (punt, lijn of gebied) ook als één punt, lijn of vlak wordt opgeslagen. De A50 van Zwolle naar Arnhem is dus als één lijn getekend, ook als die bij Apeldoorn door de A1 onderbroken wordt. (Zie ook [[Geo-visualisatie/Inleiding_GIS#Objectgeori.C3.ABnteerd|Objectgeoriënteerd]] eerder in deze module.)
:* '''STAP (5): objectgeoriënteerd (kunnen) koppelen'''. Hierbij kennen de in de vorige stap als eenduidige objecteobjecten getekende punten, lijnen en vlakken ook een identificatie (id, of sleutelveld met daarin een unieke naam, code of volgnummer), waardoor koppeling met databases nodig zijn. Stap (5) kan niet zonder stap (4). Stap (4) wordt meestal samengegaan met stap (5) tenzij het datamodel of de nummertoedeling nog niet geheel bekend is, maar men wel al weet dat men in de toekomst de objecten wil gaan koppelen. In dat laatste geval wordt (tijdelijk) alleen nog objectgericht getekend. Veel CAD-bestanden zijn daarom tegenwoordig al objectgeoriënteerd getekend - tot en met stap (4) - voorbereid op echte GIS-toepassingen. Naar stap (5) is dan eenvoudiger. Sommige CAD-bestanden kennen tegenwoordig ook al wel degelijk de genoedegenoemde koppelingsmogelijkheid! Digitaliseren tot en met stap (5) is voor beheertoepassingen noodzakelijk en bij GIS-specialisten vaak als minimum eis bij digitaliseringstrajecten genoemd. Wanneer deze stap bereikt wordt bij een digitaliseringstraject, dan wordt vaak gesproken over een GIS-waardig bestand en over intelligente objecten en bestanden. Een raster- of vectorbestand dat niet intelligent is wordt ook wel eens '''plat gedigitaliseerd''' genoemd. (Meer info over objectgeoriënteerdheid en het koppelen met databases, zie [[Geo-visualisatie/Inleiding_GIS#Het_bijzondere_van_GIS-data:_de_attributen|Het bijzondere van GIS-data: de attributen]] en eventueel [[Geo-visualisatie/Deel_B:_Geo-visualisatie#Joinen_.28of:_hoe_zet_ik_willekeurige_informatie_met_.C3.A9.C3.A9n_actie_op_een_kaart.29|Joinen]] in deel B.)
:* '''STAP (6) Topologie toevoegen'''. Onderlinge relaties tussen bestanden, maar ook (attribuut)volledigheid en het wel of niet mogen snijden van lijnen met andere lijnen of vlakken, wordt afgedwogenafgedwongen met (bedrijfs)regels (business rules). Zo wordt geëist dat percelen niet overlappend zijn en dat huizen binnen (woon)percelen moeten vallen, en niet op een straat gedigitaliseerd kunnen worden. De tekenregels zijn dan nog strenger dan bij stap (4) al het geval was. Met deze stap worden meestal ook - minder vaak gebruikte, maar geavanceerde (netwerk)toepassingen en berekeningen - mogelijk. (Zie ook [[Geo-visualisatie/Vervolg_GIS#Topologie|Topologie]].)
:* '''STAP (7) Een enterprise oplossing'''. In feite verandert hier niet (de digitalisering van) de data, maar de plek waar deze wordt opgeslagen; centraal bij andere geo-informatie (strikt genomen kon dat ook al bij de vorige stappen), maar nu ook bij andere 'gewone' administratieve data van de organisatie. Daardoor kunnen applicaties (niet alleen GIS-applicaties, en niet alleen beheer-beheerapplicaties, ,maar ook ontsluitingsapplicaties) beter bij de data uit de verschillende databases. Het beheer, de consistentie, hergebruik van de data maar ook applicatieontwikkeling kan zo eenvoudiger. Deze laatste stap wordt het minst snel bereikt. Niet alleen omdat dit duur zou zijn, maar eerder omdat hiervoor alle bedrijfsprocessen bekend dienen te zijn en goed op elkaar dienen te zijn afgestemd.
 
<div style="background:#FFDAB9;">
Regel 459:
 
<div style="background:#FFEFD5;">
[[Afbeelding:Crystal Clear app ktip.png|20px]] '''TIP2:''' Digitalisering en inwinnigstechniekeninwinningstechnieken van geo-informatie zelf vallen niet onder de scope van dit handboek. Meer informatie over inwinningstechnieken bij geo-informatie is onder andere te lezen in het hoofdstuk "Het verzamelen van gegevens" in "Kartografie, Visualisatie van ruimtelijke informatie", F.J. Ormeling en M.J. Kraak, Delfse Universitaire Pers. Uitgave 1990 en uitgave 1993. Meer over remote sensing is onder andere te lezen in "Remote Sensing and Image Interpretation", door T.M. Lillesand, R.W. Kiefer, en J.W. Chipman, 5e druk, 2003 John Wiley & Sons.
</div>
 
Informatie afkomstig van https://nl.wikibooks.org Wikibooks NL.
Wikibooks NL is onderdeel van de wikimediafoundation.