Geo-visualisatie/Vervolg GIS: verschil tussen versies

Verwijderde inhoud Toegevoegde inhoud
KKoolstra (overleg | bijdragen)
kGeen bewerkingssamenvatting
wat kleine redactionele aanpassingen/spelling consequent/typo
Regel 26:
[[Afbeelding:Voorbeelden GIS bewerkingen.PNG|right|thumb|530px|'''Enkele van de belangrijkste GIS-bewerkingen'''. Op basis van ruimtelijke ligging kunnen verschillende analyses en bewerkingen worden uitgevoerd. Links de input, rechts de output met voorbeelden.]]
 
In de vorige module, [[Geo-visualisatie/Inleiding GIS|Inleiding GIS]], zijn al enkele (gemeentelijke) voorbeelden genoemd om te laten zien wat er mogelijk is met een GIS. Die mogelijkheden zitten wel of niet in een GIS, afhankelijk van het aantal functies (ruimtelijke operatoren, bewerkingen of analyses) die de desbetreffende GIS kent. Een desktop-GIS is hierin véél krachtiger dan web-gisGIS-applicaties of (gratis downloadbare) GIS-viewers.
 
GIS-desktop-software kent over het algemeen vele mogelijke GIS-analyses. Uiteraard is dit afhankelijk van de leverancier en de gekochte licentie. Een gemiddelde desktop GIS-applicatie van een gemiddelde, bekende leverancier, kent minimaal een honderdtal functies, maar waarschijnlijkdoorgaans veel meer. Toch zal je er vaak slechts enkele van gebruiken. Door het combineren van die functies wordt het resultaat nog krachtiger. Ook zijn die functies vaak in modellen te gieten, waardoor meerdere functies zijn te combineren, al of niet met handmatig in te voeren parameters, en al of niet in batch uit te voeren. Het is ondoenlijk en onnodig alle functies uit je hoofd te kennen, net zoals het ondoenlijk en onnodig is deze te vermelden in dit handboek. Je wordt verwezen naar de handleiding van de leverancier.
 
Wel wordt hier, in de figuur rechtsboven, getoond wat zo ongeveer de belangrijkste krachtige GIS bewerkingen zijn. Zowel de veel gebruikte Engelse termen als hun minder vaak genoemde Nederlandse vertaling worden genoemd. De voorbeelden verduidelijken de functie. Merk op dat de output, - rechts in de figuur, - vaak een nieuw bestand is, met op de achtergrond, - in het bestand zelf, - alle attributen die van toepassing zijn. De figuur legt achtereenvolgens uit:
:* merge (samenvoegen)
:* buffer
Regel 39:
:* dissolve (generaliseren op basis van attribuutwaarden)
 
Door middel van dergelijke ruimtelijke operatoren, voegen GIS-applicaties een heel bijzonder soort operatoren toe aan de operatoren die bij de meer gebruikelijke en bekendere administratieve (getalsmatige en tekstuele) databases al bekend zijn (zoals: < > = not, nor, and). Administratieve databases zijn heel goed in staat om objecten te selecteren of te combineren met deze zogenaamde Booleaanse en logische operatoren; Selecteer alle gemeentes groter dan 50.000 inwoners (de operator > wordt hier gebruikt). Een GIS voegt hier operatoren aan toe die een ruimtelijke component kennen. Selecteer alle boringen die - op grond van hun ligging (x- en y- coördinaat) vallen in de gemeente. Net zoals dat door een mens direct op een kaart te zien zou kunnen zijn, zo selecteert een GIS deze boringen op grond van hun locatie. Dat gebeurt dus niet op grondbasis van een (lastig te beheren) koppeling in een relationele database. Andere voorbeelden uit de praktijk zijn: selecteer boringen binnen een bepaalde afstand, combineer objecten (merge), et cetera. Zie verder het figuur.
 
<div style="background:#FFDAB9;">
Regel 49:
</div>
 
NB: De meest gebruikte GIS-tool, de join, is strikt genomen geen analyse, maar het startpunt van het maken van een kaart of analyse;. dezeDeze wordt besproken in [[Geo-visualisatie/Deel_B:_Geo-visualisatie#Joinen_.28of:_hoe_zet_ik_willekeurige_informatie_met_.C3.A9.C3.A9n_actie_op_een_kaart.29|joinen]].
==GIS-analyses, de 'do's and dont's'==
Er zijn vele GIS-bewerkingen waarbij geo-informatie geconverteerd kan worden, verbeterd, gecombineerd, geanalyseerd. Hoe groter en duurder het GIS-pakket of licentie, hoe meer mogelijkheden. Deze mogelijkheden worden niet allemaal uitgebreid behandeld, daar is de GIS-handleiding van het softwarepakket zelf waarschijnlijk beter in. Maar er zijn altijd een aantal zaken waar je rekening mee moet houden. In de volgende paragrafen komen een aantal van die zaken aan de orde.
Regel 58:
Er moet voorzichtig worden omgesprongen bij onvolledige of niet juist ingewonnen data. Zeker wanneer een kaart gemaakt wordt op basis van een beperkt onderzoek, of een beperkte hoeveelheid data (zie ook de vorige paragraaf). Staat er een beperkte selectie van de werkelijkheid op een kaart, of er zijn nu eenmaal weinig voorvallen gekarteerd, dan is er de kans dat de beslissing of het inzicht die volgt uit een kaart, bepaald wordt door wat men noemt 'de macht van het kleine getal' of 'overhaaste generalisatie' (zie ook [http://nl.wikipedia.org/wiki/Wet_van_de_kleine_getallen 'De Wet van het kleine getal' op Wikipedia]). Zelfs wanneer de data 100% goed, actueel, compleet en nauwkeurig is, moet men met deze wet rekening houden. Een voorbeeld.
 
Hier rechts staan twee figuren. Hier worden daadwerkelijk plaatsgevonden meldingen van calamiteiten weergegeven van regio IJsselland. Deze vanuit het P2000 -systeem van de centrale meldkamer (112) van de ambulance, brandweer en politie.
 
Een kaartlezer zou de volgende conclusies ''kunnen'' trekken:
Regel 66:
:* enzovoort.
 
Al deze conclusies berustenkomen opvoort één groot misverstand: erze worden conclusies getrokken over een heel kleine periode én een heel klein gebied. Door de beperkte tijdspanne is de factor toeval bepalend voor het kaartbeeld. De werkelijke ruimtelijke spreiding die bij een dergelijk fenomeen hoort is niet zichtbaar. Pas wanneer een fenomeen (bijvoorbeeld brandmelding) in alle gebieden een minimum aantal keren voorkomt, en/of de meldingen gelden over grotere perioden (bijvoorbeeld een jaar), dan zouden dergelijke conclusies pas te trekken zijn. Er is een grote kans dat deze conclusies dan totaal anders zijn. Het heeft dat ook geen enkel nut dergelijke kaarten als hier boven te maken. Slechts voor dagrapportages ('waar zijn de hulpdiensten vandaag opgeroepen?') is het wellicht handig.
 
(Overigens,Voor wie overigens bekend is met de vele P2000-sites die er zijn; niet alle meldingen zijn goed classificeerbaar. Een melding als 'XXX Gaarne contact opnemen met centrale', of communicatie die niet via P2000 gaat, strooien sowieso roet in het eten, wanneer we toch kaarten willen maken en conclusies zouden willen trekken. Hiermee wordt maar weer eens aangegeven: Gebruik spaarzaam of voorzichtig andermans (internet) data; stap op de vakdeskundigen / kenners af alvorens zomaar zaken in kaart te brengen. Ook al is de hoeveelheid en veelsoortigheid aan informatie op internet nog zo'n verlokking, en ziet die er nog zo professioneel uit.)
 
Ook op de kaart met de nieuwsmeldingen, hierboven, zijn sommige van onderstaande conclusies misschien voor de hand liggend, echter ze zijn allen toch verkeerd:
Regel 76:
 
===Arbitrair gekozen of bestuurlijke gebiedsindelingen===
[[Afbeelding:Probleemwijken.PNG|thumb|right|650px|'''Hoe een arbitraire (slecht gekozen of bestuurlijke) grens beslissingen en GIS-berekeningen beïnvloedt.''' Stad A en Stad B kennen dezelfde geografische spreiding van een bepaald sociaal probleem, hier voorgesteld door adressen met een probleemindicatie. Stad B zou wel eens wélwèl subsidie kunnen krijgen voor hun Wijk 2, omdat alléén daar het percentage adressen met een probleemindicatie boven een bepaalde (landelijke?) norm komt. De werkelijke problematiek is voor beide steden hetzelfde. Het grijze gebied geeft een véél betere grens aan van een gebied waar de aandacht van béide steden naar zou moeten gaan. Hiermee is aangetoond dat onderzoeksgebieden en rekeneenheden nooit te klein mogen zijn; ze moeten afgestemd zijn op de werkelijke spreiding. Zie verder tekst.]]
 
[[Afbeelding:Aggregatieniveaus raster grof.PNG|thumb|right|350px|'''Berekening van welke gebieden gunstig zijn voor de landbouw met ''grof'' raster.''' De uitkomst is blijkbaar afhankelijk van het toeval van waar dit raster over het gebied wordt heen gelegd. Het rechter voorbeeld geeft een hoger percentage dat geschikt is voor landbouw, en laat ook andere gebieden als geschikt zien dan het linker voorbeeld. De vraag is of een koper van één van deze negen gebieden tevreden zal zijn!]]
Regel 82:
[[Afbeelding:Aggregatieniveaus raster fijn.PNG|thumb|right|350px|'''Berekening van welke gebieden gunstig zijn voor de landbouw met ''fijn'' raster.''' Hier is een fijner en - gezien de uitkomst - beter raster gebruikt. De uitkomst wordt blijkbaar nauwelijks beïnvloed door waar het raster over het gebied wordt heen gelegd. Beide analyses (links en rechts) geven ongeveer dezelfde uitkomsten.]]
 
Arbitraire of bestuurlijke gebiedsindelingen kunnen een negatieve invloed hebben op (GIS-)analyses. De spreiding van een fenomeen (bijvoorbeeld armoede) komt vaak niet overeen met een administratieve of bestuurlijke gebiedsindeling. Bij analyses moet hier rekening mee worden gehouden. In de figuur wordt dit met een voorbeeld aangetoond. Het fenomeen (armoede) heeft een geografische spreiding die niet overeenkomt met de wijkenwijkgebieden; de wijken zijn blijkbaar niet uniform; er zijn misschien wel villa's en huurwoningen.
 
Het probleem is ontstaan omdat harde, politieke, of verkeerd getrokken grenzen gebruikt zijn. Wil men toch in percentages per gebied werken, omdat de besluitvorming / politici dat eisen, én een goede aanpak van de (armoede) problematiek hebben, dan dient dus een gebiedsindeling van een juist (hoger) detailniveau gebruikt te worden, bijvoorbeeld deelwijken of zogenaamde 6-punts-postcodegebieden (1234AB). Nog beter zou zijn: rekenen met het fenomeen zelf, de adressen met de (armoede) problematiek. Zouden deze gegevens niet voorhanden zijn, reken dan met de fijnere grenzen. In dit geval de deelwijkgrenzen, aangegeven met een stippellijn rondom het probleem gebied. Deze deelwijkgrenzen geven de werkelijke spreiding van het probleem weer.
 
Statistische gegevens, zoals die van het Centraal Bureau voor de Statistiek komen, hebben achter zich (een onbekende) ruimtelijke dynamiek. Een voorbeeld is het percentage werklozen in een gemeente. Met een verdere analyse nemen we, - vaak zonder dit expliciet te weten of dit kenbaar te maken, - aan dat deze ruimtelijke dynamiek netjes is uitgesmeerd over dat hele gebied ("Deze ''hele'' gemeente kent 10 % werkloosheid").
 
<div style="background:#FFDAB9;">
Regel 97:
 
===Te grof gekozen aggregatieniveaus en rasters met te grote cellen===
Ongeveer hetzelfde probleem kan optreden wanneer bij GIS-analyses gewerkt wordt met een raster. De reden waarom bij GIS-analyses vaak gekozen wordt voor de beschrijving van een fenomeen (verschijnsel / thema) met een raster is omdat zoop makkelijkdeze manier gemakkelijk gerekend kan worden. 'Scores' van verschillende fenomenen kunnen bijvoorbeeld worden opgeteld.
 
:Voorbeeld: willenals we voor een bepaald gebied willen zien waar de gunstigste kansen zijn voor de landbouw, danhet gunstigst zijn, zullenzouden bijvoorbeeld de thema's grondwaterstand, bodemtype en bereikbaarheid een rol kunnen spelen. Het kan zijn dat er opdracht wordt gegeven dat gebied in te delen in gebieden van honderd bij honderd meter, omdat die gebieden vervolgens goed aan geïnteresseerde boeren iszijn aan te bieden. De thema's hebben echter allemaal hun eigen grenzen. Door deze te verrasteren zijn de scores per thema (1=ongunstig, 2=matig, 3=redelijk, 4=goed) optelbaar (zie vector-raster-conversie [Geo-visualisatie/Vervolg GIS Vervolg GIS]). Er zal zo een maximale score ontstaan van 12 (drie maal een goede score).
 
Het probleem bij deze verrastering doet zich voor wanneer de cellen van zo'n raster te groot zijn; het fenomeen wordt dan niet meer goed beschreven. Te grote rastercellen leveren dezelfde problemen op wanneer een te hoog aggregatieniveau wordt gebruikt. Met een hoog aggregatieniveau wordt bedoeld dat een thema / fenomeen beschreven wordt op basis van een samenvoeging van een aantal gebieden. Wanneer gerapporteerd (en gerekend) wordt op een hoog aggregatieniveau, kan dit negatieve invloeden hebben op de juistheid of de nauwkeurigheid van de analyse. Voorbeelden van hoge aggregatieniveaus, daarin gevallen waar ook gebruik had gemaakt had kunnen worden van kleinere gebieden zijn:
:* gemeentes in plaats van individuele wijken
:* secties in plaats van individuele percelen
:* zandgebieden in plaats van (uitgesplitst) in duinzand, stuifzand, dekzand, rivierzand, et cetera
 
In het voorbeeld in deze paragraaf wordt één thema verrasterd. De vraag is: welke gebieden van honderd bij honderd meter zijn gunstig voor de landbouw.? In het bovenste figuur, waar direct gebruik gemaakt wordt van een raster van honderd bij honderd meter, zijn de uitkomsten onbetrouwbaar. In het onderste figuur is gekozen voor een fijner raster van zo'n twintig bij twintig meter.
 
Merk op dat in het onderste figuur met het fijne raster zowel links als rechts ongeveer een gelijk beeld laat zien: in het noorden en in het zuidoosten is een concentratie van voor de landbouw geschikte grond. Daarentegen laat het bovenste figuur met het grove raster rechts een totaal verschillend beeld zien als links.
Regel 124:
Het komt vaak voor dat je van geo-informatie met kwantitatieve (getalsmatige) gegevens hebt die geldig zijn voor bepaalde gebieden. Deze kwantitatieve gegevens beschrijven voor een vastomlijnd gebied (bijvoorbeeld een gemeente) met één getal het fenomeen (bijvoorbeeld de bevolkingsdichtheid). Daarbij neem je meestal aan dat dit fenomeen evenredig verdeeld is over het gehele oppervlak. Dat zal echter nooit het geval zijn; bepaalde plekken kennen vast een hogere dichtheid dan andere plekken.
 
Stel: de bevolkingsdichtheid is 1000 inwoners/km<sup>2</sup>. Wanneer je alléén deze gemeente in beeld hebt, en jezeker weet zeker dat er buiten de bebouwde kom vrijwel geen mensen wonen, dan zal uiteraard gelden dat de werkelijkwerkelijke bevolkingsdichtheid voor deze bebouwde kom groter is, omdataangezien er op de heide en in het bos bij deze gemeente niemand woont... Stel dat de helft van deze gemeente uit bebouwde kom bestaat, dan kan je dus voor deze gemeente stellen dat de bevolkingsdichtheid hoger is: 2000 inwoners/km<sup>2</sup>. Ga je dit in een kaart opnemen voor deze gemeente (of ook omliggende gemeenten), dan moet je natuurlijk wel aangeven wat de bevolkingsdichtheid is per deelgebied: dus 2000 inw/km<sup>2</sup> in de bebouwde kom en 0 (of als je klasses gebruikt: 0 - 100) inw/km<sup>2</sup> in het buitengebied van deze gemeenten. Op deze wijze geef je een reëler beeld van de situatie. 2000 inw/km<sup>2</sup> is voor de bebouwde kom een aannemelijker getal, 0 (of 0 - 100) inw/km<sup>2</sup> is voor het buitengebied een aannemelijker getal dan 1000 inw/km<sup>2</sup>. Beslissingen, analyses en vergelijkingen tussen verschillende gemeenten e/o wijken kunnen zo van een betere kwaliteit zijn.
 
:Discussie: Let op dat je deze methode wel ergens in de kaart of begeleidende tekst moet verantwoorden; niet voor alle gemeenten zal dit zomaar toe te passen zijn. Wanneer in een dorp sprake is van lintbebouwing (huizen aan één lange straat, zonder zijstraten met wijken) en deze zijn weer niet opgenomen in de bebouwde kom, gaan er zaken fout. Voor bepaalde analyses, en onderzoeken waarbij je veel data zelf moet maken en verwerken, zal je deze methode toch kunnen overwegen. Een ander voorbeeld is overigens het aantal restaurants per km<sup>2</sup> (ook weer: in bebouwde kommen of in gemeenten). Het mag duidelijk zijn dat enige kennis van zaken nodig is op het moment dat je deze techniek niet als truc maar als een verantwoord techniek wil inzetten.
 
==Coördinaten creëren met een GIS indien er geen coördinaten zijn==
Informatie afkomstig van https://nl.wikibooks.org Wikibooks NL.
Wikibooks NL is onderdeel van de wikimediafoundation.