HTML/Character sets: verschil tussen versies

Verwijderde inhoud Toegevoegde inhoud
Poyy (overleg | bijdragen)
k →‎Meer informatie: toevoeging link naar www.w3.org
Poyy (overleg | bijdragen)
Unicode
Regel 1:
'''Charset''' staat voor 'character set' in het engels. Bedoeld wordt de verzameling van alle tekens die in een document gebruikt kunnen worden. Het gaat om tekens zoals letters, cijfers, symbolen en karakters uit diverse talen. Een charset'character set' hoeft niet alle tekens te bevatten. De charsetsmeeste met'character uitzonderingsets' vanalleen de UTF-charsetsmeest gebruikte tekens. Dit geld niet voor de Unicode 'character set'. Unicode is speciaal ontworpen om alle tekens die op de wereld gebruikt worden, te bevatten. alleenHTML gaat er vanuit dat de meestbrowser gebruiktealle Unicode tekens moet kunnen afbeelden.
 
Naast'Charset' datwordt debij charsetHTML bepaaltook welkein tekensde betekenis gebruikt kunnenvan worden,'character bepaaltencoding'. deHet charsetgaat ookhierbij om hoe diede tekens op in de computer gecodeerd worden. Dit is noodzakelijk omdat een computer intern alleen met getallen werkt en niet met tekens. Zo wordt het euro-teken (€) in een bepaalde charset in de computer gecodeerd als 128 en in een andere charset als 164. In weer een andere charset bestaat dat teken niet eens. Hoewel de browser zelf Unicode gebruikt, hoeft de webpagina niet gecodeerd te worden als Unicode. De browser moet dan de webpagina vertalen van de ene codering naar Unicode codering. Dit vertalen is alleen mogelijk wanneer de browser weet volgens welke charset de webpagina gecodeerd is. Welke charset gebruikt mogen worden in webpagina's en hoe ze exact heten wordt bepaald door het IANA, een instituut die dit soort zaken regelt op het internet.
 
== Coderen van de charset ==
Regel 32:
== HTML Entities ==
Wanneer een bepaalde charset een bepaalde teken niet kan weergeven, kan er ook gebruik gemaakt worden van zogenaamde HTML Entities. Met een bepaalde tekenreeks wordt een bepaald teken gecodeerd. Zo staat '''&amp;euro;''' voor het euro-teken (€). En '''&amp;lt;''' en '''&amp;gt;''' staan voor '<' en '>'. Deze laatste twee zijn belangrijk omdat de '<' en de '>' normaal een html-tag aangeeft en niet zo maar als tekst gebruikt mag worden.
 
De tekens kunnen ook met een getal of een hexadecimaal getal aangegeven worden. In Unicode heeft elk teken een getal toegewezen gekregen. Dit getal moet dan gebruikt worden. Zo kan de euro-teken (€) ook als '''&amp;#8364;''' of als '''&amp;#x20AC;''' aangegeven worden.
 
== Belangrijke charsets ==
Informatie afkomstig van https://nl.wikibooks.org Wikibooks NL.
Wikibooks NL is onderdeel van de wikimediafoundation.