HTML/Character sets: verschil tussen versies

Verwijderde inhoud Toegevoegde inhoud
nieuwe URI HTML Entities op w3schools .com
k red.
Regel 1:
{{HTML inhoud|Deel=Geavanceerd|sjabloonuit={{{sjabloonuit}}} }}
'''Charset''' staat voor 'character set' in het engels. Bedoeld wordt de verzameling van alle tekens die in een document gebruikt kunnen worden. Het gaat om tekens zoals letters, cijfers, symbolen en karakters uit diverse talen. Een 'character set' hoeft niet alle tekens te bevatten. De meeste 'character sets' bevatten alleen de meest gebruikte tekens. Dit geld niet voor de Unicode 'character set'. Unicode is speciaal ontworpen om alle tekens die op de wereld gebruikt worden, te bevatten. HTML gaat erervan vanuituit dat de browser alle Unicode -tekens moet kunnen afbeelden.
 
'Charset' wordt bij HTML ook in de betekenis gebruikt van 'character encoding'. Het gaat hierbij om hoede manier waarop de tekens in de computer gecodeerd worden. Dit is noodzakelijk omdat een computer intern alleen met getallen werkt en niet met tekens. Zo wordt het euro-teken (€) in een bepaalde charset in de computer gecodeerd als 128 en in een andere charset als 164. In weer een andere charset bestaat dat teken niet eens. Hoewel de browser zelf Unicode gebruikt, hoeft de webpagina niet gecodeerd te worden als Unicode. De browser moet dan de webpagina vertalen van de ene codering naar Unicode codering. Dit vertalen is alleen mogelijk wanneer de browser weet volgens welke charset de webpagina gecodeerd is. Welke charset gebruikt mogen worden in webpagina's en hoe ze exact heten wordt bepaald door het [[IANA]], een instituut dat dit soort zaken regelt op het internet.
 
== Coderen van de charset ==
Regel 46:
 
== Belangrijke charsets ==
* '''ISO-8859-1''' is een charset die heel veel gebruikt wordt voor westWest-europeseEuropese talen. Het bevat de letters 'a' t/m 'z', de cijfers en diverse symbolen. Het bevat ook letters met accenten zoals: à á â è é ë. Het bevat geen euro-tekeneuroteken (€).
* '''ISO-8859-15''' is een aanpassing op de voorgaande charset. Enkele minder gebruikt symbolen zijn vervangen door veel gevraagde symbolen. Het bevat wel het euro-tekeneuroteken (€).
* '''Windows-1252''' is gebaseerd op de ''ISO-8859-1'' en is uitgebreid met veel gevraagde symbolen zoals het euro-tekeneuroteken (€).
* '''Shift_JIS''' is een voorbeeld van een veel gebruikte japanseJapanse charset met tekens zoals ''日本語''. Zo zijn er voor vele talen aparte charsets ontwikkeld.
* '''UTF-8''' is een zogenaamde Unicode -charset. Met de Unicode -charset kan vrijwel elk symbool van elke taal op de wereld geproduceerd worden. Op dit moment zijn bijna honderdduizend tekens gedefinieerd. Er zijn ook andere Unicode charsets zoals UTF-16 en UTF-32 maar deze worden in HTML vrijwel nooit gebruikt.
 
== Meer informatie ==
Informatie afkomstig van https://nl.wikibooks.org Wikibooks NL.
Wikibooks NL is onderdeel van de wikimediafoundation.