Basiskennis informatica/Codering/Unicode: verschil tussen versies

Verwijderde inhoud Toegevoegde inhoud
Mattias.Campe (overleg | bijdragen)
Mattias.Campe (overleg | bijdragen)
Geen bewerkingssamenvatting
Regel 7:
* [[w:UTF-32|UTF-32]]: voor de codering worden 32 bits gebruikt (dit zijn dus 2<sup>32</sup> = ± 4 miljard mogelijkheden). Een nadeel is dat ASCII-bestanden in Unicode daardoor 4 keer zo groot worden.
* [[w:UTF-16|UTF-16]]: tekens worden opgeslagen als een of twee 16-bits getallen, afhankelijk van de hun toegekende waarde.
* [[w:UTF-8|UTF-8]]: tekens worden opgeslagen als een tot vier 8-bits getallen, afhankelijk van de hun toegekende waarde. In deze codering blijven ASCII-teksten onveranderd. Met een hex-editor merk je dat zo'n bestand vaak begint met EF BB BF.
 
Om te weten in welke codering een bestand is opgeslagen, wordt vaak gebruik gemaakt van de [[w:en:Byte order mark|Byte order mark]] (BOM). Zo merk je met een hex-editor dat een UTF-8-bestand vaak begint met <code>EF BB BF</code> en een UTF-16 bestand vaak met <code>FE FF</code> (of <code>FF FE</code> bij [[w:Endianness#Little-endian|little endian]]).
{{Sub}}
Informatie afkomstig van https://nl.wikibooks.org Wikibooks NL.
Wikibooks NL is onderdeel van de wikimediafoundation.