Unicode is an industry standard whose goal is to provide the means by which text of all forms and languages can be encoded for use by computers through a single character set. |
Unicode is een industrienorm met als doel een tekenverzameling vast te leggen waarmee tekst in allerlei vormen en talen voor gebruik door computers kan worden gecodeerd. |
Originally, text-characters were represented in computers using byte-wide data: each printable character (and many non-printing, or "control" characters) were implemented using a single byte each, which allowed for 256 characters total. |
Oorspronkelijk werden teksttekens in computers voorgesteld door gebruik te maken van de volle breedte van een byte: elk afdrukbaar teken (en ook vele niet-afdrukbare tekens, ofwel besturingstekens) werd in die ene byte vastgelegd. In totaal konden op deze wijze 256 tekens worden gedefinieerd. |
However, globalization has created a need for computers to be able to accommodate many different alphabets (and other writing systems) from around the world in an interchangeable way. |
Door mondialisering is echter de noodzaak ontstaan om op een uitwisselbare manier met vele verschillende alfabetten (en andere schrijfsystemen) van over de hele wereld om te kunnen gaan. |
The old encodings in use included ASCII or EBCDIC, but it was apparent that they were not capable of handling all the different characters and alphabets from around the world. |
Oudere coderingssystemen waren bijvoorbeeld ASCII of EDCDIC maar hiermee konden niet alle tekens en alfabetten die over de hele wereld in gebruik zijn, worden voorgesteld. |
The solution to this problem was to create a set of "wide" 16-bit characters that would theoretically be able to accommodate most international language characters. |
De oplossing voor dit probleem was het creëren van een tekenverzameling op basis van 16 bits, waarmee in theorie de meeste tekens van de internationaal gebruikte talen konden worden voorgesteld. |
This new charset was first known as the Universal Character Set (UCS), and later standardized as Unicode. |
Deze nieuwe tekenverzameling stond eerst bekend als de Universal Character Set (UCS), maar werd later gestandaardiseerd als Unicode. |
However, after the first versions of the Unicode standard it became clear that 65,535 (216) characters would still not be enough to represent every character from all scripts in existence, so the standard was amended to add sixteen supplementary planes of 65,536 characters each, thus bringing the total number of representable code points to 1,114,112. |
Na het verschijnen van de eerste versies van de Unicode-norm werd duidelijk dat 65.536 (2 tot de macht 16) tekens nog steeds onvoldoende zou zijn voor alle schrijfsystemen die er in omloop zijn. Daarom werd de norm aangevuld tot 16 vlakken van elk 65.536 tekens, waarmee in totaal 1.114.112 tekens konden worden voorgesteld. |
To this date, less than 10% of that space is in use. |
Vandaag de dag is minder dan 10% van die ruimte in gebruik. |