Unicode is an industry standard whose goal is to provide the means by which text of all forms and languages can be encoded for use by computers through a single character set. |
Unicode is een industriestandaard die tot doel heeft de middelen te bieden waarmee alle soorten tekst en talen gecodeerd kunnen worden voor gebruik door computers door middel van één enkele tekenset. |
Originally, text-characters were represented in computers using byte-wide data: each printable character (and many non-printing, or "control" characters) were implemented using a single byte each, which allowed for 256 characters total. |
Oorspronkelijk werden teksttekens in computers weergegeven met behulp van bytebrede data: elk afdrukbaar teken (en veel niet-afdrukbare of "controle"-karakters) werden geïmplementeerd met behulp van één byte per karakter, waardoor in totaal 256 karakters mogelijk waren. |
However, globalization has created a need for computers to be able to accommodate many different alphabets (and other writing systems) from around the world in an interchangeable way. |
Door de globalisering is echter de noodzaak ontstaan dat computers in staat zijn veel verschillende alfabetten (en andere schrijfsystemen) op een uitwisselbare manier wereldwijd te kunnen verwerken. |
The old encodings in use included ASCII or EBCDIC, but it was apparent that they were not capable of handling all the different characters and alphabets from around the world. |
De oude gebruikte coderingen bevatten ASCII of EBCDIC, maar het was duidelijk dat ze niet in staat waren om alle verschillende tekens en alfabetten van over de hele wereld te verwerken. |
The solution to this problem was to create a set of "wide" 16-bit characters that would theoretically be able to accommodate most international language characters. |
De oplossing voor dit probleem was het creëren van een set "brede" 16-bits tekens die theoretisch gezien geschikt zou zijn voor de meeste internationale taaltekens. |
This new charset was first known as the Universal Character Set (UCS), and later standardized as Unicode. |
Deze nieuwe tekenset stond eerst bekend als de Universal Character Set (UCS) en werd later gestandaardiseerd als Unicode. |
However, after the first versions of the Unicode standard it became clear that 65,535 (216) characters would still not be enough to represent every character from all scripts in existence, so the standard was amended to add sixteen supplementary planes of 65,536 characters each, thus bringing the total number of representable code points to 1,114,112. |
Na de eerste versies van de Unicode-standaard werd echter duidelijk dat 65.535 (216) tekens nog steeds niet voldoende was om alle tekens van alle bestaande scripts weer te geven, dus werd de standaard aangepast om zestien aanvullende vlakken van elk 65.536 tekens toe te voegen, waardoor het totale aantal representatieve codepunten 1.114.112 werd. |
To this date, less than 10% of that space is in use. |
Tot op heden is minder dan 10% van die ruimte in gebruik. |