Unicode is an industry standard whose goal is to provide the means by which text of all forms and languages can be encoded for use by computers through a single character set. |
Unicode ist ein Industriestandard, durch den die Möglichkeit geschaffen wird, mit einem einzigen Zeichensatz Texte aller Formen und Sprachen für die Nutzung durch Computer zu kodieren. |
Originally, text-characters were represented in computers using byte-wide data: each printable character (and many non-printing, or "control" characters) were implemented using a single byte each, which allowed for 256 characters total. |
Ursprünglich wurden Schriftzeichen auf Computern mit Daten der Länge von einem Byte dargestellt: jedes druckbare Zeichen (und auch viele nicht druckbare, auch "Steuerzeichen" genannt) wurde durch ein einziges Byte realisiert. Dadurch waren insgesamt 256 Zeichen möglich. |
However, globalization has created a need for computers to be able to accommodate many different alphabets (and other writing systems) from around the world in an interchangeable way. |
Die Globalisation machte es jedoch notwendig, dass Computer viele verschiedene Alphabete (und andere Schreibsysteme) aus aller Welt in austauschbarer Weise verarbeiten konnten. |
The old encodings in use included ASCII or EBCDIC, but it was apparent that they were not capable of handling all the different characters and alphabets from around the world. |
Zu den Kodierungstabellen, die früher genutzt wurden, gehörten ASCII und EBCDIC. Diese konnten aber offensichtlich nicht all die verschiedenen Zeichen und Alphabete aus aller Welt verarbeiten. |
The solution to this problem was to create a set of "wide" 16-bit characters that would theoretically be able to accommodate most international language characters. |
Die Lösung des Problems bestand darin, einen Zeichensatz ins Leben zu rufen, der mit 16 Bit Länge sozusagen eine "Überlänge" besaß, die theoretisch die meisten international genutzten Textzeichen beherbergen konnte. |
This new charset was first known as the Universal Character Set (UCS), and later standardized as Unicode. |
Dieser neue Zeichensatz wurde zunächst unter dem Namen Universal Character Set (UCS, Universeller Zeichensatz) bekannt und wurde später als Unicode standardisiert. |
However, after the first versions of the Unicode standard it became clear that 65,535 (216) characters would still not be enough to represent every character from all scripts in existence, so the standard was amended to add sixteen supplementary planes of 65,536 characters each, thus bringing the total number of representable code points to 1,114,112. |
Nach den ersten Versionen des Unicode-Standards war jedoch klar, dass 65.535 (216) Zeichen auch nicht ausreichen würden, um jedes Zeichen aller existierenden Schriften darzustellen. Daher wurde der Standard dahingehend erweitert, dass man 16 zusätzliche Ebenen hinzufügte, von denen jede 65.536 Zeichen enthielt. Dadurch standen dann Codes für die Darstellung von insgesamt 1.114.112 Zeichen zur Verfügung. |
To this date, less than 10% of that space is in use. |
Aktuell werden weniger als 10% dieses Zeichenraums genutzt. |