dbo:abstract
|
- A Unicode 1 114 112 (= 220 + 216 vagy 17 × 216, hexadecimálisan 110000) kódérték számára biztosít helyet. A Unicode 5.0.0 esetében a kódértékek közül 101 063 (9,1%) karakterekhez van hozzárendelve, 137 468 (12,3%) fenntartott saját használatra, a maradék 875 441 (78,6%) szabad. A karakterekhez rendelt kódértékek közül: 98 884 a graféma140 a formázó karakter65 a vezérlő karakter és2 048 az úgynevezett pótló karakter. Az első 256 kód megegyezik az kiosztásával – a egyik legismertebb karakter kódolási szabvány a nyugati nyelvekre. Végeredményben az első 128 karakter megegyezik az ASCII karaktereivel. A Unicode karakterek számára fenntartott kód terület 17 lapra (plane) van felosztva, minden egyes lap 65 536 (= 216) kódpontot tartalmaz, azonban jelenleg csak néhány lap használt:
* 0. lap (0000–FFFF): Alap többnyelvű lap - Basic Multilingual Plane (BMP)
* 1. lap (10000–1FFFF): Kiegészítő többnyelvű lap – Supplementary Multilingual Plane (SMP)
* 2. lap (20000–2FFFF): Kiegészítő lap a szókép lapokhoz – Supplementary Ideographic Plane (SIP)
* 3. laptól a 13. lapig (30000–DFFFF) nem használt
* 14. lap (E0000–EFFFF): Kiegészítő lap a speciális felhasználású laphoz – Supplementary Special-purpose Plane (SSP)
* 15. lap (F0000–FFFFF) saját használatú terület céljára fenntartva – Private Use Area (PUA)
* 16. lap (100000–10FFFF) saját használatú terület céljára fenntartva – Private Use Area (PUA) A 220 feletti kódpontok (nem értve ide a 16. lapot) azért vannak, hogy biztosítsák a kompatibilitást az UTF-16 kódolással, amely címei ebbe a tartományba esnek (lásd később). Jelenleg a Unicode kódterület mintegy 10%-a van kihasználva. A jövőben a különféle karaktertartományokat feltöltik az ismert írásokkal (lásd: ), és lehetséges, hogy szüksége lesz a Unicode-nak egy másik lapra a szóképek kezelésére, de van tíz nem használt lap még arra a célra, ha előre nem látott, eddig ismeretlen írások bukkannának fel. Jelenleg úgy látszik, hogy a 21 bites korlátot a Unicode a közeljövőben nem fogja meghaladni. (hu)
- A Unicode 1 114 112 (= 220 + 216 vagy 17 × 216, hexadecimálisan 110000) kódérték számára biztosít helyet. A Unicode 5.0.0 esetében a kódértékek közül 101 063 (9,1%) karakterekhez van hozzárendelve, 137 468 (12,3%) fenntartott saját használatra, a maradék 875 441 (78,6%) szabad. A karakterekhez rendelt kódértékek közül: 98 884 a graféma140 a formázó karakter65 a vezérlő karakter és2 048 az úgynevezett pótló karakter. Az első 256 kód megegyezik az kiosztásával – a egyik legismertebb karakter kódolási szabvány a nyugati nyelvekre. Végeredményben az első 128 karakter megegyezik az ASCII karaktereivel. A Unicode karakterek számára fenntartott kód terület 17 lapra (plane) van felosztva, minden egyes lap 65 536 (= 216) kódpontot tartalmaz, azonban jelenleg csak néhány lap használt:
* 0. lap (0000–FFFF): Alap többnyelvű lap - Basic Multilingual Plane (BMP)
* 1. lap (10000–1FFFF): Kiegészítő többnyelvű lap – Supplementary Multilingual Plane (SMP)
* 2. lap (20000–2FFFF): Kiegészítő lap a szókép lapokhoz – Supplementary Ideographic Plane (SIP)
* 3. laptól a 13. lapig (30000–DFFFF) nem használt
* 14. lap (E0000–EFFFF): Kiegészítő lap a speciális felhasználású laphoz – Supplementary Special-purpose Plane (SSP)
* 15. lap (F0000–FFFFF) saját használatú terület céljára fenntartva – Private Use Area (PUA)
* 16. lap (100000–10FFFF) saját használatú terület céljára fenntartva – Private Use Area (PUA) A 220 feletti kódpontok (nem értve ide a 16. lapot) azért vannak, hogy biztosítsák a kompatibilitást az UTF-16 kódolással, amely címei ebbe a tartományba esnek (lásd később). Jelenleg a Unicode kódterület mintegy 10%-a van kihasználva. A jövőben a különféle karaktertartományokat feltöltik az ismert írásokkal (lásd: ), és lehetséges, hogy szüksége lesz a Unicode-nak egy másik lapra a szóképek kezelésére, de van tíz nem használt lap még arra a célra, ha előre nem látott, eddig ismeretlen írások bukkannának fel. Jelenleg úgy látszik, hogy a 21 bites korlátot a Unicode a közeljövőben nem fogja meghaladni. (hu)
|