About: UTF-32/UCS-4

Property	Value
dbo:abstract	UTF-32 és UCS-4 különböző nevei egy, az Unicode karakterek kódolási eljárására, amely pontosan 32 bitet használ minden egyes Unicode kódpont ábrázolására. Ez a módszer a legegyszerűbb kódolási forma, mivel minden más Unicode kódolási séma valamilyen megoldással változó hosszúságú kódokat rendel a különböző kódpont értékekhez. Ennek ellenére, mivel az UTF-32 4 byte-ot használ minden karakter ábrázolásánál, a megoldás nem a legjobb területkihasználású. Különösen igaz ez a nem-BMP karakterekre, amelyek a legtöbb szövegben nagyon ritkán fordulnak elő, így érdemes lenne egy nemlétező, hossz csökkentési módot megfontolni. Ez azt jelenti, hogy az UTF-32 általában legalább kétszer annyi helyet igényel, mint más kódolási sémák, ami néhány esetben még négyszer akkora helyigényt is jelenthet. Ugyan az első pillanatban nagyon hasznosnak látszik a fix számú byte kódpontonkénti hozzárendelés, a gyakorlatban mégsem nagyon használják. A viszonylag egyszerűen megvalósított csonkolások miatt az UTF-8 és az UTF-16 elterjedtségével össze sem lehet hasonlítani az elterjedtségét. A fix 4 byte-os hosszak ellenére egyszerűen nem határozható meg a megjelenítés helyigénye (összetett karakterek miatt), különösen igaz mindez a szóképek esetében, ahol az "egy kódpont karakterenként" elv nem is igaz minden esetben. Az összetett jeleket a szövegszerkesztők sem tudják egyszerre feldolgozni, szemben a többi egy kódpont egy szerkesztési egység közelítés miatt. Ezen okok miatt az UTF-32 a gyakorlatban kevésbé elterjedt, mint az UTF-8 és az UTF-16 a Unicode szövegek normál kódolására/dekódolására. (hu) UTF-32 és UCS-4 különböző nevei egy, az Unicode karakterek kódolási eljárására, amely pontosan 32 bitet használ minden egyes Unicode kódpont ábrázolására. Ez a módszer a legegyszerűbb kódolási forma, mivel minden más Unicode kódolási séma valamilyen megoldással változó hosszúságú kódokat rendel a különböző kódpont értékekhez. Ennek ellenére, mivel az UTF-32 4 byte-ot használ minden karakter ábrázolásánál, a megoldás nem a legjobb területkihasználású. Különösen igaz ez a nem-BMP karakterekre, amelyek a legtöbb szövegben nagyon ritkán fordulnak elő, így érdemes lenne egy nemlétező, hossz csökkentési módot megfontolni. Ez azt jelenti, hogy az UTF-32 általában legalább kétszer annyi helyet igényel, mint más kódolási sémák, ami néhány esetben még négyszer akkora helyigényt is jelenthet. Ugyan az első pillanatban nagyon hasznosnak látszik a fix számú byte kódpontonkénti hozzárendelés, a gyakorlatban mégsem nagyon használják. A viszonylag egyszerűen megvalósított csonkolások miatt az UTF-8 és az UTF-16 elterjedtségével össze sem lehet hasonlítani az elterjedtségét. A fix 4 byte-os hosszak ellenére egyszerűen nem határozható meg a megjelenítés helyigénye (összetett karakterek miatt), különösen igaz mindez a szóképek esetében, ahol az "egy kódpont karakterenként" elv nem is igaz minden esetben. Az összetett jeleket a szövegszerkesztők sem tudják egyszerre feldolgozni, szemben a többi egy kódpont egy szerkesztési egység közelítés miatt. Ezen okok miatt az UTF-32 a gyakorlatban kevésbé elterjedt, mint az UTF-8 és az UTF-16 a Unicode szövegek normál kódolására/dekódolására. (hu)
dbo:wikiPageExternalLink	http://www.unicode.org/reports/tr19/tr19-9.html http://www.unicode.org/versions/Unicode4.0.0/ch03.pdf https://web.archive.org/web/20050330110411/http:/mail.apps.ietf.org/ietf/charsets/msg01095.html
dbo:wikiPageID	109592 (xsd:integer)
dbo:wikiPageLength	3838 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID	20614559 (xsd:integer)
prop-hu:wikiPageUsesTemplate	dbpedia-hu:Sablon:Portál dbpedia-hu:Sablon:Unicode_table
dct:subject	dbpedia-hu:Kategória:Karakterkódolások
rdfs:label	UTF-32/UCS-4 (hu) UTF-32/UCS-4 (hu)
owl:sameAs	freebase:UTF-32/UCS-4
prov:wasDerivedFrom	wikipedia-hu:UTF-32/UCS-4?oldid=20614559&ns=0
foaf:isPrimaryTopicOf	wikipedia-hu:UTF-32/UCS-4
is dbo:wikiPageRedirects of	dbpedia-hu:UCS-4 dbpedia-hu:UTF-32
is foaf:primaryTopic of	wikipedia-hu:UTF-32/UCS-4