Per quasi tutte le codifiche ISO, si fece sopra che che tipo di i primi 127 codepoint corrispondessero ai codici ASCII, mediante mezzo da conservare un qualche tipo di compatibilita mediante quest’ultimo.
Il sviluppo fece alcune vittime (codifiche nazionali addirittura industriali di varia titolo che non vennero recepite) addirittura creo qualche orrori (che tipo di, la codifica Latin-1 e incertezza identico, ma non identica, al codepage windows-1252, un’ambiguita come persiste ed attualmente).
Autorita degli effetti di sito di incontri ucraino corrente processo ora non piu segnare la pressatura di normalizzare i codici esistenti durante indivisible unico repertorio sopra ceto di rappresentare qualsivoglia i caratteri usati dall’uomo. Il conseguenza dello indagine di excretion elenco di questo segno fu la esecuzione di Unicode (ancora ne parleremo tra indivis po’)
Le codifiche
Come abbiamo motto oltre a verso, i calcolatori trasmettono l’informazione sopra insieme minime chiamate byte (laddove sono in rango di elaborarla facendo riferimento ad un’unita ancora minore detta bit: un ammontare binaria come puo pesare 0 ovverosia 1)
Siccome insecable byte puo esprimere i numeri interi nell’intervallo 0-256, qualunque codice contente insecable preferibile di 256 codepoint puo succedere cifrato (messaggero in modello esterna) utilizzando insecable byte per inclinazione. Verso questi codici e percio fattibile identificare rappresentazione interna ed esterna, facendo contraccambiare ad qualunque codepoint la coula panorama quale unito byte.
Esistono pero lingue quale hanno (molti) piuttosto abbicci dei 256 rappresentabili mediante indivisible unito byte: il cinese ancora il nipponico sono paio con le oltre a importanti. Le codifiche dei codici/codepage creati verso queste lingue presenta dunque la insistenza di conoscere piu di excretion byte verso segno bene che puo avere luogo tipo durante al minimo paio modi – anche ambedue sono stati usati con diversi codici anche codifiche.
Codifiche wide-char.
La possibilita superficialmente con l’aggiunta di comune e quella di usare lo identico gruppo di byte a la norme di ogni codepoint. Che, Verso insecable rilievo che tipo di abbia piuttosto di 256 pero escluso di 65536 simboli, questo significa quale qualsivoglia temperamento sara legalizzato durante due byte, da 00000000-00000000 per 11111111-11111111. Codifiche di codesto qualita sinon chiamano “wide-char” (elemento larghi). Quantunque probabilmente ed improvvisamente comprensibili, queste codifiche hanno certain argomentazione convinto, personalita inibito anche uno che interessa particolarmente i programmatori.
Un modello: UCS-2 (UTF-16)
Consideriamo, come campione tutt’altro come virtuale, una trascrizione U tanto genere (questa codifica e essenzialmente quella come, sopra UNICODE, e chiamata UCS-2).
2) U utilizza i primi 256 codepoint nello uguale tranquillita ancora mediante lo identico accezione del codepage latin-1. Presente significa che tutte le lettere delle principali lingue europee occidentali sono contenute mediante un scapolo byte, il passato dei due.
Il passato problematica (quello indiscutibile) e l’inefficienza di U. U in realta contiene 511 simboli quale vengono codificati sopra sequenze che razza di hanno quantomeno indivisible byte vano. Bensi, mentre U viene utilizzata per criptare testi costituiti da recitatifs caratteri occidentali, questi risultano occupare il duplicato dello ambito (ancora vengono trasmessi nel duplicato del tempo) che tipo di sarebbe opportuno, in quanto ciascuno i alfabeto occidentali hanno una trascrizione se il byte con l’aggiunta di singolare e vano.
Il conformemente problema (quegli minore verbale) e collettivo che razza di argomentazione dell’endianness. La termine endianness anche la frasario associata derivano dai nomi di coppia fazioni politiche che esistevano nelle favolose isole di Lilliput ancora Blefuscu (quale racconta Swift ne i “Viaggi di Gulliver”) i cui membri si distinguevano a l’estremita da cui iniziavano ad avviare le uova: quella reale (a Lilliput, a proclama del regnante che una cambiamento sinon era registrato aprendo excretion uovo dall’estremita con l’aggiunta di minuto: big endians) oppure quella piccola (per Blefuscu, a dissenso contro il maesta: little endians). Sopra questa discordanza (ancora sulla degoulina attestato regale), epoca scoppiata tra le coppia isole una ostilita sanguinosa luogo bravi lillipuziani di nuovo blefuscudiani sinon scannavano sopra clan. Sopra estensione informatico, l’endianness ha accordato causa per grattacapi meno sanguinosi, ciononostante ancora ancora idioti di quelli provocati a Lilliput.