Code page 850

Repertorio di caratteri

La code page 850 (CCSID 850, nota anche come CP 850, IBM 00850,[1] OEM 850,[2] DOS Latin 1[3]) è una code page utilizzata nei sistemi operativi DOS e EPOC16 di Psion nell'Europa occidentale.[4] A seconda dell'impostazione del paese e della configurazione del sistema, la tabella codici 850 è la code page principale e la code page OEM predefinita in molti paesi, incluse vari paesi anglofoni (ad es. Regno Unito, Irlanda e Canada), mentre altri (come gli Stati Uniti) utilizzano per impostazione predefinita la code page hardware 437.[5]

Descrizione

La code page 850 differisce dalla code page 437 in quanto molti dei caratteri di box-drawing, lettere greche e simboli vari sono stati sostituiti con lettere latine aggiuntive con segni diacritici, migliorando così notevolmente il supporto per le lingue dell'Europa occidentale (tutti i caratteri a partire dall'ISO 8859-1 sono inclusi). Allo stesso tempo, le modifiche causavano frequenti problemi di visualizzazione, all'interno dei programmi che utilizzavano caratteri di box-drawing per visualizzare in modalità testo interfacce simili a GUI.

Nel 1998, venne derivata da questa code page la code page 858, cambiando il punto di codice 213 (D5hex) dalla i senza punto ‹ı› al simbolo dell'euro ‹€›.[6] Nonostante ciò, il PC DOS 2000 di IBM, presentato nel 1998, aveva cambiato la definizione della code page 850 in quella che è stata chiamata modified code page 850, includendo il simbolo dell'euro al punto di codice 213 invece di aggiungere il supporto per la nuova code page 858.[7][8][9] Il motivo potrebbe essere dovuto alle restrizioni esistenti nell'implementazione della logica di commutazione della codepage sotto MS-DOS/PC DOS, che limitava i file .CPI a 64 KB di dimensione o un massimo di circa sei code page, una limitazione che è stata aggirata in alcune versioni OEM di MS-DOS e in Windows NT, mentre non esiste in DR-DOS.[8] Inoltre, il parser in MS-DOS/PC DOS limita il numero di possibili voci di paese / code page nei file COUNTRY.SYS a un massimo di 146 o 438, una limitazione inesistente in DR-DOS.[7] Quindi, l'aggiunta del supporto per la code page 858 potrebbe aver significato eliminarne un altro (es. codepage 850) allo stesso tempo, che potrebbe non essere stata una soluzione praticabile in quel momento, dato che alcune applicazioni erano cablate per utilizzare la codepage 850.

Successivamente, i sistemi hanno gradualmente e in gran parte sostituito la code page 850 con Windows-1252, che contiene tutte le stesse lettere e successivamente con Unicode. La linea Windows NT era nativamente Unicode fin dall'inizio, ma i problemi di supporto degli strumenti di sviluppo e la compatibilità con Windows 9x hanno spinto gli sviluppatori a mantenere la maggior parte delle applicazioni nelle code page a 8 bit.

Set di caratteri

Ogni carattere viene visualizzato con il suo punto di codice Unicode equivalente. Viene mostrata solo la seconda metà della tabella (punti di codice 128–255), la prima metà (punti di codice 0–127) è la stessa della code page 437.

Code page 850[2][10][11]
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _A _B _C _D _E _F
8_
128
Ç
00C7
ü
00FC
é
00E9
â
00E2
ä
00E4
à
00E0
å
00E5
ç
00E7
ê
00EA
ë
00EB
è
00E8
ï
00EF
î
00EE
ì
00EC
Ä
00C4
Å
00C5
9_
144
É
00C9
æ
00E6
Æ
00C6
ô
00F4
ö
00F6
ò
00F2
û
00FB
ù
00F9
ÿ
00FF
Ö
00D6
Ü
00DC
ø
00F8
£
00A3
Ø
00D8
×
00D7
ƒ
0192
A_
160
á
00E1
í
00ED
ó
00F3
ú
00FA
ñ
00F1
Ñ
00D1
ª
00AA
º
00BA
¿
00BF
®
00AE
¬
00AC
½
00BD
¼
00BC
¡
00A1
«
00AB
»
00BB
B_
176

2591

2592

2593

2502

2524
Á
00C1
Â
00C2
À
00C0
©
00A9

2563

2551

2557

255D
¢
00A2
¥
00A5

2510
C_
192

2514

2534

252C

251C

2500

253C
ã
00E3
Ã
00C3

255A

2554

2569

2566

2560

2550

256C
¤
00A4
D_
208
ð
00F0
Ð
00D0
Ê
00CA
Ë
00CB
È
00C8
ı
0131
Í
00CD
Î
00CE
Ï
00CF

2518

250C

2588

2584
¦
00A6
Ì
00CC

2580
E_
224
Ó
00D3
ß
00DF
Ô
00D4
Ò
00D2
õ
00F5
Õ
00D5
µ
00B5
þ
00FE
Þ
00DE
Ú
00DA
Û
00DB
Ù
00D9
ý
00FD
Ý
00DD
¯
00AF
´
00B4
F_
240
SHY
00AD
±
00B1

2017
¾
00BE

00B6
§
00A7
÷
00F7
¸
00B8
°
00B0
¨
00A8
·
00B7
¹
00B9
³
00B3
²
00B2

25A0
NBSP
00A0

  Lettera  Numero  Punteggiatura  Simbolo  Altro  Differenze rispetto alla code page 437

Note

  1. ^ CP00850Z (PDF), su IBM.com. URL consultato il 30 ottobre 2021 (archiviato dall'url originale l'8 luglio 2015).
  2. ^ a b (EN) OEM 850, su Go Global Developer Center, Microsoft. URL consultato il 30 ottobre 2021 (archiviato dall'url originale il 6 giugno 2016).
  3. ^ Code Page 850 MS-DOS Latin 1, su Microsoft Docs. URL consultato il 30 ottobre 2021.
  4. ^ (EN) IBM Globalization - Coded character set identifiers - CCSID 850, su www-01.ibm.com. URL consultato il 29 ottobre 2021 (archiviato dall'url originale il 28 marzo 2016).
  5. ^ (DE) Matthias R. Paul, II.16.iii. Landessprachliche Unterstützung - Landescodes und Keyboard-Kürzel, in NWDOS-TIPs — Tips & Tricks rund um Novell DOS 7, mit Blick auf undokumentierte Details, Bugs und Workarounds [NWDOSTIPs — Tips & tricks for Novell DOS 7, with special focus on undocumented details, bugs and workarounds], MPDOSTIP, 3ª ed., 30 luglio 1997. URL consultato il 6 giugno 2016 (archiviato dall'url originale il 6 giugno 2016).
  6. ^ (EN) IBM Globalization - Code page identifiers - CP00858, su IBM.com. URL consultato il 30 ottobre 2021 (archiviato dall'url originale il 9 settembre 2017).
  7. ^ a b (EN) Matthias R. Paul, Changing codepages in FreeDOS (TXT), su FreeDOS.com, 15 agosto 2001. URL consultato il 30 ottobre 2021 (archiviato dall'url originale il 20 agosto 2016).
    «The new official ID for the Multilingual "codepage 850 with EURO SIGN" is 858, not 850. IBM will switch to use 858 instead of their 850 variant with future issues of their products. […] I can only guess why they didn't add 858 to their EGAx.CPI, COUNTRY.SYS, and KEYBOARD.SYS files in PC DOS 2000. Many third-party applications are designed to work with 850 and didn't know about 858 at the time PC DOS 2000 was released, so it's easier for everyone, but unfortunately it's not compatible. […] As explained above, COUNTRY.SYS and KEYBOARD.SYS contain only two codepage entries for a given country in Western issues of DOS. (In Arabic and Hebrew issues there can be up to 8 codepages for one country, in theory there is no limit below the range of allowed codepages 1..65534). […] The problem is that removing support for 850 might have caused compatibility problems with applications which are hard-wired to use 850. Adding 858 as a third choice to all the files would have increased the file and table sizes significantly. The COUNTRY.SYS file parser in MS-DOS/PC DOS IO.SYS/IBMBIO.COM sets aside a 6 Kb (for DOS 6) scratchpad to load all the info. This allows a maximum of 438 entries in a COUNTRY.SYS file to be accepted, otherwise you will get the message "COUNTRY.SYS too large.". The NLSFUNC parser does not have this limitation, and the file parsers in DR-DOS (kernel and NLSFUNC) also do not know of such a restriction. Older issues of MS-DOS/PC DOS even had a 2 Kb buffer for a maximum of 146 entries.»
  8. ^ a b (EN) Matthias R. Paul, Changing codepages in FreeDOS (follow-up), su marc.info, 27 agosto 2001. URL consultato il 30 ottobre 2021.
    «[…] one could also create custom .CPI files in the traditional FONT style without difficulties, but you could only store up to […] six codepages in such a file if it should be useable by MS-DOS/PC DOS (some OEM issues and NT can handle files larger than 64 Kb, but MS-DOS/PC DOS can not).»
  9. ^ (RU) Yuri Starikov, 15-летию Russian MS-DOS 4.01 посвящается, su rdos401.org, 11 aprile 2005. URL consultato il 30 ottobre 2021.
  10. ^ (EN) cp850_DOSLatin1 to Unicode table (TXT), su unicode.org, The Unicode Consortium. URL consultato il 30 ottobre 2021.
  11. ^ icu/ibm-850_P100-1995.ucm at main · unicode-org/icu, su GitHub. URL consultato il 30 ottobre 2021.

Voci correlate

Collegamenti esterni

  Portale Informatica: accedi alle voci di Wikipedia che trattano di informatica