Caratteri strani, era Re: [Soci SLIP] ancora buchi di sicurezza

loredana llcfree a gmail.com
Lun 5 Dic 2011 18:06:16 CET


2011/12/5 ugodm <ugodm a yahoo.it>:
> comunque nell'intestazione della mail incriminata come da me ricevuta
> risulta quanto segue con tutti i passaggi (quanti!) e, verso la fine, mi
> pare un'autoconversione (forse importante per il nostro discorso?)
>        X-MIME-Autoconverted: from quoted-printable to 8bit by
>        star.archivio.com

Non sono riuscita a trovare il modo di vedere il contenuto completo
dell'header in
gmail (grrrr!!!!), cosi' sono tornata al buon vecchio mutt e ho
controllato le headers
di mail con e senza problemi di caratteri.

Intanto, con mutt il problema del messaggio di Lucio scompare (mutt
vede "bene"), mentre invece resta quello di tempo fa di Davide che ce
l'aveva con il sandybridge.

L'unica cosa che ho notato e' che molti, ma non tutti i messaggi
arrivano come se fossero stati composti con due attachments, il primo
contiene il messaggio stesso e il secondo contiene l'informazione
sulla codifica usata. Forse dipende da quale
percorso fanno tra sorgente e destinazione.

Comunque, nel caso specifico dell'email di Lucio, credo di aver capito cosa sia
successo guardando il codice nei due casi (caratteri strani e
caratteri corretti)
con un editor esadecimale.

1) latin extended-a
m  a       n   o  n       č           c  o  s   ě
6d 61 20 6e 6f 6e 20 c48d 20 63 6f 73 c49b 0a

2) latin-1	supplement
m  a       n   o  n       è            c  o  s   ì
6d 61 20 6e 6f 6e 20 c3a8  20 63 6f 73 c3ac 0a

In 1), qualcuno lungo la via, non so se gmail alla fine del percorso o cosa,
ha dovuto tirare ad indovinare il codice caratteri usato e ne ha dedotto che
fosse latin extended-a (l'estensione del codice ascii per il croato etc)

In 2) l'ipotesi che si trattasse di latin-1 supplement e' quella
corretta e percio'
i caratteri vengono rappresentati come si deve.

Si noti che per i caratteri ascci non standard, la codifica e' su due
bytes, mentre
per i caratteri ascii standard e' su uno. In entrambi i casi la
codifica finale e'
unicode.

La cosa interessante sarebbe sapere (in esadecimale) cos'e' partito da Lucio,
ma non so bene come si possa fare.

Ho l'impressione che l'unico modo certo di essere capiti sia inviare
messaggi utf-8, come suggerito da google mail, il resto chiaramente
dipende dalle bizze di chi interpreta quello che non sa esattamente
cosa sia. Con l'email, poi, ci sono cosi' tanti passaggi che diventa
probabile che qualcuno lungo la via prenda chock per brock. E forse
anche usare utf-8 non e' la soluzione, almeno non finche' tutte le
applicazioni e tutti i servers si adeguano.

Loredana




Maggiori informazioni sulla lista Soci