Analisi delle frequenze
Il primo metodo di crittanalisi utilizzato, si basa sul fatto che in ogni lingua la frequenza di uso di ogni lettera è fissa; questo è vero in modo rigoroso solo per testi lunghi ma spesso testi anche corti hanno frequenze non molto diverse da quelle previste.Vediamo come riferimento le frequenze delle lettere più comuni di alcune lingue:
Italiano | Inglese | ||
---|---|---|---|
E | 11,79 | E | 12,31 |
A | 11,74 | T | 9,59 |
I | 11,28 | A | 8,05 |
O | 9,83 | O | 7,94 |
N | 6,88 | N | 7,19 |
Si può notare quanto le prime lettere di queste lingue siano presenti in quantità molto maggiore delle altre, ad esempio da un testo in cui un certo simbolo appare oltre il 12% delle volte si può facilmente intuire che quel simbolo corrisponde alla lettera E (in inglese la distanza della E dalle altre lettere è ancora più marcata).