Pagina iniziale | Navigazione |
Google

Test di Kolmogorov-Smirnov

Test di Kolmogorov-Smirnov (a un campione)

Sia X una v.c. generatrice continua, con funzione di ripartizione (f.r.) F(x). Un problema che spesso ricorre nella pratica è quello di verificare che la v.c. X abbia f.r. uguale ad una data F0(x). In simboli, il problema di ipotesi è del tipo:

H0: F(x) = F0(x), per ogni x

contro

H1: F(x) ≠ F0 (x), per qualche x

Questo significa che l'ipotesi non si riferisce soltanto ad un parametro della v.c. X (come accade nel test dei segni), ma l'intera sua f.r.

Sia allora (X1, ..., Xn) un campione casuale di ampiezza n della v.c. X. Sulla base di esso si vuole costruire un test per il problema di ipotesi. Poichè tale problema riguarda la f.r. della v.c. X, è intuitivo basare la statistica test sulla f.r. empirica. Essa è definita come:

dove X(1), ..., X(n) sono le n v.c. campionarie ordinate.

La è una "stima campionaria" della "vera" f.r. F(x) della v.c. X. Anzi, siamo in presenza di uno stimatore consistente, poichè si può dimostrare che, come conseguenza della legge debole dei grandi nuemri, qualunque sia x la tende in probabilità, per n→∞, a F(x).

L'idea del test di Kolmogorov-Smirnov è piuttosto semplice e intuitiva. Poichè stima la "vera" f. r. F(x), è logico nasarsi su una qualche "distanza" tra e F0(x). Se e F0(x) sono "vicine" (cioè sono "sufficientemente simili") si accetta l'ipotesi nulla, mentre la si rifiuta se e F0(x) sono "lontane" (cioè se sono "molto dissimili"). Come "distanza" si usa la seguente:

cioè la massima differenza (in valore assoluto) tra la f.r. empirica e la f.r. teorica (ipotizzata come vera) F0(x). Per valori "grandi" di Dn si rifiuta l'ipotesi nulla, mentre la si accetta per valori "piccoli" di Dn.

Dunque, il "senso" della statistica Dn è intuitivamente evidente. Molto complicato invece è il calcolo della sua distribuzione di probabilità (sotto l'ipotesi nulla). Si può comunque dimostrare che sotto l'ipotesi nulla la distribuzione di probabilità della sttaistica test Dn non dipende dalla particolare forma funzionale di F0(x).

Questi risultati sono validi per le v.c. che hanno f.r. continua. Se invece X è una v.c. discreta e la sua f.r. è quindi discontinua, la distribuzione di probabilità della v.c. Dn dipende proprio dalla discontinuità della f.r. di X.


Vedi anche:

GNU Fdl - it.Wikipedia.org




Google | 

Enciclopedia |  La Divina Commedia di Dante |  Mappa | : A |  B |  C |  D |  E |  F |  G |  H |  I |  J |  K |  L |  M |  N |  O |  P |  Q |  R |  S |  T |  U |  V |  W |  X |  Y |  Z |