L’inferenza statistica è il procedimento mediante il quale dall’analisi dei dati osservati su un campione, si perviene a conclusioni relative all’intera popolazione.

Si possono distinguere due tipi di inferenza statistica:

1)    Stima campionaria, quando dal campione si può stimare il valore di qualche parametro della popolazione (media, varianza, ecc.).

2)    Problema di verifica delle ipotesi dove per mezzo del campione si vuole decidere se un’ipotesi fatta su una data popolazione è accettabile, o rifiutabile a un dato livello di significatività.

Il problema che sorge in una rilevazione campionaria è la scelta di un campione rappresentativo dell’intera popolazione, esistono vari metodi di campionamento come: campionamento casuale semplice, campionamento per stratificazione, campionamento a più stadi e campionamento sistematico.

Nel campionamento casuale semplice la scelta del campione può essere fatta seguendo due schemi: bernoulliana e in blocco.

L’insieme di campioni viene detto spazio dei campioni, mentre il rapporto fra l’ampiezza del campione e il numero delle unità della popolazione  è detto frazione di campionamento.

Il parametro di una popolazione è un valore che la caratterizza è  viene genericamente indicato con ϑ (theta).

Avendo dei dati campionari si possono effettuare due tipi di stima:

–          Stima puntuale, quando si assegna al parametro un valore ricavato dal campione, essa è la stima più semplice ma più suscettibile ad errore.

–          Stima di intervallo, quando al parametro si assegnano infiniti valori di un intervallo che viene calcolato, in base a un livello di fiducia fissato.

Lo stimatore (T)  deve soddisfare alcune condizioni che sono: correttezza, consistenza, efficienza.

Uno stimatore è corretto se il suo valore medio M(T) è uguale al valore del parametro che deve stimare quindi M(T) = ϑ.

Uno stimatore è consistente, se al crescere della dimensione del campione, i suoi valori si avvicinano sempre più al parametro da stimare .

Uno stimatore è detto efficiente, se la sua varianza è piccola, quindi se i suoi valori sono concentrati vicino al parametro.

Ipotesi

Si definisce ipotesi statistica un’affermazione, su un parametro di una popolazione statistica, ad esempio essendo ϑ un parametro della popolazione; l’ipotesi consiste nel supporre che ϑ valga un certo valore che indichiamo ϑ0, cioè che ϑ = ϑ0.

Estratto un campione e calcolata una stima di ϑ non è detto che il valore trovato coincida proprio con ϑ0, quindi ci chiediamo se la differenza tra ϑ0 e la stima e grande tale da rifiutare l’ipotesi o viceversa piccola ed accettare l’ipotesi fatta , per questi motivi l’ipotesi viene detta ipotesi dello zero e si scrive:

H0: ϑ = ϑ0

Ogni altra ipotesi diversa dall’ipotesi nulla e detta ipotesi alternativa e si indica con H1, si possono formulare varie ipotesi alternative in relazione al problema, le ipotesi statistiche si possono suddividere in semplici e composte:

 

Semplici:                                                                                                                                                                                                                   Composte:

H0: ϑ = ϑ0                                                                                                                                                                                                                                         H1: ϑ ≠ ϑ0

H1: ϑ = ϑ1                                                                                                                                                                                                                                                                                          H1: ϑ > ϑ0

                                                                                                                                                                                                                                                                                                              H1: ϑ < ϑ0

Il valore di α è detto livello di significatività proprio per indicare che la differenza fra ϑ0 e la stima ricavata dal campione è significativa e naturalmente più piccolo è alfa più il test è significativo, attraverso la rappresentazione grafica si evidenziano la regione di accettazione dell’ipotesi H0 e la regione di rifiuto dell’ipotesi stessa, detta anche regione critica.

Un test che presenta una scelta non opportuna del livello di significatività potrebbe causare degli errori che possono essere: errore di prima specie se si rifiuta un’ipotesi quando essa è vera; la probabilità di commettere questo tipo di errore è uguale a α => P(rifiutare H0 |H0) = α (α è la probabilità di rifiutare H0 quando H0 è vera)

Se invece si accetta un’ipotesi quando è falsa si commette un errore di seconda specie; la probabilità di commettere questo tipo di errore è uguale a β => P(accettare H0 |H1) = β (β è la probabilità di accettare H0 quando H0 è falsa ed è vera H1).