• Home
  • Chi sono
  • Risorse
  • Contatti
  • Approfondimenti
  • Cerca nel sito

Lorenzo Govoni

Business e Tecnologia

  • Big Data
  • Business
  • Excel
  • Intelligenza Artificiale

Come calcolare la covarianza in Excel

Covarianza in Excel

Nello scorso articolo abbiamo visto come calcolare la correlazione tra due o più variabili con Excel.

Una tra le correlazioni di più diffuse, la correlazione di Pearson, esprime di fatto quanto due variabili siano più o meno legate tra loro da una relazione lineare.​

Un’altra misura interessante quando valutiamo e analizziamo relazioni tra variabili è certamente la covarianza, argomento centrale di questo articolo.

In particolare, dopo aver visto che cosa è e che cosa rappresenta, proponiamo le differenze con la correlazione. Infine vediamo un esempio di calcolo della covarianza in Excel.

 

Varianza per capire la covarianza

Per capire cosa rappresenta la covarianza, dobbiamo aver chiaro cosa sia la varianza di una variabile.

La varianza identifica la dispersione dei valori di una variabile X attorno alla media. Tanto più è piccola la varianza, tanto più i valori della variabile sono concentrati attorno al valor medio.

Quindi per calcolare la varianza è necessario conoscere il valore medio delle variabili che si stanno analizzando. Ciò è tenuto conto nella formula della varianza:

Ipotizzando che una variabile assumi i seguenti valori: 1,3,6,9,5. Avremo che la media μ è pari a:

E quindi applicando la formula appena vista avremo che la varianza (campionaria) sia pari a:

La varianza è un valore di secondo grado, per questo a volte si preferisce utilizzare la deviazione standard o lo scarto quadrico medio (definito anche come la radice quadrata della varianza, e indicato con la lettera sigma) per rappresentare questo scostamento.

Cos’è la covarianza?

Se la varianza è una misura di come una variabile casuale varia con sé stessa, allora la covarianza è la misura di come una variabile varia con un’altra.

Infatti, in matematica e statistica, la covarianza è una misura della relazione tra due variabili casuali. La metrica valuta quanto, in che misura, le variabili cambiano insieme.

In altre parole, è essenzialmente una misura della varianza tra due variabili. Tuttavia, la metrica non valuta la dipendenza tra le variabili.

La covarianza viene misurata in unità. Ciò significa che la covarianza può assumere qualsiasi valore positivo o negativo. I valori sono interpretati come segue:

  • Covarianza positiva: indica che due variabili tendono a muoversi nella stessa direzione.
  • Covarianza negativa: rivela che due variabili tendono a muoversi in direzioni inverse.

La formula della covarianza è simile alla formula per la correlazione e si occupa del calcolo dei punti dati dal valore medio in un set di dati. Ad esempio, la covarianza tra due variabili casuali X e Y può essere calcolata utilizzando la seguente formula (per popolazione):

Per una covarianza del campione, la formula viene leggermente modificata, come segue:

 

 

Covarianza vs. Correlazione

Covarianza e correlazione valutano entrambe principalmente la relazione tra variabili. L’analogia più vicina alle due misure statistiche è la relazione tra la varianza e la deviazione standard.

La covarianza misura la variazione totale di due variabili casuali dai loro valori previsti. Usando la covarianza, possiamo solo misurare la direzione della relazione (se le variabili tendono a muoversi nella stessa direzione o mostrano una relazione inversa). Tuttavia, non indica la forza della relazione, né la dipendenza tra le variabili.

D’altra parte, la correlazione misura la forza della relazione tra variabili. La correlazione è la misura in scala della covarianza. È senza dimensioni. In altre parole, il coefficiente di correlazione è sempre un valore puro e non misurato in nessuna unità.

La relazione tra i due concetti può essere espressa usando la formula seguente:

Con:

ρ (x, y): la correlazione tra le variabili X e Y

Cov(x, y): la covarianza tra le variabili X e Y

σx: la deviazione standard della variabile X.

σy: la deviazione standard della variabile Y.

Esempio di calcolo della covarianza in Excel

Vediamo ora un esempio di calcolo della covarianza in Excel. Supponiamo di ricevere i rendimenti mensili di due attività per un anno, oro e la criptovaluta Ethereum, come mostrato di seguito:

 

 

Per il calcolo della covarianza si può disporre di due metodi:

  • Formula Covarianza: Covarianza.P (della popolazione) e Covarianza.C (del campione);
  • Analisi dei dati.

Per applicare il primo metodo basta posizionarsi su una cella Excel, e digitare =Covarianza.P(C3:C14;D3:D14) o =Covarianza.C(C3:C14;D3:D14) a seconda del fatto che si voglia calcolare la covarianza della popolazione, nel primo caso, o la covarianza per campione nel secondo.

La covarianza della popolazione viene calcolata per l’esempio proposto nella cella G11:

 

 

La covarianza del campione invece viene calcolata nella cella G12:

 

 

Se invece si vuole adoperare il metodo 2, occorre fare clic sulla scheda “Dati“, quindi fare clic su “Analisi dei dati” (questa si avvale della covarianza.p nel calcolo):

 

 

Si aprirà la finestra Analisi dei dati.

 

 

Scegli “Covarianza”, quindi fai clic su OK.

 

 

Fai clic su “Intervallo di input”, quindi seleziona tutti i dati nella colonna 3 e 4 (C2:C14 e D2:D14). Includi le intestazioni di colonna.

Fai clic sulla casella di controllo “Etichette nella prima riga” visto che abbiamo incluso le intestazioni di colonna nella selezione dei dati.

Nell’”Intervallo di output”, seleziona un’area sul foglio di lavoro, ad esempio G3. 

 

 

Una volta compilato tutto fai clic su OK. La covarianza in excel verrà visualizzata nell’area selezionata nell’intervallo di output.

 

 

I termini della diagonale, rappresentano le varianze (0,00345 e 6,14743) mentre 0,00401 è la covarianza tra le due variabili, oro ed Ethereum. Nella riga in alto a destra abbiamo lo stesso risultato, 0,00401, anche se non è visualizzato.

L’esempio appena mostrato è quello di una matrice 2×2: tale matrice è detta matrice di covarianza. Essa si forma mostrando i valori della varianza delle varie variabili nella diagonale (in questo caso Oro e Ethereum) e la rispettiva covarianza per i valori sotto e sopra la diagonale principale. Questo poiché la matrice risulta simmetrica.

Quello che possiamo notare dalla matrice è che l’Ethereum assume varianza elevata rispetto all’oro, in quanto i valori di Ethereum sono più alti rispetto a quelli dell’oro.

Per scaricare il file di Esempio clicca su questo link. L’esempio visto (quasi uguale) lo puoi trovare anche nel video sotto: 

Conclusione

In questo articolo, abbiamo visto un altro strumento utile per il calcolo della relazione tra due o più variabili.

Dopo aver mostrato come calcolare la varianza di una variabile, si è calcolata la covarianza in Excel di due variabili. Solitamente il risultato della covarianza è riportato su una matrice, che viene detta matrice di covarianza.

In alcune situazioni, la covarianza viene utilizzata per misurare variabili con unità di misura diverse. Questo è dovuto al fatto che, gli studiosi sono in grado di determinare se le variabili stanno aumentando o diminuendo, ma non sono in grado di solidificare il grado in cui le stesse variabili si muovano insieme a causa del fatto che la covarianza non utilizza un’unità di misura standardizzata.

La correlazione, d’altra parte, standardizza la misura dell’interdipendenza tra due variabili e informa su quanto le due variabili si muovano insieme.

Condividi
Pin1
Condividi
Tweet
  • Data Visualization: come rappresentare correttamente i datiData Visualization: come rappresentare correttamente i dati
  • Come utilizzare il Pert per determinare la durata di un progettoCome utilizzare il Pert per determinare la durata di…
  • Modello di Kano per individuare la soddisfazione dei clientiModello di Kano per individuare la soddisfazione dei clienti
  • Principio di funzionamento di un algoritmo geneticoPrincipio di funzionamento di un algoritmo genetico

Excel Analisi dati

  • Home
  • Archivio
  • Risorse
  • Newsletter
  • Cerca nel sito

Copyright © 2019 · Lorenzo Govoni - Privacy Policy