Coeficient de correlació de Pearson

Dins l'entorn de l'estadística, el coeficient de correlació de Pearson és un índex que mesura la relació lineal entre dues variables quantitatives.[1][2] A diferència de la covariància, la correlació de Pearson és independent de l'escala de mesura de les variables.

Definició

El coeficient de correlació entre dues variables aleatòries X i Y és el quocient de la seva covariància pel producte de les seves desviacions estàndard:

on és la covariància de i i les desviacions típiques de les distribucions marginals.

El valor de l'índex de correlació varia en l'interval [-1,+1]:[3][4][5]

  • Si r = 1, hi ha una correlació positiva perfecta. L'índex indica una dependència total entre les dues variables anomenada relació directa: quan una d'elles augmenta, l'altra també ho fa en proporció constant.
  • Si 0 <r <1, hi ha una correlació positiva.
  • Si r = 0, no existeix relació lineal. Però això no necessàriament implica que les variables són independents: poden existir encara relacions no lineals entre les dues variables.
  • Si -1 <r <0, hi ha una correlació negativa.
  • Si r = -1, hi ha una correlació negativa perfecta. L'índex indica una dependència total entre les dues variables anomenada relació inversa: quan una d'elles augmenta, l'altra disminueix en proporció constant.

Referències

  1. Correlation Coefficient. MathWorld. (anglès)
  2. «Chegg.com» (en anglès). Arxivat de l'original el 2022-01-27. [Consulta: 27 gener 2022].
  3. «What Is the Pearson Coefficient?» (en anglès). [Consulta: 27 gener 2022].
  4. «Pearson Correlation Coefficient» (en anglès americà), 18-09-2019. [Consulta: 27 gener 2022].
  5. «What is the Pearson Correlation Coefficient? - Definition | Meaning | Example» (en anglès americà). [Consulta: 27 gener 2022].

Vegeu també