A estatística descritiva é a disciplina que describe as principais características dunha serie de datos[1] ou os describe cuantitativamente. Distínguese da inferencia estatística en que a estatística descritiva supón un resumo dos datos sen empregalos para extraer información sobre a poboación. A estatística descritiva non se basea na teoría da probabilidade.[2]
Uso da análise estatística
A estatística descritiva permite resumir de xeito sinxelo a forma e as observacións que se fixeron. Este resumo pode ser cuantitativo ou visual, empregando diagramas, e ser a base da descrición inicial dos datos ou suficientes por si sos para unha investigación particular. Por exemplo o porcentaxe de acertos en baloncesto é unha estatística que describe a actuación dun xogador ou dun equipo.[3]
O uso da estatística descritiva ten unha longa historia, xa que as táboas de poboación e de datos económicas foron a primeira parte da estatística que apareceu. Máis recentemente formuláronse novas técnicas na análise de datos, como os diagramas de caixas.
No mundo dos negocios a estatística descritiva aporta un resumo moi útil de gran cantidade de datos. Por exemplo, os investidores e os brokers manexan datos históricos para tratar de comprender o comportamento dos seus investimentos e tomar mellores decisións no futuro.
Análise unidimensional
A análise unidimensional estuda a descrición da frecuencia da distribución dunha variable, incluíndo os parámetros de centralización (media, mediana e moda), de dispersión (desvío estándar e varianza) e de posición (cuartís e percentís). A forma da distribución pode ser descrita con parámetros como o apuntamento e a curtose. As características da distribución dunha variable poden ser representadas con gráficas e táboas.
Análise bidimensional
Cando un estudo trata sobre máis dunha variable, a estatística descritiva pode empregarse para describir a relación entre un par de variables. Neste caso inclúense o traballo coas táboas de continxencia e os diagramas de dispersión, ademais da medida da dependencia.
A principal razón para diferenciar a análise bidimensional da unidimensional é que consiste non só nunha descrición, senón no estudo da relación entre dúas variables diferentes.[4]
As medidas cuantitativas para determinar a dependencia entre variables inclúen a correlación (como o r de Pearson ou o rho de Spearman) e a covarancia. A matemáticas na análise de regresión tamén reflicte a relación entre as variables. O emprego de logaritmos fai as gráficas máis simétricas e semellantes á distribución normal, sendo entón máis doados de interpretar intuitivamente.[5]
Notas
Véxase tamén
Ligazóns externas