Per a un conjunt de dades, la mitjana és la suma de tots els valors dividida pel nombre de valors del conjunt. La mitjana d'un conjunt de dades es denota normalment com . Aquesta mitjana és un tipus de mitjana aritmètica. Si el conjunt de dades estigués basat en una sèrie d'observacions obtinguda pel mostreig d'una població estadística, llavors aquesta mitjana s'anomena mitjana mostral () per distingir-la de la mitjana poblacional o x).[2][3] La mitjana se sol donar juntament amb la desviació tipus, ja que la primera descriu la localització central de les dades i la segona en descriu la dispersió. Una mesura alternativa de la dispersió és la desviació mitjana, que equival a la desviació absoluta mitjana de la mitjana: és menys sensible als valors extrems, però matemàticament no és tan amigable per tractar-la.
Si es pren una sèrie d'observacions com a mostra d'una població més gran (per exemple, agafant les alçades d'una mostra d'adults de la població mundial) o bé d'una distribució de probabilitat, llavors la població major es pot utilitzar per construir una "mitjana poblacional" que alhora és el valor esperat per la mostra extreta d'aquesta població. Per una població finita això seria simplement la mitjana aritmètica de la propietat en qüestió per a cada membre de la població; per una distribució de probabilitat, d'altra banda, seria la suma (o integral) sobre cada valor possible ponderat per la probabilitat d'aquest valor. És convenció universal representar la mitjana poblacional per .[4] En cas d'una distribució de probabilitat discreta, la mitjana d'una variable aleatòria discreta x s'obté agafant el producte de cada valor possible de x i la seva probabilitat P(x), i afegint tots aquests valors junts, donant .[5]
La mitjana mostral pot diferir de la mitjana poblacional —especialment per mostres reduïdes—, però la llei dels grans nombres dicta que, com més gran és la mostra, més probable és que la mitjana mostral serà igual a la mitjana poblacional.[6]
Les mitjanes també s'usen en camps diferents de l'estadística, com en geometria i anàlisi, per la qual cosa se n'han desenvolupat molts tipus, els quals es llisten a continuació.
La mitjana aritmètica és la mitjana "estàndard", i sovint se l'anomena simplement mitjana. Es calcula de la manera següent:[1]
No s'ha de confondre amb la mediana. La mitjana aritmètica d'un conjunt de dades no ha de ser per força el mateix valor que el valor del mig (la mediana) ni el que apareix més cops (el mode). Les distribucions asimètriques es descriuen millor amb la mitjana que no pas amb els altres estadístics (per exemple, la distribució exponencial o la distribució de Poisson).
Per exemple, la mitjana aritmètica dels sis valors 5, 10, 13, 7, 25 i 31 és:
La mitjana geomètrica és una mitjana útil per conjunts de nombres positius que són interpretats segons el seu producte i no pas segons la seva suma (com és el cas de la mitjana aritmètica). Per exemple, pot servir per taxes de creixement. El càlcul és el següent:[7]
Per exemple, la mitjana geomètrica dels sis valors 34, 27, 45, 55, 22 i 34 és
La mitjana harmònica és una mitjana útil per conjunts de nombres definits en relació a alguna unitat, com per exemple la velocitat (distància per unitat de temps). El seu càlcul és el següent:
Per exemple, la mitjana harmònica dels sis valors 34, 27, 45, 55, 22 i 34 és
Relació entre les mitjanes aritmètica, geomètrica i harmònica
Les mitjanes aritmètica (MA), geomètrica (MG) i harmònica (MH) satisfan aquestes desigualtats:
La igualtat es produeix només quan tots els elements de la mostra donada són iguals.
Mitjanes generalitzades
La mitjana generalitzada, també coneguda com a mitjana potencial o mitjana de Hölder, és una abstracció de les mitjanes aritmètica, quadràtica, geomètrica i harmònica. Es defineix sobre un conjunt de n nombres positius xi segons:
Escollint el valor adequat pel paràmetre m s'obtenen totes les mitjanes:
La mitjana aritmètica ponderada s'usa si es volen combinar els valors mitjans de mostres procedents de la mateixa població amb diferents mides mostrals:
Les ponderacions representen els límits de la mostra parcial.
Mitjana truncada
De vegades un conjunt de nombres pot contenir valors molt extrems, és a dir, molt més elevats o inferiors que els altres. Normalment se sol tractar de dades errònies causades per l'error experimental. La mitjana truncada, doncs, consisteix a descartar certes parts de les dades (les parts superior i inferior, normalment la mateixa quantitat als dos extrems) i després en fer la mitjana aritmètica de les dades restants. El nombre de valors extrets s'indica pel percentatge respecte al nombre total de valors.
Mitjana interquartílica
La mitjana interquartílica és un exemple específic de mitjana truncada: és simplement la mitjana aritmètica feta després de treure la quarta part de valors per sota i per sobre.
Mitjana d'una funció
En càlcul, i especialment en càlcul amb diverses variables, la mitjana d'una funció es defineix de manera general com el valor mitjà de la funció sobre el seu domini. Si només es té una variable, la mitjana d'una funció f(x) sobre un interval (a,b) es defineix per:
Cal recordar que una propietat del valor mitjà de molts nombres finits és que . En altres paraules, és el valor constant que, quan s'afegeix a ell mateix vegades, és igual al resultat d'afegir els termes de . Anàlogament, una propietat del valor mitjà d'una funció sobre l'interval és que . En altres paraules, és el valor constant que, quan s'integra sobre , és igual al resultat d'integrar sobre . Però segons el segon teorema fonamental del càlcul, la integral d'una constant és tan sols:
Això generalitza la mitjana aritmètica. D'altra banda, també és possible generalitzar la mitjana geomètrica per a funcions definint la mitjana geomètrica de f per
De manera encara més general, en teoria de mesura i teoria de probabilitat els dos tipus de mitjana tenen gran importància. En aquest context, la desigualtat de Jensen estima la relació entre aquestes dues nocions diferents de la mitjana d'una funció. Finalment, cal notar que també existeixen la mitjana harmònica i la mitjana quadràtica (o valor eficaç) d'una funció.
La mitjana de Fréchet dona una manera per determinar el centre d'una distribució de masses en una superfície o, més generalment, en una varietat de Riemann. De manera diferent a altres mitjanes, la de Fréchet es defineix en un espai els elements del qual no han de poder necessàriament ser afegits els uns als altres o ser multiplicats per escalars. També es coneix aquesta mitjana per mitjana de Karcher.
Totes les mitjanes llistades més amunt, amb l'excepció de la majoria de les mitjanes-f generalitzades, satisfan les següents propietats:
Si f és bijectiva, llavors la mitjana-f generalitzada satisfà la propietat de punt fix.
Si f és estrictament monòtona, llavors la mitjana-f generalitzada satisfà també la propietat de monotonia.
En general una mitjana-f generalitzada no té homogeneïtat.
Les propietats de sobre impliquen tècniques per a construir mitjanes més complexes:
Si C, M1, ..., Mm són mitjanes ponderades i p és un nombre real positiu, llavors A i B definides per
també són mitjanes ponderades.
Mitjana sense ponderar
Tal com es pot intuir, una mitjana sense ponderar equival a una mitjana ponderada amb el mateix pes per cada valor; una altra manera de dir-ho és que una ponderació homogènia permet canviar els paràmetres de ponderació sense que el resultat es vegi alterat.
Es defineix M, doncs, com una mitjana sense ponderar si és una mitjana ponderada que per cada permutació π dels pesos de ponderació el resultat és el mateix.
Simetria: per totes les n-tuples π i permutacions π sobre n-tuples.
De manera anàloga a les mitjanes ponderades, si C és una mitjana ponderada, són mitjanes sense ponderar, p és un nombre real positiu, llavors A i B definides per
també són mitjanes sense ponderar.
Mitjanes poblacionals i mostrals
La mitjana d'una població té una esperança de μ, coneguda com la mitjana poblacional. La mitjana mostral és un bon estimador estadístic de la mitjana poblacional, ja que el seu valor esperat és el mateix que la mitjana poblacional. La mitjana mostral d'una població és una variable aleatòria no constant i, conseqüentment, té la seva pròpia distribució. Per una mostra aleatòria de n observacions d'una població distribuïda normalment, la distribució de la mitjana mostral és: