viernes, 29 de mayo de 2015

8. Medidas de tendencia central, posición y dispersión:


En esta entrada veremos diferentes maneras de interpretar los datos, así como ver que tipo de distribución tienen y las asimetrías y curtosis que pueden presentar.

Resumen numérico de una serie estadística:
Nuestras observaciones también podremos resumirlas mediante datos estadísticos. Las medidas estadísticas pueden dividirse en:

-Medidas de tendencia central: Nos darán una idea del tamaño de los datos.


  • Media aritmética o media: Se usará para variables cuantitativas. Es la suma de todos los valores del variable entre el número total de observaciones. Nos mostrarán en centro geométrico de los datos. Si los datos están agrupados sumaremos los intervalos de clase multiplicados por su frecuencia absoluta correspondiente y lo dividiremos entre el número de observaciones.
  • Mediana: Será el valor que, si colocamos todas las variables en escala de menor a mayor, deje el 50% de las observaciones por encima, y el 50% de las observaciones por debajo. Si el número de observaciones es impar la mediana será justamente el número que se encuentra en las posición (n/2+1). Por el contrario si el número de observaciones es impar, será la media de los dos valores centrales.
  • Moda: Es el valor que más se repite en nuestras observaciones. SI hay dos valores que se repiten el mismo número de veces será bimodal, y si son más de dos los que se repiten el mismo número de veces se llamará multimodal. Si los datos están agrupados y la amplitud es la misma en todos los intervalos la moda se encontrará en el intervalo cuya frecuencia absoluta sea mayor. SI la amplitud entre los intervalos es diferente la moda se encontrará en el intervalo en el que el cociente entre la frecuencia relativa y la amplitud sea mayor. 


-Medidas de posición: Se usan para variables cuantitativas, sólo se tendrá en cuenta la posición de los valores de la muestra.

  • Percentiles: Dividirán la muestra en 100. El percentil i será aquella que, ordenadas todas las observaciones de la muestra, el i% de las observaciones sean menores y el 100-i% sean mayores.
  • Deciles: Se dividirá la muestra en 10 partes el decil i será aquel que, ordenando las muestras de menor a mayor, el i/10% sean menores que el y el (100-i)/10% sean mayores.
  • Cuartiles: Dividirán la muestra en cuatro partes, el Q1 por ejemplo indicará que el 25% de las observaciones son menores que el y el 75% mayores.
-Medidas de dispersión: 
  • Rango o recorrido: Será la resta del valor mayor de la muestra y el menor. Mientras mayor sea el recorrido más dispersión habrá.
  • Desviación media: Será la media aritmética de las distancias de cada observación con respecto a la media de la muestra.
  • Desviación típica: Nos mostrará el margen de error que cometeríamos si representásemos una muestra solo por su media.
          
  • Varianza: Expresará la misma información que la desviación media pero elevada al cuadrado.
  • Recorrido intercuatílico: Será el valor absoluto de la diferencia entre el tercer y el primer cuartil.
  • Coeficiente de variación: Es una medida de dispersión relativa adimensional, compararemos la heterogeneidad de dos series numéricas. Será la división de la desviación típica entre la media aritmética.

Distribuciones normales:

Será la distribución de Gauss es una de las distribuciones de probabilidad de variable continua que aparece con más frecuencia en los fenómenos reales.
Se trata de una gráfica con forma de campa y simétrica con respecto a los valores de posición central.
Asimetrías y curtosis:

Las simetrías pueden ser:
  • g1=0 Querrá decir que se trata de una distribución simétrica, habrá la misma concentración de valores a la izquierda y a la derecha.
  • g>0: Se trata de una distribución asimétrica positiva, habrá mayor concentración a la derecha de la media.
  • g<0: Se trata de una distribución asimétrica negativa, en ella habrá mayor concentración de valores a la izquierda de la media.





Los tipos de curtosis son:

  • g2=0 Será una distribución mesocúrtica. EL grado de concentración medio está alrededor de los valores centrales de la variable.
  • g2>0 Será una distribución leptocúrtica, ésta presentará un  gran grado de concentración en torno a los valores centrales de la variable.
  • g2<0 Distribución platicúrtica, habrá un reducido grado de concentración en torno a los valores centrales de la variable.

No hay comentarios:

Publicar un comentario