Perfilado de sección

    • En esta parte podrás dejarnos tus comentario, aportes y/o dudas.

    • Al aprobar esta evaluación, se habilitará el sistema para la descarga del certificado. Podrás descargar cualquiera o los tres modelos de certificado en cuanto apruebas la evaluación.

    • Este curso está creado en base a los objetivos del programa de estudio del curricuum nacional chileno.

    • Una media muestral es un promedio de un conjunto de datos. La media muestral puede utilizarse para calcular la tendencia central, la desviación estándar y la varianza de un conjunto de datos. La media muestral puede aplicarse a una variedad de usos, incluyendo el cálculo de las medias de la población. Muchos sectores laborales también emplean el uso de datos estadísticos, por ejemplo:

      • Campos científicos como la ecología, la biología y la meteorología
      • Campos de la medicina y la farmacología
      • Datos e informática, tecnología de la información y ciberseguridad
      • Industria aeroespacial y aeronáutica
      • Campos de la ingeniería y el diseño

    • Calcular la media muestral es tan sencillo como sumar el número de articulos de un conjunto de muestras y dividir esa suma entre el número de articulos del conjunto de muestras. Para calcular la media muestral mediante programas de hojas de cálculo y calculadoras, se puede utiizar la fórmula: 

      x̄ = ( Σ xi ) / n

      Aquí, x̄ representa la media de la muestra, Σ nos dice que hay que sumar, xi se refiere a todos los valores X y n representa el número de elementos del conjunto de datos.


    • Si aún no esta totalmente claro, te invito a ver el siguiente video.

    • La desviación estándar o desviación típica es una medida que ofrece información sobre la dispersión media de una variable y es siempre mayor o igual que cero. La desviación es la separación que existe entre un valor cualquiera de la serie y la media.

      Ahora, que conocemos los conceptos media y desviación estandar, tenemos que la ultima se calculará de forma similar a la primera pero, tomando como valores las desviaciones. Y aunque este razonamiento es intuitivo y lógico tiene un fallo que vamos a comprobar con el siguiente gráfico.



      En la imagen anterior tenemos 6 observaciones, es decir, N = 6. La media de las observaciones está representa por la línea negra situada en el centro del gráfico y es 3. Entenderemos por desviación, la diferencia que existe entre cualquiera de las observaciones y la línea negra. Así pues, tenemos 6 desviaciones.

      1. Desviación -> (2-3) = -1
      2. Desviación -> (4-3) = 1
      3. Desviación -> (2-3) = -1
      4. Desviación -> (4-3) = 1
      5. Desviación -> (2-3) = -1
      6. Desviación -> (4-3) = 1

      Como podemos ver si sumamos las 6 desviaciones y dividimos entre N (6 observaciones), el resultado es cero. La lógica sería que la desviación media fuese de 1. Pero una característica matemática de la media respecto a los valores que la forman es, precisamente, que la suma de las desviaciones es cero. ¿Cómo arreglamos esto? Elevando al cuadrado las desviaciones. Así entonces, la fórmula para calcular la desviasión estándar sería:

      (1) La primera es elevando al cuadrado las desviaciones, dividir entre el número total de observaciones y por último hacer la raíz cuadrada para deshacer el elevado al cuadrado, tal que:


      (2) Alternativamente existiría otra forma de calcularla. Sería haciendo un promedio de la suma de los valores absolutos de las desviaciones. Es decir, aplicar la siguiente fórmula:




    • Observa este video y aprende cómo calcular la desviación estándar de un grupo de números en Excel!!
    • En este item queremos que nos muestres lo que has aprendido, por eso te presentaremos un ejercicio y además, dejaremos un foro, donde nos puedas contar cómo desarrollaste este desafío, qué herramientas usaste para resolverlo y en caso de que no hayas logrado hacerlo, cuentanos qué te ha detenido!

    • Cuando se desea hacer referencia a la relación entre el tamaño de la media y la variabilidad de la variable, se utiliza el coeficiente de variación (suele representarse por las siglas "C.V.").

      Su fórmula expresa la desviación estándar como porcentaje de la media aritmética, mostrando una interpretación relativa del grado de variabilidad, independiente de la escala de la variable, a diferencia de la desviación típica o estándar. Por otro lado, presenta problemas ya que a diferencia de la desviasión estándar este coeficiente es fuertemente sensible ante cambios de origen en la variable. Por ello es importante que todos los valores sean positivos y su media dé, por tanto, un valor positivo. A mayor valor del coeficiente de variación mayor heterogeneidad de los valores de la variable; y a menor C.V., mayor homogeneidad en los valores de la variable. Por ejemplo, si el C.V es menor o igual al 30%, significa que la media aritmética es representativa del conjunto de datos, por ende el conjunto de datos es "Homogéneo". Por el contrario, si el C.V supera al 30%, el promedio no será representativo del conjunto de datos (por lo que resultará "No Homogéneo"). Se expresa en porcentaje, y su fórmula es:



      • El coeficiente de variación no posee unidades, es decir es adimensional.
      • El coeficiente de variación es frecuentemente menor que uno. Sin embargo, en ciertas distribuciones de probabilidad puede ser 1 o mayor que 1.
      • Es insensible ante cambios de escala.
      • Para su interpretación se puede expresar como porcentaje, teniendo en cuenta que puede superar el valor 100%.
      • Depende de la desviasión estándar, también llamada "desviación típica", y en mayor medida de la media aritmética, dado que cuando ésta es 0 o muy próxima a este valor el C.V. pierde significado, ya que puede dar valores muy grandes, que no necesariamente implican una gran dispersión de datos.
      • El coeficiente de variación es común en varios campos de la probabilidad aplicada, como teoría de renovación y teoría de colas. En estos campos la distribución exponencial es a menudo más importante que la distribución normal. La desviación típica de una distribución exponencial es igual a su media, por lo que su coeficiente de variación es 1. La distribuciones con un C.V. menor que uno, como la distribución de Erlang se consideran de "baja varianza", mientras que aquellas con un C.V. mayor que uno, como la distribución hiperexponencial se consideran de "alta varianza". Algunas fórmulas en estos campos se expresan usando el cuadrado del coeficiente de variación, abreviado como S.C.V. (por su siglas en inglés).

    • Acá tienes una guía con ejerciciós y problemas sobre Coeficiente de Variación. Utilizalo para practicar y estudiar.

    • La correlación es una medida estadística que indica el grado de relación entre dos variables. Dos variables están relacionadas cuando al variar los valores de una variable también cambian los valores de la otra variable. Por ejemplo, si al aumentar la variable A también aumenta la variable B, existe una correlación entre las variables A y B.



    • Según cómo sea la relación que hay entre dos variables aleatorias, se distinguen los siguientes tipos de correlación lineal:

      • Correlación directa (o correlación positiva): una variable aumenta cuando la otra también aumenta.
      • Correlación inversa (o correlación negativa): cuando una variable aumenta la otra disminuye, y al revés, si una variable disminuye la otra aumenta.
      • Correlación nula (sin correlación): no existe ninguna relación entre las dos variables.

      Ten en cuenta que estos son los diferentes tipos de correlación lineal que hay, pero también puede ser que la relación matemática entre dos variables no se pueda representar con una recta, sino que se debe utilizar una función más compleja, como por ejemplo una parábola o un logaritmo. En tal caso sería una correlación no lineal.



    • El coeficiente de correlación, también llamado coeficiente de correlación lineal o coeficiente de correlación de Pearson, es el valor de la correlación entre dos variables.

      El coeficiente de correlación de dos variables estadísticas es igual al cociente entre la covarianza de las variables y la raíz cuadrada del producto de la varianza de cada variable. Por lo tanto, la fórmula para calcular el coeficiente de correlación es la siguiente:


      Cuando se calcula el coeficiente de correlación sobre una población, el símbolo de la correlación es la letra griega ρ. Pero cuando se está calculando el coeficiente respecto a una muestra suele usarse como símbolo la letra r.

      El valor del índice de correlación puede estar entre -1 y +1, ambos incluidos. Más abajo veremos cómo se interpreta el valor del coeficiente de correlación.


    • En el siguiente video puedes ver un ejemplo de cómo calcular el coeficiente de relación entre dos variables.

    • El valor del coeficiente de correlación puede ir desde -1 hasta +1, ambos incluidos. Así pues, según el valor del coeficiente de correlación, significa que la relación entre las dos variables es de una forma u otra. A continuación, se explica cómo interpretar el valor de la correlación:

      • r=-1: las dos variables tienen una correlación perfecta negativa, por lo que se puede trazar una recta con pendiente negativa en la que se encuentren todos los puntos.
      • -1<r<0: la correlación entre las dos variables es negativa, por lo tanto, cuando una variable aumenta la otra disminuye. Cuanto más cerca esté el valor de -1 significa que más relacionadas negativamente están las variables.
      • r=0: la correlación entre las dos variables es muy débil, de hecho, la relación lineal entre ellas es nula. Esto no significa que las variables sean independientes, ya que podrían tener una relación no lineal.
      • 0<r<1: la correlación entre las dos variables es positiva, cuanto más cerca esté el valor de +1 más fuerte es la relación entre las variables. En este caso, una variable tiende a incrementar su valor cuando la otra también aumenta.
      • r=1: las dos variables tienen una correlación perfecta positiva, es decir, tienen una relación lineal positiva.


      Como puedes ver en los gráficos de dispersión de arriba, cuanto más fuerte es la correlación entre dos variables más juntos están los puntos en el gráfico. Por otro lado, si los puntos están muy separados entre sí significa que la correlación es débil.