Saltar la navegación

Resumen

Población es el conjunto de elementos objeto del estudio estadístico.
Cuando la población es muy numerosa o inaccesible, extraemos una muestra o  subconjunto de ella. El número de elementos de la muestra, N, se llama tamaño de la muestra. Es muy importante para nuestro estudio que la muestra sea representativa de la población.
Individuo es cada elemento de la población o de la muestra.
Variable es la característica que estamos estudiando en cada individuo.
Hay diferentes tipos:
Variable cualitativa: si es no numérica.
Variable cuantitativa: si es numérica. Hay dos tipos:
     • Variable cuantitativa discreta: si toma valores aislados.
     • Variable cuantitativa continua: Si toma cualquier valor entre dos dados.
Hay dos tipos de parámetros:
Medidas de centralización: media, moda, mediana y cuartiles. Nos dan información sobre cuál es el valor en el  “centro” de la distribución de datos.
Media (o media aritmética): se calcula sumando todos los números y dividiendo por N (el tamaño de la muestra o de la población).
Medidas de dispersión: rango o recorrido, desviación media, desviación típica y varianza. Nos dicen cómo de dispersos están los datos.
Varianza:
Desviación típica:

Una variable aleatoria es una función que asocia un número real a cada elemento del espacio muestral:

X:E→R

Las variables aleatorias, al igual que las estadísticas, pueden ser discretas (valores aislados) o continuas (valores en un intervalo).

La función de probabilidad de una variable aleatoria discreta es la que asigna a cada valor de la variable su probabilidad:

La media o esperanza matemática de una variable aleatoria discreta X, que toma valores x1, x2,…, xn con probabilidades p1, p2,…, pn es:

Y su desviación típica será:

Es la distribución de probabilidad discreta más utilizada y se caracteriza por:

–Conlleva n experimentos idénticos (llamados experimentos de Bernoulli).

–En cada experimento, sólo son posibles dos resultados contrarios, que se suelen llamar éxito y fracaso.

–Cada experimento es independiente.

–Las probabilidades de éxito y fracaso son las mismas en cada experimento:

        p = P(éxito)     q = 1-p = P(fracaso)

Se llama variable aleatoria binomial, X, a la que expresa el número total de éxitos en las experiencias que siguen el modelo de una distribución binomial.

Entonces:

Los parámetros para un experimento son:

Para B(n,p) son:

Dada una variable aleatoria continua, carece de sentido asignar probabilidad a cada uno de sus posibles valores ya que puede tomar los infinitos valores que hay en un intervalo, luego la probabilidad sería 0.

Puesto que no es posible definir la función de probabilidad de una variable continua, es necesario introducir un nuevo elemento que la sustituya y que caracterice a la distribución de probabilidad continua, como lo hacía la función de probabilidad discreta.

Para ello usamos una función, la función de densidad f(x), que nos permite hallar probabilidades mediante el cálculo del área debajo de la curva en el intervalo. Ha de cumplir:

· f(x) ≥ 0

· El área bajo la curva de f(x) es 1

Entonces:

La distribución normal o de Gauss es la que se ajusta a un gran número de variables de nuestro entorno.

Una variable aleatoria continua de media µ y desviación típica σ, es una normal si su función de densidad es:

y se escribe N(µ,σ).

Propiedades:

–Dominio: R.

–Simetría respecto a x = µ.

–No corta al eje X.

–Tiene un máximo relativo y absoluto en x = µ.

–Crece en (-∞,µ) y decrece en (µ,∞).

–Puntos de inflexión en µ-σ y µ+σ.

–Área encerrada bajo la curva es 1.

Es la que tiene µ = 0 y σ = 1, N(0,1), y se llama variable normal estándar o tipificada.

Se utiliza una tabla para el cálculo de las probabilidades de Z = N(0,1).

Para otras probabilidades, es fácil comprobar que hacemos:

En situaciones prácticas no suele aparecer Z = N(0,1) y, por lo tanto, hemos de transformar N(µ,σ) en N(0,1) para poder utilizar la tabla. Este proceso se llama tipificación de la variable, y se hace mediante el cambio de variable:

Entonces:

Si X es una variable aleatoria discreta que sigue una distribución binomial, X = B(n,p), entonces

se aproxima a N(0,1).

Es decir, X se aproxima a N(np,√npq). La bondad de la aproximación es mayor cuanto mayor sea n y cuanto más próximo este p de 0,5 (npq>10).

Además, hace falta una corrección ya que, al tratarse de una variable discreta, no puede ser que P(X = a) = 0.

Estas correcciones son: