Temas de Estadística Práctica
Antonio Roldán Martínez


Muestreo y estimación


Estás en
Inicio > Estadística >> Tema 7 - Muestreo y estimación

Tema 7   

 

Muestreo y Estimación

Cuestión-ejemplo

Prácticas

Ejercicios

Uso en el aula

Para ampliar
  

  Estimadores en la correlación y la regresión


 
Caso práctico

Resumen teórico

 

Cuestión - Ejemplo

¿Cómo votarán estos jóvenes en el referendum?

Una profesora de Historia, ante la proximidad de un Referendum en la Unión Europea, decide realizar una encuesta entre 200 de sus alumnos. Obtiene los siguientes resultados:

  Sentido de la votación
SI 95
NO 70
No sabe/No contesta 35

Según estos resultados, ¿se puede inferir que en el Referendum el SI obtendrá el 50% de los votos, o más?

Esta situación es un ejemplo claro de la necesidad de efectuar una operación estadística llamada Estimación.

La encuesta que realiza la profesora abarca una muestra de alumnos y lo que le interesa a ella es qué puede ocurrir en la población. Cada vez que tenemos que comparar un colectivo (llamado población) con una de sus partes (llamada muestra), debemos realizar una operación llamada estimación.

Concretamos

Población

Es el conjunto de referencia que pretendemos estudiar, formado por elementos que comparten una misma propiedad: Españoles adultos, alumnos de la Enseñanza Privada de Méjico, fresnos existentes en la Sierra de Guadarrama.

Censo

Si es posible estudiar toda la población, por ejemplo, los alumnos de un colegio, a este estudio le llamaremos censo. Un censo no siempre es posible, especialmente por motivos económicos.

Muestra

Una muestra es un subconjunto de la población, y es el que verdaderamente se estudia en la inmensa mayoría de los experimentos y estudios. Se debe acudir a muestras cuando la población es demasiado numerosa (población infinita), o bien resulta muy caro un estudio exhaustivo. Otro motivo suele ser que el experimento requiera pruebas destructivas, y no es caso de destruir la población.

Una muestra es representativa cuando tiene una estructura y unos parámetros muy parecidos a la población. Desgraciadamente, esta definición no es útil, pues generalmente no se conoce con seguridad la población, o existe la sospecha de que sus características hayan cambiado. Llamaremos muestreo al conjunto de técnicas que nos ayudan a elegir una muestra representativa.

Muestreo

La operación de elegir una muestra puede ser tan compleja que llena libros enteros. Aquí sólo repasaremos las cuestiones de muestreo más frecuentes.

La parte de la Estadística que estudia las estimaciones (relaciones entre poblaciones y muestras) se llama Estadística Inferencial, y es la que comenzamos a estudiar en esta sesión.

 

En el resumen teórico puedes repasar los conceptos de Muestreo, Estimación y sus distintas variantes.

Estimación de parámetros

Como habrás visto en la Teoría, se pueden estimar unas características numéricas de la población, llamadas parámetros, mediante unas medidas efectuadas en la muestra, a las que llamaremos estadísticos. Los más populares son:

La media: Mediante el promedio de los datos de una muestra se intenta inferir qué media tendrá la población. Por ejemplo, se mide la resistencia de unos tornillos y se desea con ellos estimar qué resistencia ofrecerán los tornillos fabricados en un largo periodo de tiempo.

La proporción: Es la estimación propia de las encuestas, y por tanto de la de nuestro ejemplo. Se calculan porcentajes en la muestra y con ellos se estiman las proporciones en la población.

La varianza: Se mide la variabilidad de la muestra y con ella se estima la de la población. En este caso no se usa la desviación típica, sino un estadístico muy parecido, la cuasidesviación típica o desviación estándar. Por ejemplo, midiendo las varianzas de varios exámenes de una asignatura en varios cursos se puede inferir la que esperaremos en el próximo curso.

Iremos viendo ejemplos de cada caso. No es necesario que memorices o estudies a fondo la teoría, sino más bien observa cómo trabajan los modelos de esta sesión.

Hay dos clases de estimación:

Puntual: Consiste en asignar al parámetro de la población el mismo valor que su correspondiente estadístico en la muestra. Es una operación muy arriesgada, porque normalmente no coinciden los dos valores. Si así fuera, acertarían todos los sondeos previos a las elecciones.

Por intervalos: En esta modalidad se rodea el valor de la estimación de todo un intervalo de tolerancia, llamado intervalo de confianza (coloquialmente horquilla), en el que se puede evaluar la probabilidad de que figure el verdadero valor del parámetro. Así, si afirmamos que  (8,22 , 9,40) es un intervalo de confianza al 96% para la media de una población, queremos indicar que en un 96% de las estimaciones similares que se realizaran, en un 96% de los casos la media pertenecería a ese intervalo, y sólo en un 4% caería fuera.

 


Práctica 1


Estimación de la proporción


Propiedades de la muestra y la población

La profesora de Historia desea efectuar una estimación, pues dispone de los datos de una muestra y con ellos quiere descubrir qué ocurrirá en la población. En estos casos conviene repasar las propiedades de la población y la muestra que se estudian.

Ten preparada la hoja estima.ods.

 

Desarrolla la práctica siguiendo las explicaciones del documento practica71.pdf


Práctica 2


Estimación de la media

Realizaremos ahora una estimación de la media de una población con varianza desconocida mediante la misma hoja estima.ods.

 

El desarrollo de la práctica lo tienes en  practica72.pdf


Práctica 3

Estimación de la varianza

Abre de nuevo estima.ods y sigue el desarrollo de la práctica en el documento practica73.pdf


Ejercicio 1

Deseamos estimar el número de hijos que por término medio tienen las familias que matriculan a sus hijos en nuestro colegio. Para ello elegimos al azar cuarenta alumnos matriculados en el presente curso y les preguntamos cuántos hermanos son en la familia. Obtenemos estos resultados:

1 1 2 4 3 2 1 5 2 3
3 1 1 2 2 2 3 2 4 5
2 2 3 1 3 1 2 2 1 3
2 2 3 1 1 2 2 1 3 1

¿Qué intervalo de confianza, al 95%, podemos construir para la media de hijos por familia entre los que tienen hijos en el colegio?

Solución: El número de familias es grande, luego la población es, en la práctica, infinita, pero si quieres ser más realista, escribe de 1.000 a 5.000, por ejemplo. La media de hijos por familia es de 2,18, la desviación típica de 1,07, y el intervalo de confianza al 95% considerando 1.000 familias, resulta ser (1,73 , 2,63), demasiado amplio, debido a la pequeñez de la muestra.

 


Ejercicio 2

En un centro desean establecer el horario del descanso a media mañana. Actualmente abarca desde las 11h hasta las 11h 30m. Se está pensando en cambiarlo al intervalo de 11h 15m a 11h 45m. Se pregunta a cuarenta alumnos si se mantiene el mismo horario (respuesta MANTENER) o se cambia (respuesta CAMBIAR). Se efectúa el recuento con el resultado de 28 respuestas MANTENER y 12 CAMBIAR.

(1) Construir un intervalo de confianza al 95% para la proporción de la respuesta MANTENER, es decir, la opinión de todo el centro, cuya población, a efectos prácticos se puede considerar infinita, pues tiene una matrícula de más de 2000 alumnos. Evaluar el error cometido.

(2) A la vista del error anterior, se quiere realizar un sondeo más potente, cuyo error esperado sea del 5% ¿A cuántos alumnos se ha de preguntar?

Solución: Al ser una muestra tan pequeña, el intervalo de confianza no tiene apenas validez, pues volcando los datos en la hoja de cálculo estima.ods, resulta ser de (0558,0,842), o sea, entre el 55,8% y el 84,2% para la respuesta MANTENER. El sondeo ha sido inútil, pues nos da un error del 14%. Para obtener el tamaño de muestra adecuado usamos la Búsqueda de Valor Destino (ver Práctica 1) y nos resulta un tamaño de 321 alumnos al menos.

 

 


Ejercicio 3

Dos profesores intercambian opiniones sobre la variabilidad de los resultados de unas pruebas. El primero afirma que en su materia él suele obtener una desviación típica de 2,3 en pruebas puntuadas del 0 al 10. Lleva muchos años estudiando sus resultados y este valor resume la totalidad de los ejercicios propuestos a lo largo de su vida profesional. Su compañero cree que sus pruebas presentan más homogeneidad, pero no puede demostrarlo. Para estudiar esta cuestión resume en la siguiente tabla muchos resultados de 0 a 10 obtenidos en sus últimas pruebas.

Puntuación Frecuencia
0 22
1 24
2 35
3 69
4 122
5 323
6 242
7 55
8 32
9 16
10 2

¿Cómo podría estimar la desviación típica de la población formada por todas las pruebas propuestas?

Solución: Puedes usar la hoja de cálculo confrec.ods incluida en el Tema 2 para obtener la media y desviación típica de la muestra. Deberías obtener los resultados de una media igual a 4,95 y desviación típica de 1,69 (varianza 2,87) para una muestra de 942 datos.

Aparentemente esto le da la razón: sus pruebas son más homogéneas. Para realizar una estimación por intervalos se puede acudir, con esos datos, a la hoja de cálculo estima.ods en el apartado de varianza. Con un nivel de confianza del 95%, se obtiene el intervalo (1,62 , 1,78) para la desviación típica. Como ambos son inferiores al valor de 2,3 de su compañero, deberemos aceptar que sus resultados son más homogéneos.

 


Uso en el aula


Herramientas

 

estima.ods

Hoja de cálculo que permite realizar estimaciones mediante intervalos de confianza. para la media, la varianza y la proporción. Una vez conseguida la estimación, asigna una probabilidad (p-valor) a cualquier otro valor posible del estadístico.

medidas.ods

Calcula la precisión, mediante las técnicas de estimación, en el caso de medidas repetidas.

 

regresion.ods

Aunque esta herramienta pertenece al Tema 5, la inclusión de técnicas de estimación permite su uso también en este Tema. Estima el coeficiente de correlación y los de la regresión. También contiene el Análisis de la Regresión mediante la aplicación de las técnicas del Análisis de Varianza.


Para ampliar


Estimadores en la regresión y correlación

Prepara la hoja   regresion.ods (tema 5) 

 

Con ella estimarás los parámetros de regresión. Lee para ello el documento ampliar7.pdf


Un caso práctico


¿Cómo tratar el problema de las medidas repetidas?

Prepara la hoja medidas.ods

y con ella estudia las medidas repetidas de unos clavos, siguiendo el texto del documento caso7.pdf