Temas de Estadística Práctica
Antonio Roldán Martínez


Recogida de datos


Estás en
Inicio > Estadística > Tema 1 - Recogida de datos

Tema 1 

 

Recogida de datos y tabulación

Cuestión-ejemplo

Prácticas

Ejercicios

Uso en el aula

Para ampliar

   Una simulación

  
Histograma de frecuencias

  
Frecuencias automáticas

   Un caso práctico de recogida de datos

Resumen teórico

 

Advertencias preliminares

En el momento de estudiar el primer tema es conveniente que tengas en cuenta algunos detalles sobre su desarrollo:

Resúmenes teóricos

En el desarrollo de los temas no se incluye toda la teoría estadística correspondiente, por no acumular mucha materia que puede ralentizar el aprendizaje. Por ello, en algunos momentos te remitiremos a la lectura de la Teoría, generalmente para afianzar lo aprendido, pero también para que completes algunos conceptos. No busques en este resumen grandes desarrollos teóricos, que son más propios de los manuales de Estadística. Sería buena idea que dispusieras de algún libro. Bastaría con que desarrollara los temas propios de las asignaturas de Matemáticas o Estadística de Enseñanza media o Preuniversitaria.

Aprendizaje del manejo de la Hoja de Cálculo

Las hojas incluidas en este curso tienen formato .ods, por lo que pueden abrirse con OpenOffice y LibreOffice principalmente. Casi todas ellas funcionarán también en Excel o cualquier otra hoja de cálculo que lea este formato.

En los documentos realizaremos las explicaciones a partir del LibreOffice, ya que actualmente posee un diseño más claro, pero se pueden extender a otras hojas de cálculo.

Para seguir este curso no necesitas dominar el programa Calc o Excel. Irás aprendiendo técnicas a la vez que repasas la Estadística. No obstante, en las primeras te sugeriremos que leas las Guías correspondientes en www.hojamat.es:

Excel 2010

LibreOffice 4 Calc

OpenOffice 4 Calc

 

Apertura de los archivos de Hoja de Cálculo

En el desarrollo del curso deberás abrir muchos modelos de Hoja de Cálculo. Normalmente dispondrás de un enlace desde el documento que estés leyendo. El comportamiento de descarga o apertura dependerá de cada navegador. Te aconsejamos elegir siempre Descargar o Guardar como... en lugar de Abrir, para así tener más dominio sobre el proceso. Si usas tableta o teléfono es probable que no puedas abrir las hojas de cálculo, por lo que deberás intentarlo mejor en un ordenador. Sí te serán muy útiles para repasar documentos.

Ejecución de macros

Según el nivel de seguridad de tu equipo, es probable que en algunas hojas de cálculo se pida conformidad para ejecutar macros. Las que están incluidas han sido programadas todas por el autor, por lo que puedes autorizar su funcionamiento sin problemas.

En LibreOffice y OpenOffice necesitarás tener instalado un entorno Java. Para que se reconozca deberás entrar en Herramientas - Opciones - Avanzado y allí añadir la dirección de dicho entorno en la opción "Usar un entorno de ejecución Java". Como te puede resultar complicado, intentaremos incluir pocas macros en nuestros modelos. También se han creado versiones en Excel de las hojas más complejas, por si tuvieras problemas con el entorno Java.

Estructura de este documento y los similares

Para facilitar el uso desde teléfonos móviles o tabletas, incluiremos en este tipo de documentos el texto mínimo imprescindible, remitiendo a menudo a documentos en PDF.


Desarrollo del trabajo

Comenzamos a trabajar. En todos los temas usaremos una cuestión previa para introducir los temas de tipo estadístico. Así también se refuerza el carácter práctico de los mismos, resaltando su conexión con temas reales. En esta primera sesión de trabajo responderemos a esta pregunta:

 

Cuestión - Ejemplo 

¿Qué número de letras suelen tener las palabras en nuestro idioma?
 

 

Un trabajo muy ameno en las clases de Estadística es efectuar un recuento del número de letras que suelen tener las palabras en nuestro idioma. Se puede organizar un recuento de datos en varios niveles. Por ejemplo, algunos equipos de alumnos pueden elegir textos de prensa, otros de libros técnicos, de revistas de Informática y otros, e intentar descubrir diferencias entre la distribución de letras en las palabras de cada tema. También puede ser interesante comparar unos idiomas con otros.

Una variante de este trabajo puede ser el descubrir la vocal más frecuente en cada uno de los idiomas, o el reparto de vocales y consonantes en las palabras, o la abundancia de adjetivos o ciertas conjunciones.

A continuación puedes ver los datos que hemos obtenido con tres recogidas diferentes:

  1. Prensa: Textos procedentes de varios ejemplares de prensa, con párrafos elegidos aleatoriamente
  2. Técnicos: Párrafos extraídos de revistas de Informática
  3. Sociales: Algunos textos procedentes de libros de Ética y Sociología

Núm. letras

Prensa

Técnicos

Sociales

Total

1

14

6

17

37

2

83

103

97

283

3

44

50

43

137

4

34

36

28

98

5

38

29

41

108

6

25

30

23

78

7

24

33

31

88

8

19

24

25

68

9

12

18

25

55

10

18

5

12

35

11

5

10

6

21

12 o más

6

8

12

26

Totales

322

352

360

1034

Se ha detenido el recuento cuando se ha superado el número de trescientos y se ha explorado el último párrafo completo. Este hecho explica el que los totales sean diferentes en las tres columnas.

Si lo deseas, abre el modelo de Hoja de Cálculo letras.ods. Observarás que contiene la tabla que acabas de leer y que constituye un ejemplo claro de la naturalidad con la que una Hoja de Cálculo maneja las tablas de tipo estadístico.

Recuerda que lo único que necesitas saber de hojas de cálculo para seguir este curso son los conocimientos mínimos sobre la estructura de filas y columnas, la existencia de fórmulas en algunas celdas y la edición de las mismas. El resto lo irás aprendiendo sobre la marcha. No obstante, puedes leer el primer capítulo de las Guías presentadas más arriba para aprender lo que necesitas en esta primera sesión.

Lo que nos interesa en este momento es la teoría estadística que hay detrás de esta tabla de recuento. Analízala:

 

Variable estadística

La primera columna de la tabla constituye la variable estadística que estamos estudiando. Es una variable porque puede tomar más de un valor y suele representar la característica que deseemos estudiar. En este caso oscila entre 1 y 12 o más. Cuando leas el resumen teórico aprenderás más sobre variables. De momento, basta considerar que la variable que nos interesa es el número de letras de las palabras.

La variable contiene una característica, que en este ejemplo es el número de letras de cada palabra recogida. Es una característica cuantitativa, porque se expresa mediante un número. Si no se pudiera representar por números la llamaríamos cualitativa.

Cuando se estudia una variable puede ser interesante concretar el tipo de medida que se usa para recoger los datos. Este concepto de tipo de medida es fundamental en Estadística, pero en este momento no tienes que profundizar demasiado en él. Acude al resumen teórico para leer las definiciones.

Estudia en el resumen teórico la parte relativa a las características, variables y tipos de medida.

Si ya has leído el resumen entenderás el párrafo que sigue. Si no, déjalo si quieres para otro repaso del tema.

Las medidas que usamos en este caso son;

Así pues, la variable de estudio está medida a nivel de intervalo, es cuantitativa y discreta, porque sólo puede tomar los valores aislados 1,2,3,...

 

Repasa bien la teoría de nuevo si no llegas a comprender en profundidad el párrafo anterior.

 

Frecuencias

Si la primera columna contiene la variable que estudiamos, las siguientes columnas representan las frecuencias, que recogen el número de veces que ha aparecido cada valor 1,2,3...  Al haber tres fuentes de datos, hay también tres columnas de frecuencias, pero eso no es habitual. En la tabla falta la última columna de totales, que la rellenarás tú en las Prácticas. Es importante que entiendas lo que es la frecuencia y como se representa:

 

El número de veces que se repite un valor concreto en una recogida de datos se llama frecuencia absoluta o simplemente frecuencia. Se representa por la letra n o por la f, según los distintos textos. Aquí usaremos n. La suma de todas las frecuencias coincide con el número total de elementos estudiados, al que representaremos por N.

 

Así que en nuestra tabla las columnas segunda a cuarta representan frecuencias absolutas: la frecuencia de las palabras de 8 letras en los textos técnicos es de 24, la de 11 letras en Sociales es de 6, etc.

Intentaremos descubrir las diferencias que pueden existir entre las tres columnas (Prensa, Técnicos y Sociales). Nos tenemos que plantear este estudio porque es imposible comparar directamente las frecuencias, a causa de los distintos totales que presentan las tres modalidades (322, 352 y 360). Esto nos obliga a acudir a frecuencias relativas o porcentajes, como verás en las Prácticas.

 


Práctica 1


Las prácticas que te proponemos presentan también aspectos teóricos. No dejes de desarrollarlas todas. La única diferencia con el apartado de Teoría es que aquí trabajarás con la Hoja de Cálculo mientras sigues aprendiendo conceptos.

Obtención de porcentajes

Descarga en tu equipo la hoja letras.ods y el resumen teórico Teoría 1
 

Abre el documento de prácticas Práctica 11 y sigue sus instrucciones.

 


Práctica 2


¿Cuál es nuestra cifra favorita?

Descarga en tu equipo la hoja recoge1.ods y el resumen teórico Teoría 1
 

Abre el documento de prácticas Práctica 12 y sigue sus instrucciones.

 


Práctica 3

Resultado de una encuesta

Abre el documento de prácticas Práctica 13 y sigue sus instrucciones.

Crearás un gráfico sencillo a partir del documento.


Ejercicio 1

Dado este conjunto de datos

1  5  8  3  4  7  2  1  4  3  0  1  1  4  9  7  5  9  4  7  5  6  4  0
2  2  4  2  6  1  6  7  9  8  5  4  1  3  2  2  1  1  0  3  5  4  2  8

construye, por el procedimiento que quieras, una tabla de frecuencias y a partir de ella un diagrama de barras.

 


Ejercicio 2

 

Abre el modelo tabla1.ods, que contiene dos tablas similares de frecuencias absolutas y otra a su derecha para ser rellenada.

Deberás rellenar la tabla conjunta con las frecuencias relativas de A y B respectivamente y después intentar un gráfico lineal doble. Para ello recuerda:

Es conveniente que insertes el nombre de total1 a la celda del total de la tabla A (la que contiene el 54) y total2 a la celda del total de B (el 52)

Recuerda la teoría y la Práctica 1.

Para construir el gráfico selecciona toda la tabla (menos el título Tabla conjunta) y sigue el asistente. Recuerda activar en el primer paso Primera fila como etiqueta y también Primera columna como etiqueta.

Te incluimos una solución:

 


Ejercicio 3

 

En este ejercicio vas a usar las capacidades de una hoja de cálculo para simular experimentos. Deseamos saber la distribución de la suma en dos tiradas simultáneas de dados. La idea es que el ordenador simulará que se han tirado 50 veces dos dados. Su suma oscilará entre el valor 2 (1+1=2) y 12 (6+6=12). La práctica consistirá en crear una tabla y un gráfico sobre los resultados.

Abre el modelo dados.ods (o en versión Excel dados.xlsm)

Prueba su funcionamiento. Observa que el resultado de la suma siempre está comprendido entre 2 y 12.

Tal como te indican las instrucciones del modelo, escribe un CERO en la celda de Inicio para borrar el recuento de la izquierda.

Escribe después un UNO para iniciar el recuento y pulsa F9 cincuenta veces (puedes dejar el dedo pulsando de forma continua, porque al llegar a 50 se detiene)

Una vez que te familiarices con el modelo haz un recuento definitivo de 50 tiradas. A partir de ese resultado trabajas tú.

Selecciona la tabla de Frecuencias e intenta un gráfico de barras similar al de la imagen. Realiza el recuento varias veces y observa que en la mayoría de los casos el diagrama se acerca a una forma triangular.

 

 

 

 

 

 

 

 

 


Uso en el aula


Herramientas


Hojas de cálculo para usar en clase

La vocal más usada

Vocales.ods

Es un modelo que se comporta como un receptor de datos a partir de las cinco vocales, sobre las que construye una tabla y un gráfico. Con él se puede organizar un estudio estadístico sobre la vocal más usada en un idioma.

Se ha usado en clases de 3º y 4º de E.S.O., en las que los alumnos confeccionaban el modelo y después lo usaban para estudiar las frecuencias de las distintas vocales en sus libros de texto.

Carrera de ceros

Carrera.ods (En Excel carrera.xlsm)

Se simula una carrera de ceros, en la que pueden ganar los corredores que van por las pistas A, B, C o D. Se recogen los resultados de 20 carreras y con ellos se estudia la distribución uniforme con datos cualitativos. Se propone a los alumnos construir un gráfico con esta situación. También se ha experimentado en E.S.O.

Se puede ampliar el estudio a otras cuestiones, por ejemplo:

Tiradas de dos dados

dados.ods (En Excel dados.xlsm)

Similar al anterior, simula tiradas dobles de dados para que se puedan usar en recogidas de datos. Puede sustituir a las tiradas manuales que se describen en la sección siguiente de Documentos para usar.

Recogida de datos "al dictado"

recogida1.ods (En Excel recogida1.xlsm)

Herramienta diseñada para ir recogiendo datos discretos, o bien personalmente, o al dictado de otra persona. Si se usan los puntos medios de los intervalos, también se pueden recoger datos continuos

Es útil en trabajos de equipo, pues permite que se recojan los datos de forma rápida mediante el uso de botones de acción. Lee las instrucciones en la segunda hoja del archivo recogida1.ods.

Frecuencias simultáneas

frecusim.ods (en Excel frecusim.xlsm)

Con esta herramienta puedes ir escribiendo los datos de forma despreocupada, e irán apareciendo a su derecha la frecuencia con la que ya ha aparecido cada dato. Puedes usar datos cualitativos o cuantitativos.

Como el anterior, es útil para datos dictados.

Estudios generales

recoge1.ods

Instrumento útil y sencillo para estudiar datos cualitativos. Por el carácter de esos datos, sólo se pueden estudiar las frecuencias y la moda.

recoge2.ods

En esta herramienta se estudian datos cuantitativos aislados. En ellos ya se puede estudiar la media y la desviación típica. Es interesante, desde el punto de vista del funcionamiento de LibreOffice Calc, estudiar las fórmulas de la segunda hoja.

recoge3.ods

Similar a la anterior, recibe datos aislados y los agrupa en intervalos, a fin de comparar los cálculos en las dos modalidades y comprobar los pequeños errores que produce el agrupamiento.

 

 


Documentos para usar

Estudio de datos de tipo nominal o cualitativo

Puedes consultar el documento nominal.pdf para usarlo en las clases de Estadística de Enseñanza Media. Tú decides el nivel. Es muy útil para repasos de conceptos. Obliga a usar tablas que ya se encuentran en modelos de LibreOffice y que deben ser modificadas.

Tiradas manuales de dos dados

Este otro documento frecudados.pdf constituye una guía fácil para organizar una pequeña recogida de datos en Enseñanza Media. Ha sido experimentado y corregido varias veces.

 


Para ampliar


Una simulación

Mediante la herramienta simulador.ods (o en versión Excel, simulador.xlsm) estudiaremos la Distribución de Bernouilli, con la que experimentaremos con las relaciones entre frecuencia y probabilidad. Puedes leerlo en el documento que propone las simulaciones, Experimento de Bernouilli.

 

 

Histograma de frecuencias

 

Descarga los archivos simula.ods, recoge3.ods y frecu1.ods

Abre la Práctica 14 y desarrolla lo que te proponga. Aprenderás a recoger datos, tabularlos y usar las frecuencias automáticas en la hoja de cálculo.

 


Caso práctico

Estos casos prácticos te ayudarán a usar lo aprendido en situaciones cotidianas. En este practicaremos la recogida de una encuesta con respuestas de texto.

Descarga y ten preparado el archivo excursion.ods

Abre el archivo caso1.pdf y desarrolla lo que te explica.