BioestadisticaFen

ESTADÍSTICA DESCRIPTIVA

La estadística descriptiva es la rama de las Matemáticas que recolecta, presenta y caracteriza un

conjunto de datos (por ejemplo, edad de una población, altura de los estudiantes de una escuela,

temperatura en los meses de verano, etc.) con el fin de describir apropiadamente las diversas

características de ese conjunto. }

Al conjunto de los distintos valores numéricos que adopta un carácter cuantitativo se llama variable estadística.

Las variables pueden ser de dos tipos:

• Variables cualitativas o categóricas: no se pueden medir numéricamente (por ejemplo: nacionalidad,

color de la piel, sexo).

• Variables cuantitativas: tienen valor numérico (edad, precio de un producto, ingresos anuales).

Las variables también se pueden clasificar en:

• Variables unidimensionales: sólo recogen información sobre una característica (por ejemplo: edad de

los alumnos de una clase).

• Variables bidimensionales: recogen información sobre dos características de la población (por

ejemplo: edad y altura de los alumnos de una clase).

• Variables pluridimensionales: recogen información sobre tres o más características (por ejemplo:

edad, altura y peso de los alumnos de una clase).

Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:

• Discretas: sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: número de hermanos

(puede ser 1, 2, 3...., etc., pero, por ejemplo, nunca podrá ser 3.45).

• Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un

vehículo puede ser 90.4 km/h, 94.57 km/h...etc.

Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes conceptos:

• Individuo: cualquier elemento que porte información sobre el fenómeno que se estudia. Así, si

estudiamos la altura de los niños de una clase, cada alumno es un individuo; si se estudia el precio

de la vivienda, cada vivienda es un individuo.

• Población: conjunto de todos los individuos (personas, objetos, animales, etc.) que porten información sobre el fenómeno que se estudia. Por ejemplo, si se estudia el precio de la vivienda en una ciudad, la población será el total de las viviendas de dicha ciudad.

• Muestra: subconjunto que seleccionado de una población. Por ejemplo, si se estudia el precio de la vivienda de una ciudad, lo normal será no recoger información sobre todas las viviendas de la ciudad (sería una labor muy compleja), sino que se suele seleccionar un subgrupo (muestra) que se

entienda que es suficientemente representativo.

Las variables aleatorias son variables que son seleccionadas al azar o por procesos aleatorios.

ORGANIZACIÓN DE DATOS

Muchas veces uno se pregunta, ¿para qué sirven las encuestas que a veces se hacen en la calle?,

¿Cómo saber si una estación de radio se escucha más que otra? , ¿Cuál candidato puede ganar? La

respuesta se comienza con la recaudación de datos.

Los datos son información que se recoge, esto puede ser opinión de las personas sobre un tema, edad o sexo de encuestados, dónde viven, cuántas personas viven en una casa, qué tipo de sangre tiene un grupo de personas, etc.

Hay datos que pueden ser de mucha utilidad a diferentes profesionales en la toma de decisiones, para resolver problemas o para mostrar resultados de investigaciones. Una vez que se haya recogido toda la información, se procede a crear una base de datos, donde se registran todos los datos obtenidos.

Algunas veces, si los datos son muy complicados, se codifican, esto quiere decir que se le coloca una palabra clave que identifica un título muy largo. Cuando ya está elaborada la base de datos se parece a una tabla.

Es importante recordar que nunca se colocan las tablas y las gráficas juntos, porque en realidad dicen lo mismo, corrientemente se utiliza o una tabla y su análisis, o una gráfica y su análisis 1.

Por ejemplo, supóngase que se ha preguntado a un conjunto de n personas: ¿qué opinión tienen acerca de la instalación de playas en la Ciudad de México en que el Gobierno del Distrito Federal ha hecho a partir de 2007? Las n respuestas se encuentran en una escala que va de 1 a 9, donde 1 representa un total desacuerdo con la medida mientras que 9 quiere significar un acuerdo total.

El resultado de la medición es el siguiente:

Tabla 1: Conjunto original de datos

7 5 6 8 6 5 9 5 8 6 5 7 5 5 4 5 8 5 4 2 6 6 4 6 4

8 4 3 4 3 3 1 4 5 6 5 8 5 4 7 4 3 5 3 4 9 4 2 6 3

4 2 4 1 3 6 3 1 2 4 4 6 2 4 7 4 2 4 6 4 4 6 7 5 8

5 7 6 5 6 5 7 5 6 4 5 4 1 6 5 6 5 5 5 4 6 2 5 5 6

5 4 4 3 5 5 9 4 3 6 5 7 3 2 4 4 7 4 2 1 8 2 7 4 5

5 7 5 5 1 5 8 5 6 7 6 6 7 7 5 2 5 6 5 8 5 3 6 5 5

Si se plantean las siguientes preguntas:

• ¿Cuántas personas fueron encuestadas?

• ¿Cuál fue la respuesta más frecuente?

• ¿Cuántas personas tienen, como máximo, una actitud de cuatro puntos en la escala? (es decir, ¿cuántas personas se encuentran en desacuerdo con la medida?)

Es difícil responder a las tres cuestiones. ¿Cuál es el problema?

Las personas tienen dificultades para procesar o tener en cuenta mucha información de forma

simultanea. La tabla 1 muestra demasiados datos y es preciso contar con mucha paciencia y una buena vista para responder a las preguntas anteriores con seguridad.

Así pues, ¿qué se puede hacer? Una solución alternativa al repaso repetitivo de la tabla 1 es organizar los datos de tal forma que tengan una disposición que facilite la lectura. En este sentido, la primera acción a realizar es ordenar los datos desde el que posee el valor más pequeño hasta el que cuenta con el valor mayor.

Obsérvese el resultado:

Tabla 2: Conjunto ordenado de datos

1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3

4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4

5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5

6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6

7 7 7 7 7 7 7 7 7 7 7 7 7 7 8 8 8 8 8 8 8 8 8 9 9 9

Se logra una ganancia al pasar de la tabla 1 a la tabla 2. Parece que ésta es más fácil de interpretar. No ha desaparecido ninguna información, el único cambio está en su ordenación. No obstante, la solución es parcial, puesto que aún debe ser mejorada (sigue siendo difícil responder a las preguntas).

ACUMULACIÓN DE FRECUENCIAS

No todas las preguntas que se han realizado sobre el mismo conjunto de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han respondido con una lectura de la tabla, la tercera pregunta ha necesitado de algunas operaciones:

¿Cuántas personas tienen, como máximo, una actitud de cuatro puntos en la escala? Solución: 59

(6+11+12+30). Para responder a esa pregunta se ha tenido que realizar una suma: la de todas las frecuencias comprendidas entre el primer valor de la tabla y el valor que interesa, ambos inclusive. Esta cantidad final recibe el nombre de frecuencia acumulada.

Muchas interrogantes requieren respuestas que se basan en las frecuencias acumuladas. Es recomendable escribir esta nueva información en la tabla, de tal forma que permita respuestas directas en el futuro.

FRECUENCIAS RELATIVAS

Si se retoma el problema de las actitudes frente a la instalación de playas, la tabla de frecuencias no termina donde se dejó. Se puede añadir más información útil en la que se basan respuestas para otras preguntas. Por ejemplo ¿Cuántas personas han respondido con una actitud media (valor 5)? Solución: 40.

Ahora, considérese la siguiente tabla con datos nuevos:

Si se trata de responder a la misma pregunta, ocurre lo siguiente:

En la tabla 7 ha cambiado el conjunto de datos. Ahora son 1,140, frente a los 150 de la encuesta anterior.

Una misma frecuencia, en este caso f = 40, no tiene la misma interpretación en ambas tablas. ¿Qué ha cambiado? La importancia relativa de la frecuencia, puesto que f = 40 frente a N = 150 es diferente a f = 40 frente a N = 1,140. De hecho, el valor 5 pasa de ser el más frecuente al menos frecuente.

TABLAS DE FRECUENCIA

Por lo general, cuando se exponen los resultados de una encuesta en un medio de comunicación, lo habitual es utilizar otro tipo de frecuencias relativas: los porcentajes.

El principio que rige la utilización de los porcentajes es el mismo que para las proporciones: utilizar un referente fijo de tal forma que no sea necesario contar con el número total de datos para interpretar una frecuencia. La diferencia entre los porcentajes y las proporciones es que los primeros utilizan el referente 100, mientras que las proporciones utilizan el 1.

Entonces, conseguir los porcentajes es muy fácil si se cuenta con las proporciones: bastará con multiplicar a éstas por 100:

Regresando a la encuesta de las playas, la variable actitud frente al subsidio admite orden entre sus valores. Por lo tanto, para completar la tabla, bastará con acumular sus frecuencias:

3 comentarios:

Bioestadistica FEN16 de noviembre de 2012, 16:58
Este comentario ha sido eliminado por el autor.
ResponderEliminar
Respuestas
Bioestadistica FEN16 de noviembre de 2012, 16:59
la estadistica descriptiva puede definirse como aquellos métodos que incluyen la recolección, presentación y caraterización de un conjunto de datos con el fin de describir apropiadamente las diversas características de ese conjunto.

visita nuestro blog : http://bioestadiscafen.blogspot.mx/
ResponderEliminar
Respuestas
Unknown22 de noviembre de 2012, 22:23
Alma- Carmen - América

Excelente información muchachos es mucho muy muy interesante(:'
ResponderEliminar
Respuestas

Añadir comentario

miércoles, 14 de noviembre de 2012

3 comentarios: