ESTADÍSTICA DESCRIPTIVA
La estadística
descriptiva es la rama de las Matemáticas que recolecta, presenta y caracteriza
un
conjunto de datos (por ejemplo, edad de una población, altura
de los estudiantes de una escuela,
temperatura en los meses de verano, etc.) con el fin de
describir apropiadamente las diversas
características de ese conjunto. }
Al conjunto de los distintos valores numéricos que adopta un carácter cuantitativo se llama variable estadística.
Las variables pueden ser de dos tipos:
• Variables cualitativas o categóricas: no se pueden medir
numéricamente (por ejemplo: nacionalidad,
color de la piel, sexo).
• Variables cuantitativas: tienen valor numérico (edad, precio
de un producto, ingresos anuales).
Las variables también se pueden clasificar en:
• Variables unidimensionales: sólo recogen información sobre
una característica (por ejemplo: edad de
los alumnos de una clase).
• Variables
bidimensionales: recogen información sobre dos características de la población (por
ejemplo: edad y altura de los alumnos de una clase).
• Variables
pluridimensionales: recogen información sobre tres o más características
(por ejemplo:
edad, altura y peso de los alumnos de una clase).
Por su parte, las variables cuantitativas se pueden clasificar
en discretas y continuas:
• Discretas: sólo pueden tomar valores enteros (1, 2, 8, -4,
etc.). Por ejemplo: número de hermanos
(puede ser 1, 2, 3...., etc., pero, por ejemplo, nunca podrá
ser 3.45).
• Continuas: pueden tomar cualquier valor real dentro de un
intervalo. Por ejemplo, la velocidad de un
vehículo puede ser 90.4 km/h, 94.57 km/h...etc.
Cuando se estudia el comportamiento de una variable hay que
distinguir los siguientes conceptos:
• Individuo: cualquier elemento que porte información sobre el
fenómeno que se estudia. Así, si
estudiamos la altura de los niños de una clase, cada alumno es
un individuo; si se estudia el precio
de la vivienda, cada vivienda es un individuo.
• Población: conjunto de todos los individuos (personas,
objetos, animales, etc.) que porten información sobre el fenómeno que se
estudia. Por ejemplo, si se estudia el precio de la vivienda en una ciudad, la
población será el total de las viviendas de dicha ciudad.
• Muestra: subconjunto que seleccionado de una población. Por
ejemplo, si se estudia el precio de la vivienda de una ciudad, lo normal será
no recoger información sobre todas las viviendas de la ciudad (sería una labor
muy compleja), sino que se suele seleccionar un subgrupo (muestra) que se
entienda que es suficientemente representativo.
Las variables aleatorias son variables que son seleccionadas
al azar o por procesos aleatorios.
ORGANIZACIÓN DE DATOS
Muchas veces uno se pregunta, ¿para qué sirven las encuestas que a veces se hacen en la calle?,
¿Cómo saber si una estación de radio se escucha más que otra?
, ¿Cuál candidato puede ganar? La
respuesta se comienza con la recaudación de datos.
Los datos son información que se recoge, esto puede ser
opinión de las personas sobre un tema, edad o sexo de encuestados, dónde viven,
cuántas personas viven en una casa, qué
tipo de sangre tiene un grupo de personas, etc.
Hay datos que pueden ser de mucha utilidad a diferentes
profesionales en la toma de decisiones, para resolver problemas o para mostrar
resultados de investigaciones. Una vez que se haya recogido toda la información,
se procede a crear una base de datos,
donde se registran todos los datos obtenidos.
Algunas veces, si los datos son muy complicados, se codifican,
esto quiere decir que se le coloca una palabra clave que identifica un título
muy largo. Cuando ya está elaborada la base de datos se parece a una tabla.
Es importante recordar que nunca se colocan las tablas y las
gráficas juntos, porque en realidad dicen lo mismo, corrientemente se utiliza o
una tabla y su análisis, o una gráfica y su análisis 1.
Por ejemplo, supóngase que se ha preguntado a un conjunto
de n personas: ¿qué opinión tienen
acerca de la instalación de playas en la Ciudad de México en que el Gobierno del
Distrito Federal ha hecho a partir de 2007? Las
n respuestas se encuentran en una escala que va de 1 a 9, donde 1
representa un total desacuerdo con la medida mientras que 9 quiere significar
un acuerdo total.
El resultado de la medición es el siguiente:
Tabla 1: Conjunto original de datos
7 5 6 8 6 5 9 5 8 6 5 7 5 5 4 5 8 5 4 2 6 6 4 6 4
8 4 3 4 3 3 1 4 5 6 5 8 5 4 7 4 3 5 3 4 9 4 2 6 3
4 2 4 1 3 6 3 1 2 4 4 6 2 4 7 4 2 4 6 4 4 6 7 5 8
5 7 6 5 6 5 7 5 6 4 5 4 1 6 5 6 5 5 5 4 6 2 5 5 6
5 4 4 3 5 5 9 4 3 6 5 7 3 2 4 4 7 4 2 1 8 2 7 4 5
5 7 5 5 1 5 8 5 6 7 6 6 7 7 5 2 5 6 5 8 5 3 6 5 5
Si se plantean las siguientes preguntas:
• ¿Cuántas personas fueron encuestadas?
• ¿Cuál fue la respuesta más frecuente?
• ¿Cuántas personas tienen, como máximo, una actitud de cuatro
puntos en la escala? (es decir, ¿cuántas personas se encuentran en desacuerdo
con la medida?)
Es difícil responder a las tres cuestiones. ¿Cuál es el
problema?
Las personas tienen dificultades para procesar o tener en
cuenta mucha información de forma
simultanea. La tabla 1 muestra demasiados datos y es preciso
contar con mucha paciencia y una buena vista para responder a las preguntas
anteriores con seguridad.
Así pues, ¿qué se puede hacer? Una solución alternativa al
repaso repetitivo de la tabla 1 es organizar los datos de tal forma que tengan
una disposición que facilite la lectura. En este sentido, la primera acción a
realizar es ordenar los datos desde el que posee el valor más pequeño hasta el
que cuenta con el valor mayor.
Obsérvese el resultado:
Tabla 2: Conjunto ordenado de datos
1 1 1 1 1 1 2 2 2 2 2
2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3
4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4
4
5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5
5 5 5 5 5 5 5 5 5
6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6
7 7 7 7 7 7 7 7 7 7 7 7 7 7 8 8 8 8 8 8 8 8 8 9 9 9
Se logra una ganancia al pasar de la tabla 1 a la tabla 2.
Parece que ésta es más fácil de interpretar. No ha desaparecido ninguna
información, el único cambio está en su ordenación. No obstante, la solución es
parcial, puesto que aún debe ser mejorada (sigue siendo difícil responder a las
preguntas).
ACUMULACIÓN DE FRECUENCIAS
No todas las preguntas que se han realizado sobre el mismo
conjunto de datos han exigido el mismo esfuerzo. Así, mientras que las
preguntas sobre el número de datos y el
valor más frecuente se han respondido con una lectura de la tabla, la tercera
pregunta ha necesitado de algunas operaciones:
¿Cuántas personas tienen, como máximo, una actitud de cuatro puntos en la escala? Solución: 59
(6+11+12+30). Para responder a esa pregunta se ha tenido que
realizar una suma: la de todas las frecuencias comprendidas entre el primer
valor de la tabla y el valor que interesa, ambos inclusive. Esta cantidad final
recibe el nombre de frecuencia acumulada.
Muchas interrogantes requieren respuestas que se basan en las
frecuencias acumuladas. Es recomendable escribir esta nueva información en la
tabla, de tal forma que permita respuestas directas en el futuro.
Si se retoma el problema de las actitudes frente a la instalación de playas, la tabla de
frecuencias no termina donde se dejó. Se puede añadir más información útil en
la que se basan respuestas para otras preguntas. Por ejemplo ¿Cuántas personas
han respondido con una actitud media (valor 5)? Solución: 40.
Ahora, considérese la siguiente tabla con datos nuevos:
Si se trata de
responder a la misma pregunta, ocurre lo siguiente:
En la tabla 7 ha cambiado el conjunto de
datos. Ahora son 1,140, frente a los 150 de la encuesta anterior.
Una misma frecuencia, en este caso f = 40, no tiene la misma interpretación en
ambas tablas. ¿Qué ha cambiado? La importancia relativa de la frecuencia,
puesto que f = 40 frente a N = 150 es diferente a f = 40 frente a N = 1,140. De hecho, el valor 5 pasa de ser
el más frecuente al menos frecuente.
TABLAS DE FRECUENCIA
Por
lo general, cuando se exponen los resultados de una encuesta en un medio de
comunicación, lo habitual es utilizar otro tipo de frecuencias relativas: los
porcentajes.
El
principio que rige la utilización de los porcentajes es el mismo que para las
proporciones: utilizar un referente fijo de tal forma que no sea necesario
contar con el número total de datos para interpretar una frecuencia. La
diferencia entre los porcentajes y las proporciones es que los primeros
utilizan el referente 100, mientras que las proporciones utilizan el 1.
Entonces, conseguir los porcentajes es muy
fácil si se cuenta con las proporciones: bastará con multiplicar a éstas por
100:
Este comentario ha sido eliminado por el autor.
ResponderEliminarla estadistica descriptiva puede definirse como aquellos métodos que incluyen la recolección, presentación y caraterización de un conjunto de datos con el fin de describir apropiadamente las diversas características de ese conjunto.
ResponderEliminarvisita nuestro blog : http://bioestadiscafen.blogspot.mx/
Alma- Carmen - América
ResponderEliminarExcelente información muchachos es mucho muy muy interesante(:'