martes, 24 de marzo de 2009

TABLAS DE DOBLE ENTRADA

TABLAS DE DOBLE ENTRADA.

Descripción
En una tabla de doble entrada, los datos se muestran en columnas y filas al igual que en las tablas. Sin embargo, en comparación con las tablas, cada columna tiene por lo menos un encabezado y cada fila tiene por lo menos un encabezado de fila. Los datos correspondientes aparecen en la intersección de los encabezados de la columna y la fila: esta sección corresponde al "cuerpo".
Los estudios estadísticos que se centran en el análisis de una sola variable se llaman unidimensionales. Sin embargo, en las situaciones reales es corriente que se tenga que investigar la combinación de dos variables estadísticas, en lo que se conoce por distribución bidimensional. En este campo, se utilizan presentaciones de los datos en tablas de doble entrada, con gráficas de nube de puntos que interrelacionan las variables.



Distribuciones bidimensionales
Cuando se realizan estudios estadísticos de dos variables, el modelo resultante recibe el nombre de distribución bidimensional. Algunos ejemplos de este tipo de distribución son las tablas de altura-peso de un colectivo de población, la relación pulso-temperatura de un grupo de enfermos y la gráfica de ingresos y gastos de una empresa.
En estas distribuciones se manejan variables estadísticas bidimensionales, que constituyen pares de valores de cada una de las variables elementales que intervienen, denotados por (xi, yj).


cuando el número de datos es grande, se recurre a las tablas de doble entrada:
En cada casilla se pone la frecuencia correspondiente al par de valores que definen esa casilla. Por ejemplo, hay 11 individuos para los cuales x =0, y =1. Es decir, el par (0,1) está 11 veces.

Tabla de doble entrada. Está formada por tantas filas y columnas como valores tengamos de cada una de las variables, más una fila y una columna más para indicar los totales. Está indicada para casos con bastantes datos, en los que para cada valor de una variable, existen varios valores otra

SESGO

SESGO
El sesgo mide la direccion que se va dando en la distribucion de tendencia central

Desviacion normal
es cuando la media la mediana y la moda quedan en el mismo lugar

curtosis
la curtosis la vamos a utilizar si la distribucion es normal

La curtosis es una medida cuantifica , que mide la agudeza de la distribucion o fenomeno.

Las siguientes graficas se utilizaran si y solo si la distribucion sea normal.
las siguientes graficas son:
Leptocurtica
mesocurtica
platocurtica

seguimiento de medidas de forma

MEDIDAS DE FORMA

MEDIDAS DE FORMA
Las medidas de forma permiten comprobar si una distribución de frecuencia tiene características especiales como simetría, asimetría, nivel de concentración de datos y nivel de apuntamiento que la clasifiquen en un tipo particular de distribución.
Las medidas de forma son necesarias para determinar el comportamiento de los datos y así, poder adaptar herramientas para el análisis probabilístico.

Medidas de forma: Son indicadores estadísticos que permiten identificar si una distribución de frecuencia presenta uniformidad.


la media, mediana y moda son las medidas que se utilizan para determinar el grado de asimetria de una distribucion de frecuencias.
QUE ES SIMETRIA Y ASIMETRIA:
SIMETRIA
La simetría es un rasgo característico de formas geométricas, sistema, ecuaciones, y otros objetos materiales o entidades abstractas, relacionada con su invariancia bajo ciertas transformaciones, movimientos o interEn condiciones formales, decimos que un objeto es simétrico en lo que concierne a una operación matemática dada, si, cuando aplicado al objeto, esta operación no cambia el objeto o su aspectocambios.

entonces en la simetria no hay variacion.
ASIMETRIA
Asimetría se refiere a la no simetría, es decir, a la propiedad de determinados cuerpos, funciones matemáticas y otros tipos de elementos en los que, al aplicarles una regla de transformación efectiva, se observan cambios respecto al elemento original.

seguimiento de medidas de tendencia central

LA MEDIA ARITMETICA:
Para el calculo de la media aritmetica existen varias formas, por esta: calculo de la media aritmetica de una serie simple de valores, la media aritmetica de una distribucion de frecuencias de valores sin agrupar, y la media aritmetica de valores agrupados.

la media aritmetica de una serie simple.
Este calculo de hace mediante la siguiente formula.
_
X=X1
___
N

media aritmetica de una distribucion de frecuencias sin agrupar
Este promedio es llamado tambien ponderado porque cada termino se repite dos o mas veces ;
es decir que cada termino tiene diferente peso al contrario del promedio aritmetico simple en donde cada termino solo se escribe una vez.

media aritmetica de frecuencias de valores agrupados
Cuando los valores estan agrupados en intervalos de amplitud constante o variable, para calcular la media aritmetica es necesario hallar la marca de clase de cada intervalo y multiplicarloa por la frecuancia respectiva.

sábado, 21 de marzo de 2009

MEDIDAS DE POSICION

Medidas de posicion:
 estadística descriptiva, las medidas de posición no central permiten conocer otros puntos característicos de la distribución que no son los valores centrales.
 Entre estas medidas podemos encontrar:
cuartiles 
deciles
percentiles
quintiles
 
CUARTILES
los cuartiles son los tres valores que dividen al conjunto de datosordenados en cuatro partes porcentualmente iguales.
Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil es precisamente lamediana. El primer cuartil, es el valor en el cual o por debajo del cual queda un cuarto (25%) de todos los valores de la sucesión (ordenada); el tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas partes (75%) de los datos

El segundo cuartil Q2, (coincide, es idéntico o similar a la mediana, Q2 = Md), es el menor valor que es mayor que la mitad de los datos, es decir el 50% de las observaciones son mayores que la mediana y el 50% son menores.

El tercer cuartil Q3, es el menor valor que es mayor que tres cuartas partes de los datos, es decir aquel valor de la variable que supera al 75% y es superado por el 25% de las observaciones.

DECILES
Los deciles, que dividen a la distribución en diez partes;

PERCENTILES
  • Se representan con la letra C.
  • Es el percentil i-ésimo, donde la i toma valores del 1 al 99. El i % de la muestra son valores menores que él y el 100-i % restante son mayores.

Cuando los datos no están agrupados en intervalos, los cuartiles, así como el resto de las medidas de posición, tienen un valor claro. Sin embargo, cuando tenemos una agrupación de los datos ya no es tan sencillo realizar el cálculo. Sí que resulta claro ver en cuál de los intervalos está el cuartil (quintil, decil o percentil) buscado, pero para calcular su valor exacto necesitaremos usar una fórmula.


QUINTILES

  • Se representan con la letra K.
  • Es el primer quintil. Separa a la muestra dejando el 20% de los datos a su izquierda.
  • Es el segundo quintil. Es el valor que indica que el 40% de los datos son menores.
  • Es el tercer quintil. Indica que el 60% de los datos son menores que él.
  • Es el cuarto quintil. Separa al 80% de los datos del otro 20%.



MEDIDAS DE POSICION


MEDIDAS DE TENDENCIA CENTRAL

MEDIDAS DE TENDENCIA CENTRAL
 Las medidas que describen un valor típico en un grupo de observaciones suelen llamarse medidas de tendencia central
. Es importante tener en cuenta que estas medidas se aplican a grupos más bien que a individuos. Un promedio es una característica de grupo, no individual.
Entre las medidas de tendencia central tenemos:
media 
mediana
moda
Media Armonica
Media Cuadratica
Media Geometrica
Media Aritmetica
MEDIANA

Según el número de valores que se tengan se pueden presentar dos casos:

- Si el número de valores es imparla Mediana corresponderá al valor central de dicho conjunto de datos.

- Si el número de valores es parla Mediana corresponderá al promedio de los dos valores centrales (los valores centrales se suman y se dividen por 2).

Ejemplo 1:

Se tienen los siguientes datos:  5, 4, 8, 10, 9, 1, 2

Al ordenarlos en forma creciente, es decir de menor a mayor, se tiene: 

                                                           1, 2, 4,  5  , 8, 9, 10

El 5 corresponde a la Med, porque es el valor central en este conjunto de datos impares.

Ejemplo 2: 

El siguiente conjunto de datos está ordenado en forma decreciente, de mayor a menor, y corresponde a un conjunto de valores pares, por lo tanto, la Med será el promedio de los valores centrales.

 21, 19, 18, 15, 13, 11 ,10, 9, 5, 3

Med=
13 + 11
=
24
=12
2
2


MODA

Es la medida que indica cual dato tiene la mayor frecuencia en un conjunto de datos, o sea, cual se repite más

MEDIA ARMONICA

La media armónica , representada H, de una cantidad finita de números es igual al recíproco, o inverso, de la media aritmética de los recíprocos de dichos números

Así, dados los números a1,a2, ... , an, la media armónica será igual a:

{H} = {n \over { \sum_{i=1}^n{1 \over a_i}}} = {n \over ({1 \over a_1}+\cdots+{1 \over a_n})}

La media armónica resulta poco influida por la existencia de determinados valores mucho más grandes que el conjunto de los otros, siendo en cambio sensible a valores mucho más pequeños que el conjunto.

La media armónica no está definida en el caso de la existencia en el conjunto de valores nulos.

MEDIA CUADRATICA

La media cuadrática es igual a la raíz cuadrada de la suma de los cuadrados de los valores dividida entre el número de datos:

Esta media como medida de asociación tiene aplicaciones tanto en ciencias biológicas como en medicina.

MEDIA GEOMETRICA

La media geométrica de una cantidad finita de números (digamos 'n' números) es la raíz n-ésima del producto de todos los números.

sábado, 14 de marzo de 2009

TALLOS Y HOJAS

Diagrama de tallos y hojas.

Diagrama de tallo y hojas
Un diagrama donde cada valor de datos es dividido en una "hoja" (normalmente el último dígito) y un "tallo" (los otros dígitos). Por ejemplo "32" sería dividido en "3" (tallo) y "2" (hoja).Los valores del "tallo" se escriben hacia abajo y los valores "hoja" van a la derecha (o izquierda) del los valores tallo.El "tallo" es usado para agrupar los puntajes y cada "hoja" indica los puntajes individuales dentro de cada grupo.
EJEMPLO
TALLO HOJA
22 2
27 7
26 6
28 8
33 3
44 4

el muestreo

  • MUESTREO
Es la actividad por la cual se toman ciertas muestras de una población de elementos de los cuales
vamos a tomar ciertos criterios de decisión, el muestreo ...
Concepto de muestreo
El muestreo es una herramienta de la investigación científica. Su función básica es determinar que parte de una realidad en estudio (población o universo) debe examinarse con la finalidad de hacer inferencias sobre dicha población. El error que se comete debido a hecho de que se obtienen conclusiones sobre cierta realidad a partir de la observación de sólo una parte de ella, se denomina error de muestreo. Obtener una muestra adecuada significa lograr una versión simplificada de la población, que reproduzca de algún modo sus rasgos básicos.
EL CENSO
Se aplica en toda la poblacion

Población: Es todo conjunto de elementos, finito o infinito, definido por una o más características, de las que gozan todos los elementos que lo componen, y sólo ellos.

  • Encuesta

Se aplica a una parte de la poblacion

TIPOS DE MUESTREO

deliberado

Muestreo deliberado: Consiste en seleccionar la muestra de forma deliberada
porque los sujetos poseen las características necesarias para la investigación. Los
resultados son difíciles de generalizar
El tamaño seleccionado de la muestra real que se presenta, responde a un criterio
de zonificación que esta investigación se planea realizar. El trabajo es
experimental y sólo una parte del principal. Los trabajos descriptivos que se
presentan son una forma de controlar las muchas variables que pueden aparecer
a lo largo del proceso, para ello se aumentará el número de elementos en la
muestra a medida que se monitoreen otras escuelas sectorizadas

conglomerado

Muestreo de conglomerados.Para obtener una muestra de conglomerados, primero dividir la población en grupos que son convenientes para el muestreo. En seguida, seleccionar una porción de los grupos al azar o por un método sistemático. Finalmente, tomar todos los elementos o parte de ellos al azar o por un método sistemático de los grupos seleccionados para obtener una muestra. Bajo este método, aunque no todos los grupos son muestreados, cada grupo tiene una igual probabilidad de ser seleccionado. Por lo tanto la muestra es aleatoria.Una muestra de conglomerados, usualmente produce un mayor error muestral (por lo tanto, da menor precisión de las estimaciones acerca de la población) que una muestra aleatoria simple del mismo tamaño. Los elementos individuales dentro de cada "conglomerado" tienden usualmente a ser iguales.

estratificado:

Muestreo Estratificado Para obtener una muestra aleatoria estratificada, primero se divide la población en grupos, llamados estratos, que son más homogéneos que la población como un todo. Los elementos de la muestra son entonces seleccionados al azar o por un método sistemático de cada estrato. Las estimaciones de la población, basadas en la muestra estratificada, usualmente tienen mayor precisión (o menor error muestral) que si la población entera muestreada mediante muestreo aleatorio simple. El número de elementos seleccionado de cada estrato puede ser proporcional o desproporcional al tamaño del estrato en relación con la población.