martes, 29 de septiembre de 2009
COMBINACIONES
lunes, 28 de septiembre de 2009
sábado, 26 de septiembre de 2009
permutaciones y combinaciones
PERMUTACIONES:
Las permutaciones son arreglos que se pueden hacer con los elementos de un todo, se realizan de tal manera que en cada grupo que surge entren todos lo elementos siempres y cuando que esten colocados en distinta posicion ya que se debera llevar un estricto orden con los elementos del mismo.
SU FORMULA ES:
n!/(n-r)!
EJEMPLOS:
¿de cuantas formas se pueden sentar 5 personas en un automovil?
p5= 5*4*3*2*1=120 formas.
ocho vecinas guardan cola en una panaderia para comprar pan.¿de cuantas formas distintas se pueden colocar en la cola?
P8=8*7*6*5*4*3*2*1=40320 formas
con los digitos impares.¿cuantos numeros de 5 cifras pueden formarse?
P5= 5*4*3*2*1=120 numeros.
PERMUTACIONES CON REPETICION:
se les llama asi porque en los elementos que posea cada conjunto simpre habran elementos repetidos.
obtenga todas las señales posobles que se pueden diseñar con 6 banderines, 2 son rojos, 3 verdes y 1 morado.
sol:
6P2,3,1=6!/2!*3!*1!=720/12=60 señales.
¿De cuanta maneras es posible plantar en un terreno 2 naranjales 3 manzanos y 4 ciruelos.
sol:
9P2,3,4=9!/2!*3!*4!=362880/288= 1260 maneras.
Si un equipo de futbol femenil participa en 12 juegos en una temporada,¿cuantas maneras hay de que entre esos 12 jegos en que participa, obtenga 7 victorias, 3 empates y 2 juegos perdidos?
12P7,3,2=12!/7!*3!*2!=479001600/60480=7920 maneras.
lunes, 27 de julio de 2009
formas de determinar un conjunto
Pueden determinarse por dos formas:
Las cuales son:
por extension:
Se hace escribiendo dentro de una lleve los nombres de los elementos del conjunto
EJEMPLO:
POR COMPRENSION:
Se realizara escribiendo dentro de llaves una caracteristica de los elementos del conjunto y solamente de ellos.
EJEMPLO:
(Meses del año o bien) , o bien de esta forma: X/X es un mes del año, que se lee: conjunto de elementos x tal que x es un mes de año.
interseccion de conjuntos
dado: AnB.
se colocan los elementos de A y los de B se colocan solo los que no esten en A porque no pueden repetirse. y si en dado caso se diera que los elementos d A no esten en B se dira que es un conjunto disjunto.
Quiere decir que la interseccion seran los elementos que se repitan en los dos conjuntos.
EJEMPLO:
A=(2,4,6)
B=(4,6,8,10)
C=(10,14,16,26)
ENTONCES=
AnB=(4,6)
AnC=(0)
martes, 14 de julio de 2009
CONJUNTOS
Que es un elemento?
es cada uno de los objetos por los cuales esta conformado un conjunto determinado
sábado, 11 de julio de 2009
viernes, 22 de mayo de 2009
COMENTARIOS SOBRE VARIOS TEMAS
DIAGRAMA DE DISPERSION:
diagrama de dispersion O nube de puntos,se realiza con el objetivo de ver que tipo de regresion es, ya que conforme esten los puntos de la nube se podra observar si es regresion lineal, cuadratica o cualquier otra, tambien se podra observar si entre los puntos existe alguna relacion y si no, se denomina relacion nula. El diagrama de dispersion es utilizado para ver el grado de relacion que pueda existir entre dos fenomenos.
NUBE DE PUNTOS:
REGRESION LINEAL:
La regresion lineal se encuantra haciendo el diagrama de dispersion, ya teniendo nuestra nube de puntos, hacemos nuestro mejor ajuste trazando una linea recta pero siempre observando que quede en la mejor posicion posible.
La correlación lineal perfecta ocurre cuando todos los puntos del diagrama de dispersión están exactamente sobre una recta.
REGRESION CUADRATICA:
Este tipo de relacion, al igual que la lineal, va en un diagrama de dispersion pero ya no sera una linea recta si no que sera una curva.
DIAGRAMA DE CAJA:
Investigacion:
Un diagrama de caja es un gráfico, basado en cuartiles, mediante el cual se visualiza un conjunto de datos. Está compuesto por un rectángulo, la caja, y dos brazos, los bigotes.
Es un gráfico que se suministra información sobre los valores mínimo y máximo, los cuartiles Q1, Q2 o mediana y Q3, y sobre la existencia de valores atípicos y simetría de la distribución.
comentario:
A este diagrama se le llama asi porque al graficarlo se puede observar que tiene forma de caja.
El diagrama es de gran utilidad para poder establecer datos atipicos, el tamaño que tendra, lo determinaran los cuartiles Q1 Y Q3.
puede ser utilizado para calcular los datos de cualquier fenomeno que deseemo estudiar, como por ejemplo las edades de cierta cantidad de estudiantes, o las estaturas de los mismos.
Es muy interesante porque podremos observar que datos se salen de lo normal.
Lo primero que hay que hacer en todo caso es ordenar los datos y obtener el valor minimo, el valor maximo, los cuartiles Q1, Q2 Y Q3 estos tres son fundamentales a la hora de construir nuestro diagrama y despues sacaremos el rango intercuartilico (RI).
jueves, 21 de mayo de 2009
REGRESION CUADRATICA Y MAS TEMAS
grados de correlacion
• El coeficiente de correlación, r, presenta valores entre –1 y +1.
• Cuando r es próximo a 0, no hay correlación lineal entre las variables. La nube de puntos está muy dispersa o bien no forma una línea recta. No se puede trazar una recta de regresión.
• Cuando r es cercano a +1, hay una buena correlación positiva entre las variables según un modelo lineal y la recta de regresión que se determine tendrá pendiente positiva, será creciente.
• Cuando r es cercano a -1, hay una buena correlación negativa entre las variables según un modelo lineal y la recta de regresión que se determine tendrá pendiente negativa: es decreciente.
COVARIANZA
Covarianza: Es una medida de lo que se dispersan los valores de una muestra bidimensional tanto del valor medio de la x como del valor medio de la y. Se determina mediante la expresión
En estadística la covarianza es una medida de dispersión conjunta de dos variables estadísticas.
Este tipo de estadístico puede utilizarse para medir el grado de relación de dos variables si ambas utilizan una escala de medida a nivel de intervalo/razón (variables cuantitativas).
La formula suele aparecer expresada como:
Una covarianza positiva significa que existe una relación lineal positiva entre las dos variables. Es decir, las puntuaciones bajas de la primera variable (X) se asocian con las puntuaciones bajas de la segunda variable (Y), mientras las puntuaciones altas de X se asocian con los valores altos de la variable Y.
Una covarianza de negativa significa que existe una relación lineal inversa perfecta (negativa) entre las dos variables. Lo que significa que las puntuaciones bajas en X se asocian con los valores altos en Y, mientras las puntuaciones altas en X se asocian con los valores bajos en Y.
Una covarianza 0 se interpreta como la no existencia de una relación lineal entre las dos variables estudiadas.
Si se dispone de dos o más conjuntos de datos el diagrama permite la comparación visual entre ellos.
¿Cómo se construye?
a. Dibujar un rectángulo cuyos lados verticales pasen por el primero y tercer cuartil,
b. Dibujar otra vertical a la altura de la mediana,
c. Trazar una vertical de puntos a la izquierda del primer cuartil y distancia 1.5 veces el rango intercuartílico Barrera interior izquierda ,
d. Trazar otra vertical de puntos a la misma distancia y a la derecha del tercer cuartil. Barrera interior derecha,
e. Trazar otra vertical de puntos a la izquierda del primer cuartil a distancia 3 veces el rango intercuartílico. Barrera exterior izquierda,
f. Trazar otra horizontal a la misma distancia y a la derecha del tercer cuartil. Barrera exterior derecha.,
g. Trazar un segmento desde cada lado de la caja al dato más extremo que aparezca dentro de las barreras interiores.
Es fácil advertir que la caja contiene el cincuenta por ciento central de los datos y que las otras dos cuartas partes restantes quedan una de cada lado de la misma.
Si quedaran observaciones fuera de las barreras interiores son datos atípicos (outliers). Las observaciones que quedaran fuera de las barreras exteriores son datos atípicos extremos.
Algunos softs presentan los gráficos de forma distinta. Por ejemplo, en sentido vertical y sin líneas de puntos. En tales casos debemos reemplazar vertical por horizontal, izquierda por abajo y derecha por arriba.
Otra característica de los softs es que:
- Reemplaza las barreras interiores por los límites de la variable bajo análisis (izquierda -abajo- por límite inferior de la variable, si éste fuera menor y derecha –arriba- por el límite superior de la variable, si éste fuera mayor,
- Reemplaza las barreras exteriores por los límites de la variable bajo análisis (izquierda –abajo- por el límite inferior de la variable, si este fuera menor y, derecha –arriba- por el límite superior de la variable, si éste fuera mayor.
martes, 19 de mayo de 2009
REGRESION LINEAL
REGRESION LINEAL REGRESION LINEAL POSITIVA
NEGATIVA
viernes, 8 de mayo de 2009
La regresion es una tecnica estadistica utilizada para simular la relacion existente entre dos o mas variables. por lo tanto se puede emplear para contruir un modelo que permita predecir el comportanmiento de una variable dada, la regresion es ùtilizada para interpretar situaciones reales.
existen varios tipos de regresion, entre ellas estan:
regresion lineal
cuadratica
exponencial
entre otras
CORRELACION:
La correlacion es utilizada para ver la relacion que existe entre las dos variables que se esten estudiando.
en ocasiones no existira ninguna relacion enre las varables, se ve a travez del diagrama de dispersion si los puntos quedan demasiado dispersos y no se puede ajustar una linea a los mismos se dira que la relacion es nula.
GRADOS DE LA CORRELACION:
perfecta: R=1
Excelente 0.9<=R<1
Buena 0.8<=R<0.9
Regular 0.5<=R<0.8
Mala R<0.5
martes, 24 de marzo de 2009
TABLAS DE DOBLE ENTRADA
Descripción
En una tabla de doble entrada, los datos se muestran en columnas y filas al igual que en las tablas. Sin embargo, en comparación con las tablas, cada columna tiene por lo menos un encabezado y cada fila tiene por lo menos un encabezado de fila. Los datos correspondientes aparecen en la intersección de los encabezados de la columna y la fila: esta sección corresponde al "cuerpo".
Los estudios estadísticos que se centran en el análisis de una sola variable se llaman unidimensionales. Sin embargo, en las situaciones reales es corriente que se tenga que investigar la combinación de dos variables estadísticas, en lo que se conoce por distribución bidimensional. En este campo, se utilizan presentaciones de los datos en tablas de doble entrada, con gráficas de nube de puntos que interrelacionan las variables.
Distribuciones bidimensionales
Cuando se realizan estudios estadísticos de dos variables, el modelo resultante recibe el nombre de distribución bidimensional. Algunos ejemplos de este tipo de distribución son las tablas de altura-peso de un colectivo de población, la relación pulso-temperatura de un grupo de enfermos y la gráfica de ingresos y gastos de una empresa.
En estas distribuciones se manejan variables estadísticas bidimensionales, que constituyen pares de valores de cada una de las variables elementales que intervienen, denotados por (xi, yj).
cuando el número de datos es grande, se recurre a las tablas de doble entrada:
En cada casilla se pone la frecuencia correspondiente al par de valores que definen esa casilla. Por ejemplo, hay 11 individuos para los cuales x =0, y =1. Es decir, el par (0,1) está 11 veces.
Tabla de doble entrada. Está formada por tantas filas y columnas como valores tengamos de cada una de las variables, más una fila y una columna más para indicar los totales. Está indicada para casos con bastantes datos, en los que para cada valor de una variable, existen varios valores otra
SESGO
El sesgo mide la direccion que se va dando en la distribucion de tendencia central
Desviacion normal
es cuando la media la mediana y la moda quedan en el mismo lugar
curtosis
la curtosis la vamos a utilizar si la distribucion es normal
La curtosis es una medida cuantifica , que mide la agudeza de la distribucion o fenomeno.
Las siguientes graficas se utilizaran si y solo si la distribucion sea normal.
las siguientes graficas son:
Leptocurtica
mesocurtica
platocurtica
MEDIDAS DE FORMA
Las medidas de forma permiten comprobar si una distribución de frecuencia tiene características especiales como simetría, asimetría, nivel de concentración de datos y nivel de apuntamiento que la clasifiquen en un tipo particular de distribución.
Las medidas de forma son necesarias para determinar el comportamiento de los datos y así, poder adaptar herramientas para el análisis probabilístico.
Medidas de forma: Son indicadores estadísticos que permiten identificar si una distribución de frecuencia presenta uniformidad.
la media, mediana y moda son las medidas que se utilizan para determinar el grado de asimetria de una distribucion de frecuencias.
QUE ES SIMETRIA Y ASIMETRIA:
SIMETRIA
La simetría es un rasgo característico de formas geométricas, sistema, ecuaciones, y otros objetos materiales o entidades abstractas, relacionada con su invariancia bajo ciertas transformaciones, movimientos o interEn condiciones formales, decimos que un objeto es simétrico en lo que concierne a una operación matemática dada, si, cuando aplicado al objeto, esta operación no cambia el objeto o su aspectocambios.
entonces en la simetria no hay variacion.
ASIMETRIA
Asimetría se refiere a la no simetría, es decir, a la propiedad de determinados cuerpos, funciones matemáticas y otros tipos de elementos en los que, al aplicarles una regla de transformación efectiva, se observan cambios respecto al elemento original.
seguimiento de medidas de tendencia central
Para el calculo de la media aritmetica existen varias formas, por esta: calculo de la media aritmetica de una serie simple de valores, la media aritmetica de una distribucion de frecuencias de valores sin agrupar, y la media aritmetica de valores agrupados.
la media aritmetica de una serie simple.
Este calculo de hace mediante la siguiente formula.
_
X=X1
___
N
media aritmetica de una distribucion de frecuencias sin agrupar
Este promedio es llamado tambien ponderado porque cada termino se repite dos o mas veces ;
es decir que cada termino tiene diferente peso al contrario del promedio aritmetico simple en donde cada termino solo se escribe una vez.
media aritmetica de frecuencias de valores agrupados
Cuando los valores estan agrupados en intervalos de amplitud constante o variable, para calcular la media aritmetica es necesario hallar la marca de clase de cada intervalo y multiplicarloa por la frecuancia respectiva.
sábado, 21 de marzo de 2009
MEDIDAS DE POSICION
- Se representan con la letra C.
- Es el percentil i-ésimo, donde la i toma valores del 1 al 99. El i % de la muestra son valores menores que él y el 100-i % restante son mayores.
Cuando los datos no están agrupados en intervalos, los cuartiles, así como el resto de las medidas de posición, tienen un valor claro. Sin embargo, cuando tenemos una agrupación de los datos ya no es tan sencillo realizar el cálculo. Sí que resulta claro ver en cuál de los intervalos está el cuartil (quintil, decil o percentil) buscado, pero para calcular su valor exacto necesitaremos usar una fórmula.
QUINTILES
MEDIDAS DE TENDENCIA CENTRAL
Según el número de valores que se tengan se pueden presentar dos casos:
- Si el número de valores es impar,
- Si el número de valores es par,
Ejemplo 1:
Se tienen los siguientes datos: 5, 4, 8, 10, 9, 1, 2
Al ordenarlos en forma creciente, es decir de menor a mayor, se tiene:
1, 2, 4, 5 , 8, 9, 10
El 5 corresponde a
Ejemplo 2:
El siguiente conjunto de datos está ordenado en forma decreciente, de mayor a menor, y corresponde a un conjunto de valores pares, por lo tanto,
21, 19, 18, 15, 13, 11 ,10, 9, 5, 3
Med | = | 13 + 11 | = | 24 | = | 12 |
2 | 2 |
Es la medida que indica cual dato tiene la mayor frecuencia en un conjunto de datos, o sea, cual se repite más
MEDIA ARMONICA
La media armónica , representada H, de una cantidad finita de números es igual al recíproco, o inverso, de la media aritmética de los recíprocos de dichos números
Así, dados los números a1,a2, ... , an, la media armónica será igual a:
La media armónica resulta poco influida por la existencia de determinados valores mucho más grandes que el conjunto de los otros, siendo en cambio sensible a valores mucho más pequeños que el conjunto.
La media armónica no está definida en el caso de la existencia en el conjunto de valores nulos.
MEDIA CUADRATICA
La media cuadrática es igual a la raíz cuadrada de la suma de los cuadrados de los valores dividida entre el número de datos:
Esta media como medida de asociación tiene aplicaciones tanto en ciencias biológicas como en medicina.
MEDIA GEOMETRICA
La media geométrica de una cantidad finita de números (digamos 'n' números) es la raíz n-ésima del producto de todos los números.
sábado, 14 de marzo de 2009
TALLOS Y HOJAS
Diagrama de tallo y hojas
Un diagrama donde cada valor de datos es dividido en una "hoja" (normalmente el último dígito) y un "tallo" (los otros dígitos). Por ejemplo "32" sería dividido en "3" (tallo) y "2" (hoja).Los valores del "tallo" se escriben hacia abajo y los valores "hoja" van a la derecha (o izquierda) del los valores tallo.El "tallo" es usado para agrupar los puntajes y cada "hoja" indica los puntajes individuales dentro de cada grupo.
EJEMPLO
TALLO HOJA
22 2
27 7
26 6
28 8
33 3
44 4
el muestreo
- MUESTREO
vamos a tomar ciertos criterios de decisión, el muestreo ...
Concepto de muestreo
El muestreo es una herramienta de la investigación científica. Su función básica es determinar que parte de una realidad en estudio (población o universo) debe examinarse con la finalidad de hacer inferencias sobre dicha población. El error que se comete debido a hecho de que se obtienen conclusiones sobre cierta realidad a partir de la observación de sólo una parte de ella, se denomina error de muestreo. Obtener una muestra adecuada significa lograr una versión simplificada de la población, que reproduzca de algún modo sus rasgos básicos.
EL CENSO
Se aplica en toda la poblacion
Población: Es todo conjunto de elementos, finito o infinito, definido por una o más características, de las que gozan todos los elementos que lo componen, y sólo ellos.
- Encuesta
Se aplica a una parte de la poblacion
TIPOS DE MUESTREO
deliberado
Muestreo deliberado: Consiste en seleccionar la muestra de forma deliberada
porque los sujetos poseen las características necesarias para la investigación. Los
resultados son difíciles de generalizar
El tamaño seleccionado de la muestra real que se presenta, responde a un criterio
de zonificación que esta investigación se planea realizar. El trabajo es
experimental y sólo una parte del principal. Los trabajos descriptivos que se
presentan son una forma de controlar las muchas variables que pueden aparecer
a lo largo del proceso, para ello se aumentará el número de elementos en la
muestra a medida que se monitoreen otras escuelas sectorizadas
conglomerado
Muestreo de conglomerados.Para obtener una muestra de conglomerados, primero dividir la población en grupos que son convenientes para el muestreo. En seguida, seleccionar una porción de los grupos al azar o por un método sistemático. Finalmente, tomar todos los elementos o parte de ellos al azar o por un método sistemático de los grupos seleccionados para obtener una muestra. Bajo este método, aunque no todos los grupos son muestreados, cada grupo tiene una igual probabilidad de ser seleccionado. Por lo tanto la muestra es aleatoria.Una muestra de conglomerados, usualmente produce un mayor error muestral (por lo tanto, da menor precisión de las estimaciones acerca de la población) que una muestra aleatoria simple del mismo tamaño. Los elementos individuales dentro de cada "conglomerado" tienden usualmente a ser iguales.
estratificado:
Muestreo Estratificado Para obtener una muestra aleatoria estratificada, primero se divide la población en grupos, llamados estratos, que son más homogéneos que la población como un todo. Los elementos de la muestra son entonces seleccionados al azar o por un método sistemático de cada estrato. Las estimaciones de la población, basadas en la muestra estratificada, usualmente tienen mayor precisión (o menor error muestral) que si la población entera muestreada mediante muestreo aleatorio simple. El número de elementos seleccionado de cada estrato puede ser proporcional o desproporcional al tamaño del estrato en relación con la población.
lunes, 2 de febrero de 2009
mas temas
un dato es atipico cuando hay datos muy bajos y derrepente aparece uno muy alto
CUANDO LA MEDIANA ES POCO ROBUSTA
porque si se mantiene al centro.
LA MEDIA ES NO ROBUSTA
porque se desplaza en funcion de los datos de los extremos
CUANDO LA MEDIA ES CONFIABLE.
Cuando la despersion es minima, si la dispersion no es muy alta.
Las medidas de dispersion son las que indican que la media si es confiable.
ALGUNAS MEDIDAS DE DISPERSION SON:
desviacion estandar
desviacion media
varianza
variacion de perason.
LA MEDIA NO ES CONFIABLE:
cuando la desviacion estandar es muy alta
lunes, 26 de enero de 2009
estadistica
20/01/09
DISTRIBUCION DE FRECUENCIAS:
son los numeros de casos bien definidos segun los intervalos y para ello primeramente necesitamos tabular datos. la diferencia es que contienen frecuencias pero no deja de ser una tabla.
TABLA:
es donde se representan los datos ya especificados en el orden adecuado para que asi mismo se pueda llegar a los resultados correctos. esta no contiene frecuencias.
EXISTEN TRES CLASES DE TABLAS:
TABLA SIMPLE:
los datos son menoS de 15 y no se repiten.
TABLA NO AGRUPADA:
los datos que contiene son menOS de 15 y se repiten
TABLA AGRUPADA:
Esta tabla se realiza cuando nuestros datos ya sean distintos, repetidos o no repetidos.
TABLAS CONTINUA Y NO CONTINUAS:
CONTINUA;
Es cuando nos representan los datos con numeros decimales
NO CONTINUA:
Los datos son representados con numeros enteros.
CODIFICACION:
Es una manera en donde se nos hace mucho mas facil trabajar los datos ya sean con decimales o cantidades enteras.
Existen varias formas de codificar, he aqui algunas de ellas: