viernes, 22 de mayo de 2009

COMENTARIOS SOBRE VARIOS TEMAS

COMENTARIOS DE VARIOS TEMAS.


DIAGRAMA DE DISPERSION:
diagrama de dispersion O nube de puntos,se realiza con el objetivo de ver que tipo de regresion es, ya que conforme esten los puntos de la nube se podra observar si es regresion lineal, cuadratica o cualquier otra, tambien se podra observar si entre los puntos existe alguna relacion y si no, se denomina relacion nula. El diagrama de dispersion es utilizado para ver el grado de relacion que pueda existir entre dos fenomenos.
NUBE DE PUNTOS:






REGRESION LINEAL:
La regresion lineal se encuantra haciendo el diagrama de dispersion, ya teniendo nuestra nube de puntos, hacemos nuestro mejor ajuste trazando una linea recta pero siempre observando que quede en la mejor posicion posible.
La correlación lineal perfecta ocurre cuando todos los puntos del diagrama de dispersión están exactamente sobre una recta.






REGRESION CUADRATICA:
Este tipo de relacion, al igual que la lineal, va en un diagrama de dispersion pero ya no sera una linea recta si no que sera una curva.







DIAGRAMA DE CAJA:
Investigacion:

Un diagrama de caja es un gráfico, basado en cuartiles, mediante el cual se visualiza un conjunto de datos. Está compuesto por un rectángulo, la caja, y dos brazos, los bigotes.

Es un gráfico que se suministra información sobre los valores mínimo y máximo, los cuartiles Q1, Q2 o mediana y Q3, y sobre la existencia de valores atípicos y simetría de la distribución.




comentario:

A este diagrama se le llama asi porque al graficarlo se puede observar que tiene forma de caja.
El diagrama es de gran utilidad para poder establecer datos atipicos, el tamaño que tendra, lo determinaran los cuartiles Q1 Y Q3.
puede ser utilizado para calcular los datos de cualquier fenomeno que deseemo estudiar, como por ejemplo las edades de cierta cantidad de estudiantes, o las estaturas de los mismos.
Es muy interesante porque podremos observar que datos se salen de lo normal.
Lo primero que hay que hacer en todo caso es ordenar los datos y obtener el valor minimo, el valor maximo, los cuartiles Q1, Q2 Y Q3 estos tres son fundamentales a la hora de construir nuestro diagrama y despues sacaremos el rango intercuartilico (RI).





jueves, 21 de mayo de 2009

REGRESION CUADRATICA Y MAS TEMAS



grados de correlacion



grados de correlacion.




• El coeficiente de correlación, r, presenta valores entre –1 y +1.
• Cuando r es próximo a 0, no hay correlación lineal entre las variables. La nube de puntos está muy dispersa o bien no forma una línea recta. No se puede trazar una recta de regresión.
• Cuando r es cercano a +1, hay una buena correlación positiva entre las variables según un modelo lineal y la recta de regresión que se determine tendrá pendiente positiva, será creciente.
• Cuando r es cercano a -1, hay una buena correlación negativa entre las variables según un modelo lineal y la recta de regresión que se determine tendrá pendiente negativa: es decreciente.



REGRESION CUADRATICA:

La regresión cuadrática es el proceso por el cuál encontramos los parámetros de una parábola que mejor se ajusten a una serie de datos que poseemos, ya sean mediciones hechas o de otro tipo.



ImageImage




COVARIANZA

Covarianza: Es una medida de lo que se dispersan los valores de una muestra bidimensional tanto del valor medio de la x como del valor medio de la y. Se determina mediante la expresión




En estadística la covarianza es una medida de dispersión conjunta de dos variables estadísticas.








La covarianza entre dos variables es un estadístico resumen indicador de si las puntuaciones están relacionadas entre sí. La formulación clásica, se simboliza por la letra griega sigma (xy) cuando ha sido calculada en la población. Si se obtiene sobre una muestra, se designa por la letra "Sxy".
Este tipo de estadístico puede utilizarse para medir el grado de relación de dos variables si ambas utilizan una escala de medida a nivel de intervalo/razón (variables cuantitativas).
La formula suele aparecer expresada como:









Una covarianza positiva significa que existe una relación lineal positiva entre las dos variables. Es decir, las puntuaciones bajas de la primera variable (X) se asocian con las puntuaciones bajas de la segunda variable (Y), mientras las puntuaciones altas de X se asocian con los valores altos de la variable Y.
Una covarianza de negativa significa que existe una relación lineal inversa perfecta (negativa) entre las dos variables. Lo que significa que las puntuaciones bajas en X se asocian con los valores altos en Y, mientras las puntuaciones altas en X se asocian con los valores bajos en Y.
Una covarianza 0 se interpreta como la no existencia de una relación lineal entre las dos variables estudiadas.















DIAGRAMA DE CAJA

El Diagrama de Caja es un gráfico basado en los cuartiles que contiene además información sobre la simetría de la distribución y nos permitirá definir la idea de dato atípico”.
Si se dispone de dos o más conjuntos de datos el diagrama permite la comparación visual entre ellos.




¿Cómo se construye?
a. Dibujar un rectángulo cuyos lados verticales pasen por el primero y tercer cuartil,
b. Dibujar otra vertical a la altura de la mediana,
c. Trazar una vertical de puntos a la izquierda del primer cuartil y distancia 1.5 veces el rango intercuartílico Barrera interior izquierda ,
d. Trazar otra vertical de puntos a la misma distancia y a la derecha del tercer cuartil. Barrera interior derecha,
e. Trazar otra vertical de puntos a la izquierda del primer cuartil a distancia 3 veces el rango intercuartílico. Barrera exterior izquierda,
f. Trazar otra horizontal a la misma distancia y a la derecha del tercer cuartil. Barrera exterior derecha.,
g. Trazar un segmento desde cada lado de la caja al dato más extremo que aparezca dentro de las barreras interiores.
Es fácil advertir que la caja contiene el cincuenta por ciento central de los datos y que las otras dos cuartas partes restantes quedan una de cada lado de la misma.
Si quedaran observaciones fuera de las barreras interiores son datos atípicos (outliers). Las observaciones que quedaran fuera de las barreras exteriores son datos atípicos extremos.
Algunos softs presentan los gráficos de forma distinta. Por ejemplo, en sentido vertical y sin líneas de puntos. En tales casos debemos reemplazar vertical por horizontal, izquierda por abajo y derecha por arriba.
Otra característica de los softs es que:
- Reemplaza las barreras interiores por los límites de la variable bajo análisis (izquierda -abajo- por límite inferior de la variable, si éste fuera menor y derecha –arriba- por el límite superior de la variable, si éste fuera mayor,
- Reemplaza las barreras exteriores por los límites de la variable bajo análisis (izquierda –abajo- por el límite inferior de la variable, si este fuera menor y, derecha –arriba- por el límite superior de la variable, si éste fuera mayor.




martes, 19 de mayo de 2009

REGRESION LINEAL

EJMPLO DE REGRESION LINEAL NEGATIVA

REGRESION LINEAL REGRESION LINEAL POSITIVA
NEGATIVA



REGRESION LINEAL


En estadística la regresión lineal o ajuste lineal es un método matemático que modeliza la relación entre una variable dependiente Y, las variables independientes Xi y un término aleatorio.






formula de la regresion lineal simple:


Y=A+BX




formula para la pendiente:


llamada pendiente ordenada al origen o pendiente intersecto


Y=mx+-b donde (b) es el intersecto


y m se calcula de la siguiente manera:




m= _AY_


AX




En la regresion lineal se puede ajustar una linea recta la cual se hace buscando su mejor ajuste, logrando que cada uno de los puntos no queden tan dispersos a la hora de trazar la linea.




El principal objetivo de la correlacion lineal es medir la exactitud de una relacion lineal entre dos varibles xy




La correlación, método por el cual se relacionan dos variables se pude graficar con un diagrama de dispersión de puntos, a la cual muchos autores le llaman nubes de puntos, encuadrado dentro de un gráfico de coordenadas X Y en la cual se pude trazar una recta y cuyos puntos mas cercanos de una recta hablaran de una correlación mas fuerte, ha esta recta se le denomina recta de regresión, que puede ser positiva o negativa, la primera contundencia a aumentar y la segunda en descenso o decreciente




En el modelo de regresión lineal simple se utiliza la técnica de estimación de los mínimos cuadrados, este modelo tiene solo una variable de predicción y se supone una ecuación de regresión lineal.
































































































































































































































































































































































































































































viernes, 8 de mayo de 2009

REGRESION
La regresion es una tecnica estadistica utilizada para simular la relacion existente entre dos o mas variables. por lo tanto se puede emplear para contruir un modelo que permita predecir el comportanmiento de una variable dada, la regresion es ùtilizada para interpretar situaciones reales.



existen varios tipos de regresion, entre ellas estan:
regresion lineal
cuadratica
exponencial
entre otras



CORRELACION:
La correlacion es utilizada para ver la relacion que existe entre las dos variables que se esten estudiando.
en ocasiones no existira ninguna relacion enre las varables, se ve a travez del diagrama de dispersion si los puntos quedan demasiado dispersos y no se puede ajustar una linea a los mismos se dira que la relacion es nula.



GRADOS DE LA CORRELACION:
perfecta: R=1
Excelente 0.9<=R<1
Buena 0.8<=R<0.9
Regular 0.5<=R<0.8
Mala R<0.5