jueves, 21 de mayo de 2009

REGRESION CUADRATICA Y MAS TEMAS



grados de correlacion



grados de correlacion.




• El coeficiente de correlación, r, presenta valores entre –1 y +1.
• Cuando r es próximo a 0, no hay correlación lineal entre las variables. La nube de puntos está muy dispersa o bien no forma una línea recta. No se puede trazar una recta de regresión.
• Cuando r es cercano a +1, hay una buena correlación positiva entre las variables según un modelo lineal y la recta de regresión que se determine tendrá pendiente positiva, será creciente.
• Cuando r es cercano a -1, hay una buena correlación negativa entre las variables según un modelo lineal y la recta de regresión que se determine tendrá pendiente negativa: es decreciente.



REGRESION CUADRATICA:

La regresión cuadrática es el proceso por el cuál encontramos los parámetros de una parábola que mejor se ajusten a una serie de datos que poseemos, ya sean mediciones hechas o de otro tipo.



ImageImage




COVARIANZA

Covarianza: Es una medida de lo que se dispersan los valores de una muestra bidimensional tanto del valor medio de la x como del valor medio de la y. Se determina mediante la expresión




En estadística la covarianza es una medida de dispersión conjunta de dos variables estadísticas.








La covarianza entre dos variables es un estadístico resumen indicador de si las puntuaciones están relacionadas entre sí. La formulación clásica, se simboliza por la letra griega sigma (xy) cuando ha sido calculada en la población. Si se obtiene sobre una muestra, se designa por la letra "Sxy".
Este tipo de estadístico puede utilizarse para medir el grado de relación de dos variables si ambas utilizan una escala de medida a nivel de intervalo/razón (variables cuantitativas).
La formula suele aparecer expresada como:









Una covarianza positiva significa que existe una relación lineal positiva entre las dos variables. Es decir, las puntuaciones bajas de la primera variable (X) se asocian con las puntuaciones bajas de la segunda variable (Y), mientras las puntuaciones altas de X se asocian con los valores altos de la variable Y.
Una covarianza de negativa significa que existe una relación lineal inversa perfecta (negativa) entre las dos variables. Lo que significa que las puntuaciones bajas en X se asocian con los valores altos en Y, mientras las puntuaciones altas en X se asocian con los valores bajos en Y.
Una covarianza 0 se interpreta como la no existencia de una relación lineal entre las dos variables estudiadas.















DIAGRAMA DE CAJA

El Diagrama de Caja es un gráfico basado en los cuartiles que contiene además información sobre la simetría de la distribución y nos permitirá definir la idea de dato atípico”.
Si se dispone de dos o más conjuntos de datos el diagrama permite la comparación visual entre ellos.




¿Cómo se construye?
a. Dibujar un rectángulo cuyos lados verticales pasen por el primero y tercer cuartil,
b. Dibujar otra vertical a la altura de la mediana,
c. Trazar una vertical de puntos a la izquierda del primer cuartil y distancia 1.5 veces el rango intercuartílico Barrera interior izquierda ,
d. Trazar otra vertical de puntos a la misma distancia y a la derecha del tercer cuartil. Barrera interior derecha,
e. Trazar otra vertical de puntos a la izquierda del primer cuartil a distancia 3 veces el rango intercuartílico. Barrera exterior izquierda,
f. Trazar otra horizontal a la misma distancia y a la derecha del tercer cuartil. Barrera exterior derecha.,
g. Trazar un segmento desde cada lado de la caja al dato más extremo que aparezca dentro de las barreras interiores.
Es fácil advertir que la caja contiene el cincuenta por ciento central de los datos y que las otras dos cuartas partes restantes quedan una de cada lado de la misma.
Si quedaran observaciones fuera de las barreras interiores son datos atípicos (outliers). Las observaciones que quedaran fuera de las barreras exteriores son datos atípicos extremos.
Algunos softs presentan los gráficos de forma distinta. Por ejemplo, en sentido vertical y sin líneas de puntos. En tales casos debemos reemplazar vertical por horizontal, izquierda por abajo y derecha por arriba.
Otra característica de los softs es que:
- Reemplaza las barreras interiores por los límites de la variable bajo análisis (izquierda -abajo- por límite inferior de la variable, si éste fuera menor y derecha –arriba- por el límite superior de la variable, si éste fuera mayor,
- Reemplaza las barreras exteriores por los límites de la variable bajo análisis (izquierda –abajo- por el límite inferior de la variable, si este fuera menor y, derecha –arriba- por el límite superior de la variable, si éste fuera mayor.




No hay comentarios:

Publicar un comentario en la entrada