jueves, 11 de diciembre de 2008

UNIDAD V: CORRELACION Y REGRESION

MARCO TEORICO:

La regresión como una técnica estadística, una de ellas la regresión lineal simple y la regresión multifactorial, analiza la relación de dos o mas variables continuas, cuando analiza las dos variables a esta se el conoce como variable bivariantes que pueden corresponder a variables cualitativas, la regresión nos permite el cambio en una de las variables llamadas respuesta y que corresponde a otra conocida como variable explicativa, la regresión es una técnica utilizada para inferir datos a partir de otros y hallar una respuesta de lo que puede suceder.

Siendo así la regresión una técnica estadística, por lo tanto para interpretar situaciones reales, pero a veces se manipula de mala manera por lo que es necesario realizar una selección adecuada de las variables que van a construir las formulas matemática, que representen a la regresión, por eso hay que tomar en cuenta variables que tiene relación, de lo contraria se estaría matematizando un galimatías.

Se pueden encontrar varios tipos de regresión, por ejemplo:

1.-Regresión lineal simple
2.-Regresión múltiple ( varias variables)
3.-Regresión logística
4.-Simple b) Múltiple, etc.

La regresión lineal técnica que usa variables aleatorias, continuas se diferencia del otro método analítica que es la correlación, por que esta última no distingue entre las variables respuesta y la variable explicativa por que las trata en forma simétrica.

La matematización nos da ecuaciones para manipular los datos, como por ejemplo medir la circunferencia de los niños y niñas y que parece incrementarse entre las edades de 2 meses y 18 años, aquí podemos inferir o predecir que las circunferencias del cráneo cambiara con la edad, en este ejercicio la circunferencia de la cabeza es la respuesta y la edad la variable explicativa.

En la regresión tenemos ecuaciones que nos representan las diferentes clases de regresión:

Regresión Lineal : y = A + Bx
Regresiòn Logarìmica : y = A + BLn(x)
Regresión Exponencial : y = Ac(bx)
Regresión Cuadrática : y = A + Bx +Cx2

Para obtener un
modelo de regresión es suficiente establecer la regresión para eso se hace uso del coeficiente de correlación: R.

R = Coeficiente de correlación, este método mide el grado de relación existente entre dos variables, el valor de R varía de -1 a 1, pero en la práctica se traba con un valor absoluto de R. El valor del coeficiente de relación se interpreta de modo que a media que R se aproxima a 1, es más grande la relación entre los datos, por lo tanto R (coeficiente de correlación) mide la aproximación entre las variables.

El coeficiente de correlación se puede clasificar de la siguiente manera:
CORRELACIÒN VALOR O RANGO

1) Perfecta 1) R = 1
2) Excelente 2) R = 0.9 < = R < r =" 0.8" r =" 0.5">

DISTRIBUCIÒN DIVARIANTE

DEFINICIÒN :

La distribución diváriate es cuando se estudia en una población dos variables, que forman pares correspondientes a cada individuo, como por Ejm:
Las notas de 10 alumnos en
biología y lenguaje

BIOLOGIA: 2, 4, 5, 5, 6, 6, 7, 7, 8, 8, 9

LENGUAJE: 2, 2, 5, 5, 5, 7, 5, 8, 7, 10
Los pares de valores son: ( 2, 2) (4,2) (5,5)…….(8,7) (9,10) forman una distribución diváriate.

La correlación, método por el cual se relacionan dos variables se pude graficar con un diagrama de dispersión de puntos, a la cual muchos autores le llaman nubes de puntos, encuadrado dentro de un gráfico de coordenadas X Y en la cual se pude trazar una recta y cuyos puntos mas cercanos de una recta hablaran de una correlación mas fuerte, ha esta recta se le denomina recta de regresión, que puede ser positiva o negativa, la primera contundencia a aumentar y la segunda en descenso o decreciente.

También se puede describir un diagrama de dispersión en coordenadas cartesianas valores como en la distribución diváriate, en donde la nube de puntos representa los pares de valores.

GRAFICOS DE RECTA DE REGRESIÒN:

Por último se pueden graficar las líneas de tendencia, herramienta muy útil para el mercadeo por que es utilizada para evaluar la resistencia que proyectan los precios. Cuando una línea de tendencia central se rompe ya sea con tendencia al alza o en la baja es porque ocurre un cambio en los precios, por lo tanto las líneas de tendencia pueden ser alcista cuando se unen los puntos sucesivos y bajista cuando se unen los puntos máximos.

NUBE DE PUNTOS O DIAGRAMA DE DISPERSIÓN

La primera forma de describir una distribución bidimensional es representar los pares de valores en el plano cartesiano. El gráfico obtenido recibe el nombre de nube de puntos o diagrama de dispersión.

CORRELACIÓN LINEAL Y RECTA DE REGRESIÓN.

Cuando observamos una nube de puntos podemos apreciar si los puntos se agrupan cerca de alguna curva. Aquí nos limitaremos a ver si los puntos se distribuyen alrededor de una recta. Si así ocurre diremos que hay correlación lineal. La recta se denomina recta de regresión.

MEDIDA DE LA CORRELACIÓN

La apreciación visual de la existencia de correlación no es suficiente. Usaremos un parámetro, llamado coeficiente de correlación que denotaremos con la letra r, que nos permite valorar si ésta es fuerte o débil, positiva o negativa. El cálculo es una tarea mecánica, que podemos realizar con una calculadora o un programa informático. Nuestro interés está en saber interpretarlo.

Antes de ponernos a trabajar destacaremos una de sus propiedades

-1 <>

~~~~~~~~~~~~~~~~~```````````````````````````````````````~~~~~~~~~~~~~~~~~~``

EJEMPLOS:

Una persona se entrena para obtener el carnet de conducir repitiendo un test de 50 preguntas. En la gráfica se describen el nº de errores que corresponden a los intentos realizados.

Observa que hay una correlación muy fuerte (los puntos están "casi" alineados) y negativa (la recta es decreciente).

A 12 alumnos de un centro se les preguntó a qué distancia estaba su residencia del Instituto, con fin de estudiar si esta variable estaba relacionada con la nota media obtenida. Se obtuvieron los datos que figuran en la siguiente tabla:


Distancia (en km) 0.05, 0.1, 0.12, 0.4, 0.5, 0.7, 1, 1.2, 2.1, 2.5, 3, 3

Nota media 8.4, 4, 5.7, 9.1, 6.3, 6.7, 4.3, 5.4, 7.8, 4.5, 7.2, 8.1

Observamos una nube de puntos que no nos sugiere ninguna recta concreta, porque la correlación es prácticamente inexistente, es decir, no tiene nada que ver con el rendimiento académico la distancia del domicilio al instituto,

1 comentario:

ilyasjagneaux dijo...

TITONICS' TINN HEADSET WITH REVEALED VINTAGE METAL
A unique earring with titanium ore an extra titanium blade long, rounded, and shaped design. The titanium dog teeth implants Tintium'S babylisspro nano titanium earring is tittanium the largest and most popular type of earring.