y x estatura del hijo en metros estatura del padre, en metros 1.60 1.65 1.70 1.75 1.601.651.701.75

14
Naturaleza del análisis de regresión.-

Upload: severo-mosso

Post on 11-Apr-2015

117 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Y X Estatura del hijo en metros Estatura del padre, en metros 1.60 1.65 1.70 1.75 1.601.651.701.75

Naturaleza del análisis de regresión.-

Page 2: Y X Estatura del hijo en metros Estatura del padre, en metros 1.60 1.65 1.70 1.75 1.601.651.701.75

Origen histórico del termino regresión.- Francis Galton acuño el termino regresión. En un famoso ensayo. La ley de regresión universal de Galton fue confirmada por su amigo Karl Pearson.La interpretación moderna de la regresión.- El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o mas variable (variables explicativas) con el objetivo de estimar o predecir la media o valor promedio poblacional de la primera e términos de los valores conocidos o fijos (en muestras repetidas) de las segundas. Ejemplos:1.- Considere de nuevo la ley de regresión universal de Galton. A el le interesaba averiguar las razones de la estabilidad en la distribución de estaturas dentro de una población. En el enfoque moderno, la preocupación no es esta explicación, sino averiguar como cambia la estatura promedio de los hijos dada la estatura de los padres.

Page 3: Y X Estatura del hijo en metros Estatura del padre, en metros 1.60 1.65 1.70 1.75 1.601.651.701.75

2.- . Considere el diagrama de dispersión, que representa la distribución hipotética de estaturas de niños en edades fijas. Obsérvese que existe un rango de estatura correspondiente a cada edad. Es obvia la improbabilidad de que todos los niños de una edad determinada tengan estaturas idénticas. Pero en promedio la estatura se incrementa con la edad, que se ve con claridad al trazar una recta por los puntos dentro de los círculos, los cuales representan la estatura promedio de determinadas edades.3.- Al considerar lo referente a la economía, a un economista quizá le interese estudiar la dependencia del consumo personal respecto del ingreso personal neto disponible.

4.- Un monopolista que puede fijar el precio o la producción tal vez desee conocer la demanda de un producto con diversos precios. Tal experimento permite estimar la elasticidad precio.5.- Un economista laboral quizá desee estudiar la tasa de cambio de los salarios monetarios o nominales en relación con la tasa de desempleo.6.- En la economía monetaria se sabe que, si mantiene constante otros factores, cuanto mayor sea la tasa de inflación π, menor será la proporción de k del ingreso que la gente deseara mantener en forma de dinero.7.- El director de marketing de una compañía tal vez quiera conocer la relación entre la demanda del producto de su compañía con el gasto de publicidad.8.- Por ultimo u agrónomo tal vez se interese en estudiar la relación entre el rendimiento de un cultivo, digamos de trigo, y la temperatura, lluvia, cantidad de sol y fertilizantes

Page 4: Y X Estatura del hijo en metros Estatura del padre, en metros 1.60 1.65 1.70 1.75 1.601.651.701.75

Y

X

Esta

tura

del

hijo

en

met

ros

Estatura del padre, en metros

1.60

1.65

1.70

1.75

1.60 1.65 1.70 1.75

Page 5: Y X Estatura del hijo en metros Estatura del padre, en metros 1.60 1.65 1.70 1.75 1.601.651.701.75

Relaciones estadísticas y relaciones deterministas.- El análisis de regresión interesa lo que se conoce como dependencia estadística entre variables, no así la funcional o determinista, propia de la física clásica. En las relaciones estadísticas entre variables se analizan, en esencia, variables aleatorias o estocásticas, es decir, variables con distribuciones de probabilidad. Por otra parte, en la dependencia funcional o determinista también se manejan variables, pero no son aleatorias o estocásticas.

Page 6: Y X Estatura del hijo en metros Estatura del padre, en metros 1.60 1.65 1.70 1.75 1.601.651.701.75

Regresión y Causalidad.- A pesar de que el análisis de regresión tiene que ver con la dependencia de una variable respecto de otras variables, esto no implica causalidad necesariamente. En palabras de Kendall y Stuart: “Una relación estadística, por mas fuerte y sugerente que sea, nunca podrá establecer una conexión causal. Nuestras ideas de causalidad deben provenir de estadística externas y, en ultimo termino, de una u otra teoría”

Page 7: Y X Estatura del hijo en metros Estatura del padre, en metros 1.60 1.65 1.70 1.75 1.601.651.701.75

Regresión y Correlación

El análisis de correlación se relaciona de manera estrecha con el de regresión, aunque conceptualmente los dos son muy diferentes. En el análisis de correlación, el objetivo principal es medir la fuerza o el grado de asociación lineal entre dos variables. El coeficiente de correlación, mide esta fuerza de asociación (lineal).La regresión y la correlación presentan diferencias fundamentales que vale la pena mencionar. En el análisis de regresión hay una asimetría en el tratamiento a las variables dependientes y explicativas. Se supone que la variable dependiente es estadística. Aleatoria o estocástica, es decir. Que tiene una distribución de probabilidad. Por otra parte, se asume que las variables explicativas tienen valores fijos.

Page 8: Y X Estatura del hijo en metros Estatura del padre, en metros 1.60 1.65 1.70 1.75 1.601.651.701.75

Terminología y notación.- Los términos variable dependiente y variable explicativa se define de varias maneras; a continuación se presentan una lista representativa:

Variable Dependiente Variable Explicativa

Variable explicada Variable independiente

Predicha Predictora

Regresada Regresora

Respuesta Estimulo

Endógeno Exógena

Resultado Covariante

Variable controlada Variable de control

Page 9: Y X Estatura del hijo en metros Estatura del padre, en metros 1.60 1.65 1.70 1.75 1.601.651.701.75

Naturaleza y fuentes de datos para el análisis económico.- El éxito de todo análisis econométrico depende al final de cuentas de la disponibilidad de los datos recopilados. Por consiguiente, es muy importante dedicar algún tiempo a estudiar la naturaleza de las fuentes y las limitaciones de los datos para el análisis empírico.Tipos de datos.- Hay tres tipos de datos disponibles para el análisis empírico:1.- Datos de series de tiempo.- Es un conjunto de observaciones sobre los valores de una variable en diferentes momentos tal información debe recopilarse en intervalos regulares, es decir en forma diaria., semanal mensual trimestral quincenal anual o decenal. Estos datos de series de tiempo se utilizan en estudios econométricos, pero presentan algunos problemas especiales para los ecometristas.

2.- Datos transversales.- Consisten en datos de una o mas variables recopilados en el mismo punto del tiempo. Así como los datos de series de tiempo crean problemas especiales, los datos transversales también tienen sus propios problemas, en concreto, el de la heterogeneidad.

Page 10: Y X Estatura del hijo en metros Estatura del padre, en metros 1.60 1.65 1.70 1.75 1.601.651.701.75

3.- Datos combinados.- Reúnen elementos de serie de tiempo y transversales.Datos en panel, longitudinales o en micropanel.- Hay un tipo especial de datos combinados en el cual se estudia a través del tiempo la misma unidad transversal.

Fuentes de datos.- Los datos para el análisis empírico pueden prevenir de una dependencia gubernamental Ejemplo El departamento de comercio, un organismo internacional (FMI) o el banco mundial, Una organización privada o un particular.

Page 11: Y X Estatura del hijo en metros Estatura del padre, en metros 1.60 1.65 1.70 1.75 1.601.651.701.75

Internet.- Internet revoluciono la labor de recopilación de datos. Los datos recopilados por esta organizaciones pueden ser de naturaleza experimental y no experimental.

Los datos experimentales, frecuentes en las ciencias naturales el investigador suele recabar los datos con algunos factores constantes, con el fin de evaluar el efecto de otros en un fenómeno dado. Ejemplo estimar el efecto de la obesidad.En las ciencias sociales, los datos por lo general son de naturaleza experimental, es decir no están sujetos a control del investigador ejemplo el investigador no ejerce ningún control sobre el PBI.

Page 12: Y X Estatura del hijo en metros Estatura del padre, en metros 1.60 1.65 1.70 1.75 1.601.651.701.75

Precisión de los datos. Si bien se dispone de numerosos datos para la investigación económica, su calidad no siempre es adecuada, y por múltiples razones

1.- Los datos de las ciencias sociales son de naturaleza no experimental por consiguiente, es posible incurrir en errores de observación, sea por acción u omisión.2.- Aun en datos reunidos experimentalmente surgen errores de medición debido a las aproximaciones o al redondeo.3.- En encuestas por cuestionarios, el problema de la falta de respuesta puede ser grave; un investigador tiene suerte si obtiene una tasa de respuesta del 40%. El análisis basado en dicha tasa de respuesta parcial quizá no refleje de verdad el comportamiento del 60% que nos respondió.4.- Los métodos de muestreo para obtención de datos llegan a variar tanto que a menudo es difícil comparar los resultados de las diversas muestras.

Page 13: Y X Estatura del hijo en metros Estatura del padre, en metros 1.60 1.65 1.70 1.75 1.601.651.701.75

5.- las cifras económicas suelen estar disponibles en niveles muy agregados Ejemplo la mayor parte de los macrodatos (como el PBI, empleo, inflación, desempleo) están disponibles para la economía en su conjunto, o en el mejor de los casos, para algunas regiones geográficas muy amplias.

6.- debido a su carácter confidencial, ciertos datos solo pueden publicarse en forma muy agregada.Por estos problemas, y muchos mas, el investigador debe tener siempre en mente que el resultado de la investigación será tan bueno como lo sea la calidad de los datos.

Page 14: Y X Estatura del hijo en metros Estatura del padre, en metros 1.60 1.65 1.70 1.75 1.601.651.701.75

Una observación sobre las escalas de medición de las variables.- las variables que a menudo encontrará se clasifican en cuatro categorías.

Escala de razón.- Para la variable X, al tomar dos valores (X1 y X2), la razón X1/X2 y la distancia (X2 – X1) son cantidades con un significado. Asimismo, hay un ordenamiento natural 8ascendente o descendente) de los valores a lo largo de la escala.Escala de intervalo.- Una variable en escala de intervalo satisface las dos ultimas propiedades de la variable en escala de razón, pero no la primera.Escala ordinal.- Una variable pertenece a esta categoría solo si satisface la tercera propiedad de la escala de razón (es decir, el orden natural), como los sistemas de calificaciones por letras (A, B, C) o los niveles de ingresos alto medio y bajo. Para estas variables hay un orden, pero las distancias entre las categorías no son cuantificables.Escala Nominal.- Las variables de esta categoría no tiene ninguna característica de las variables de escala de razón. Las variables como genero (masculino y femenino) y el estado civil (casado Soltero, divorciado, separado) simplemente denotan categorías.