Tipología de variables y datos en la modelización econométrica
Se entiende por variable al concepto económico que queremos analizar.
Normalmente utilizaremos variables cuantitativas, es decir, aquellas cuyos valores vienen expresados de forma numérica.
Sin embargo, también existe la posibilidad de incluir en el modelo econométrico información cualitativa, siempre que la información cualitativa pueda expresarse de forma cuantitativa. Dentro de este tipo de variables conviene conocer las siguientes posibilidades que se le pueden presentar al económetra:
- Variables proxies: son variables aproximadas a las variables objeto de análisis. Por ejemplo, si quiero utilizar una variable que mida el nivel cultural de un país (variable cualitativa) puedo utilizar como variable proxy el número de bibliotecas existentes en un país, que si bien no recoge el concepto exacto que yo quiero medir, sí se aproxima al mismo.
- Variables ficticias o dummy: estas variables representan la incidencia que tiene sobre la variable endógena objeto de análisis un fenómeno cualitativo. Habitualmente, a la variable ficticia se le asignan dos valores arbitrarios según se dé o no cierta cualidad en un fenómeno. Así, se le puede asignar el valor 1 si ocurre un determinado fenómeno y O en caso contrario.
Estas variables pueden ser de dos tipos:
- Ficticia de intervalo. Por ejemplo, si estoy analizando la variable exportaciones en España desde 1970 hasta el año 2000, hay un hecho importante que es la entrada de España en la Unión Europea que debo recoger a través de la utilización de la variable ficticia.
- Ficticia de estación. Por ejemplo, si se está analizando el crecimiento económico de un país en el que en un año determinado hubo un acontecimiento meteorológico que tuvo una repercusión negativa sobre la economía, al tratarse éste de un dato casual (y no equilibrado con el resto de valores que toma la serie) debo introducir en el modelo este tipo de información para que la tenga en cuenta en la estimación y corneta un error menor.
Las variables ficticias se pueden incluir tanto en modelos temporales como en modelos de corte transversal. Por ejemplo, si se analiza la venta de coches a nivel provincial o regional, se puede incluir una variable ficticia que valga O cuando la provincia no tiene metro y 1 cuando sí que lo tiene.
Se entiende por datos los diferentes valores que toma una variable.
Los datos pueden corresponder a los valores de una variable en el tiempo (serie temporal), o a valores para diferentes sujetos en un momento dado (datos de corte transversal).
Por otro lado, las formas alternativas en que un modelo puede venir expresado obligan frecuentemente a transformaciones de los datos originales (tasas de crecimiento, diferencias, logaritmos) o incluso a un cierto tratamiento previo de los mismos (eliminación de tendencia, eliminación de estacionalidad, etcétera).
Con la información disponible, el económetra deberá elaborar una base de datos de tal manera que:
Los datos que formen la base de datos han de ser:
- Suficientes: como mínimo para poder realizar la estimación, el número de observaciones debe ser igual al número de parámetros que queremos estimar. Por lo tanto, si no se cumplen unos requisitos mínimos, aunque teóricamente se puede realizar la estimación, ésta no será confiable.
- Homogéneos: los datos que hacen referencia a una misma variable deben estar expresados de una forma homogénea, esto quiere decir que todos deben ir en niveles o en tasas de variación o en logaritmos. La homogeneidad de los datos también hace referencia al hecho de que todos deben o no ir corregidos por determinados efectos que se dan en la economía como la tendencia o la estacionalidad. Nunca se puede incluir en el modelo una variable cuyos datos estén expresados en distintas bases.
- Actuales: La desactualización en los datos impide realizar un análisis completo del fenómeno económico, ya que éste se referirá únicamente al período muestral utilizado en la estimación.
Califica este Artículo
Categoría: Decisiones y Estadística.
Deja una respuesta