Identificación del conjunto

En estadística y econometría , la identificación de conjuntos (o identificación parcial ) extiende el concepto de identificabilidad (o "identificación puntual") en modelos estadísticos a entornos donde el modelo y la distribución de variables observables no son suficientes para determinar un valor único para los parámetros del modelo , sino que restringen los parámetros para que se encuentren en un subconjunto estricto del espacio de parámetros. Los modelos estadísticos que se identifican de forma conjunta (o parcialmente) surgen en una variedad de entornos en economía , incluida la teoría de juegos y el modelo causal de Rubin . A diferencia de los enfoques que ofrecen identificación puntual de los parámetros del modelo, se utilizan métodos de la literatura sobre identificación parcial para obtener estimaciones de conjuntos que son válidas bajo supuestos de modelado más débiles. [1]

Historia

Los primeros trabajos que contenían las ideas principales de la identificación de conjuntos incluían a Frisch (1934) y Marschak & Andrews (1944). Sin embargo, los métodos fueron desarrollados y promovidos significativamente por Charles Manski , comenzando con Manski (1989) y Manski (1990).

La identificación parcial sigue siendo un tema importante en la investigación en econometría. Powell (2017) mencionó la identificación parcial como un ejemplo de progreso teórico en la literatura econométrica, y Bonhomme y Shaikh (2017) mencionan la identificación parcial como “uno de los temas recientes más destacados en econometría”.

Definición

Sea un vector de variables latentes, sea un vector de variables explicativas observadas (posiblemente endógenas) y sea un vector de variables de resultado endógenas observadas. Una estructura es un par , donde representa una colección de distribuciones condicionales, y es una función estructural tal que para todas las realizaciones de los vectores aleatorios . Un modelo es una colección de estructuras admisibles (es decir, posibles) . [2] [3] R d {\displaystyle U\in {\mathcal {U}}\subseteq \mathbb {R} ^{d_{u}}} O O R d el {\displaystyle Z\in {\mathcal {Z}}\subseteq \mathbb {R} ^{d_{z}}} Y Y R d y {\textstyle Y\in {\mathcal {Y}}\subseteq \mathbb {R} ^{d_{y}}} s = ( yo , PAG O ) {\displaystyle s=(h,{\mathcal {P}}_{U\mid Z})} PAG O {\displaystyle {\mathcal {P}}_{U\mid Z}} yo {\estilo de visualización h} yo ( y , el , ) = 0 {\displaystyle h(y,z,u)=0} ( y , el , ) {\displaystyle (y,z,u)} ( Y , O , ) {\estilo de visualización (Y,Z,U)} s {\estilo de visualización s}

Sea la colección de distribuciones condicionales de consistentes con la estructura . Se dice que las estructuras admisibles y son observacionalmente equivalentes si . [2] [3] Sea la estructura verdadera (es decir, generadora de datos). Se dice que el modelo está identificado puntualmente si para cada tenemos . De manera más general, se dice que el modelo está identificado en conjunto (o parcialmente ) si existe al menos un admisible tal que . El conjunto identificado de estructuras es la colección de estructuras admisibles que son observacionalmente equivalentes a . [4] PAG Y O ( s ) {\displaystyle {\mathcal {P}}_{Y\mid Z}(s)} Y O {\displaystyle Y\mid Z} s {\estilo de visualización s} s {\estilo de visualización s} s " {\estilo de visualización s'} PAG Y O ( s ) = PAG Y O ( s " ) {\displaystyle {\mathcal {P}}_{Y\mid Z}(s)={\mathcal {P}}_{Y\mid Z}(s')} s {\displaystyle s^{\star }} s s {\displaystyle s\neq s'} P Y Z ( s ) P Y Z ( s ) {\displaystyle {\mathcal {P}}_{Y\mid Z}(s)\neq {\mathcal {P}}_{Y\mid Z}(s^{\star })} s s {\displaystyle s\neq s^{\star }} P Y Z ( s ) P Y Z ( s ) {\displaystyle {\mathcal {P}}_{Y\mid Z}(s)\neq {\mathcal {P}}_{Y\mid Z}(s^{\star })} s {\displaystyle s^{\star }}

En la mayoría de los casos, la definición se puede simplificar sustancialmente. En particular, cuando es independiente de y tiene una distribución conocida (hasta algún parámetro de dimensión finita), y cuando se conoce hasta algún vector de parámetros de dimensión finita, cada estructura se puede caracterizar por un vector de parámetros de dimensión finita . Si denota el vector verdadero (es decir, generador de datos) de parámetros, entonces el conjunto identificado , a menudo denotado como , es el conjunto de valores de parámetros que son observacionalmente equivalentes a . [4] U {\displaystyle U} Z {\displaystyle Z} h {\displaystyle h} s {\displaystyle s} θ Θ R d θ {\displaystyle \theta \in \Theta \subset \mathbb {R} ^{d_{\theta }}} θ 0 {\displaystyle \theta _{0}} Θ I Θ {\displaystyle \Theta _{I}\subset \Theta } θ 0 {\displaystyle \theta _{0}}

Ejemplo: datos faltantes

Este ejemplo se debe a Tamer (2010). Supongamos que hay dos variables aleatorias binarias , Y y Z. El econometrista está interesado en . Sin embargo, hay un problema de datos faltantes : Y solo se puede observar si . P ( Y = 1 ) {\displaystyle \mathrm {P} (Y=1)} Z = 1 {\displaystyle Z=1}

Por la ley de probabilidad total ,

P ( Y = 1 ) = P ( Y = 1 Z = 1 ) P ( Z = 1 ) + P ( Y = 1 Z = 0 ) P ( Z = 0 ) . {\displaystyle \mathrm {P} (Y=1)=\mathrm {P} (Y=1\mid Z=1)\mathrm {P} (Z=1)+\mathrm {P} (Y=1\mid Z=0)\mathrm {P} (Z=0).}

El único objeto desconocido es , que está restringido a estar entre 0 y 1. Por lo tanto, el conjunto identificado es P ( Y = 1 Z = 0 ) {\displaystyle \mathrm {P} (Y=1\mid Z=0)}

Θ I = { p [ 0 , 1 ] : p = P ( Y = 1 Z = 1 ) P ( Z = 1 ) + q P ( Z = 0 ) ,  for some  q [ 0 , 1 ] } . {\displaystyle \Theta _{I}=\{p\in [0,1]:p=\mathrm {P} (Y=1\mid Z=1)\mathrm {P} (Z=1)+q\mathrm {P} (Z=0),{\text{ for some }}q\in [0,1]\}.}

Dada la limitación de los datos faltantes, el econometrista solo puede decir que . Esto hace uso de toda la información disponible. P ( Y = 1 ) Θ I {\displaystyle \mathrm {P} (Y=1)\in \Theta _{I}}

Inferencia estadística

La estimación de conjuntos no puede depender de las herramientas habituales para la inferencia estadística desarrolladas para la estimación puntual . Una literatura en estadística y econometría estudia métodos para la inferencia estadística en el contexto de modelos de conjuntos identificados, centrándose en la construcción de intervalos de confianza o regiones de confianza con propiedades apropiadas. Por ejemplo, un método desarrollado por Chernozhukov, Hong y Tamer (2007) construye regiones de confianza que cubren el conjunto identificado con una probabilidad dada.

Notas

  1. ^ Domador 2010.
  2. ^ ab "Modelos de variables instrumentales generalizados - The Econometric Society". www.econometricsociety.org . doi :10.3982/ecta12223 . Consultado el 5 de enero de 2024 .
  3. ^ ab Matzkin, Rosa L. (2013-08-02). "Identificación no paramétrica en modelos económicos estructurales". Annual Review of Economics . 5 (1): 457–486. doi :10.1146/annurev-economics-082912-110231. ISSN  1941-1383.
  4. ^Por Lewbel 2019.

Referencias

  • Bonhomme, Stephane; Shaikh, Azeem (2017). "Manteniendo la economía en la econometría: (micro) econometría en la revista de economía política". Revista de Economía Política . 125 (6): 1846–1853. doi :10.1086/694620.
  • Chernozhukov, Victor ; Hong, Han; Tamer, Elie (2007). "Estimación y regiones de confianza para conjuntos de parámetros en modelos econométricos". Econometrica . 75 (5). The Econometric Society: 1243–1284. doi :10.1111/j.1468-0262.2007.00794.x. hdl : 1721.1/63545 . ISSN  0012-9682.
  • Frisch, Ragnar (1934). Análisis estadístico de confluencias mediante sistemas de regresión completos . Instituto Universitario de Economía, Oslo.
  • Manski, Charles (1989). "Anatomía del problema de selección". Revista de Recursos Humanos . 24 (3): 343–360. doi :10.2307/145818.
  • Manski, Charles (1990). "Límites no paramétricos de los efectos del tratamiento". The American Economic Review . 80 (2): 319–323. JSTOR  2006592.
  • Marschak, Jacob; Andrews, Williams (1944). "Ecuaciones simultáneas aleatorias y la teoría de la producción". Econometrica . 12 (3/4). The Econometric Society: 143–205. doi :10.2307/1905432.
  • Powell, James (2017). "Identificación y aproximaciones asintóticas: tres ejemplos de progreso en la teoría econométrica". Journal of Economic Perspectives . 31 (2): 107–124. doi :10.1257/jep.31.2.107.
  • Lewbel, Arthur (1 de diciembre de 2019). "El zoológico de la identificación: significados de la identificación en econometría". Revista de literatura económica . 57 (4). Asociación Económica Estadounidense: 835–903. doi :10.1257/jel.20181361. ISSN  0022-0515. S2CID  125792293.
  • Tamer, Elie (2010). "Identificación parcial en econometría". Revista Anual de Economía . 2 (1): 167–195. doi :10.1146/annurev.economics.050708.143401.

Lectura adicional

Retrieved from "https://en.wikipedia.org/w/index.php?title=Set_identification&oldid=1215068067"