En el debate sobre si la serie de empleo de nómina no agrícola de la encuesta de establecimientos está sobreestimando seriamente el empleo reciente (particularmente en el segundo trimestre), un lector pregunta quejumbrosamente: “¿Entonces estás diciendo que la Reserva Federal de Filadelfia arruinó su análisis y que deberíamos ignorar su trabajo? ¿Esa es tu opinión?”. Respuesta corta a la primera pregunta: No. Respuesta corta a la segunda pregunta: véase más abajo.
Tomo una ventaja de la chow lin enfoque de interpolación/extrapolación a través de collection relacionadas, y explotar la estrecha relación entre el movimiento normal en la serie de empleo whole cubierto en el Censo Trimestral de Empleo y Salarios (QCEW) y la serie de empleo de nómina no agrícola. Específicamente, sigo este procedimiento:
- Estimar la relación entre logaritmo del empleo NFP y logaritmo del empleo cubierto whole, 2001-2019.
- Utilice esta relación para predecir el empleo de NFP, tanto dentro como fuera de la muestra
- Verifique que el empleo de NFP esté bien pronosticado en el período fuera de la muestra.
- Interpretación
Para permitir que las personas con problemas estadísticos entiendan el procedimiento (por ejemplo, personas que no saben qué es un intervalo de confianza), mostrar lo que hago en pasos.
- Estimacion
Tomo datos sobre NFP (serie FRED PAYNSA) y empleo cubierto whole QCEW durante el período 2001-2022 (los datos QCEW comienzan en 2000M12). Los datos de QCEW provienen de un censo y, por lo tanto, no deben estar sujetos a errores de muestreo (los datos de QCEW se utilizan para comparar las estimaciones basadas en encuestas actualizadas del CES). Desafortunadamente, el empleo cubierto whole de QCEW no se informa en términos ajustados estacionalmente. Por lo tanto, estimo la relación entre collection no desestacionalizadas, en logaritmos. Estos datos se muestran en la Figura 1.
Figura 1: Empleo de nómina no agrícola (azul), empleo cubierto whole (marrón), en 000, sin ajuste estacional. La serie de nómina no agrícola es la serie FRED PAYNSA; la serie whole cubierta es la serie BLS ENUUS00010010. NBER definió las fechas de recesión de pico a valle sombreadas en gris. Fuente: BLS.
Tenga en cuenta que la correlación muy alta. Al ejecutar una regresión (hasta 2019), el ajuste estadístico es extremadamente bueno, con R2 ajustado en 0,997.
La constante es bastante pequeña y el coeficiente está cerca (pero significativamente diferente) de la unidad. No obstante, estamos interesados en la predicción, por lo que este punto no es motivo de preocupación. Para protegerme contra la correlación espuria, pruebo la cointegración utilizando el método de máxima verosimilitud de Johansen. Rechazo el nulo de los vectores de cointegración cero (constante, sin tendencia en el vector de cointegración) al 10%.
¿Por qué no estimar sobre la muestra completa, hasta 2022? Esto produce un ajuste igualmente bueno. Sin embargo, una prueba que utiliza residuos recursivos para evaluar rupturas estructurales indica que hay una ruptura en 2020M07, lo que respalda el uso de una muestra que finaliza antes del inicio de la pandemia; esto se muestra en la Figura 2.
Figura 2: Residuos recursivos de la regresión del logaritmo PAYNSA sobre el logaritmo whole del empleo QCEW cubierto. Valores de p en la escala LHS.
- Predicción
Utilizo la ecuación estimada entre 2001 y 2019 para predecir las NFP no ajustadas estacionalmente (PAYNSA). Esto se muestra en la Figura 2.
El ajustado rastrea bastante bien la serie informada. Esto es de esperar ya que la serie BLS se actualiza con referencia utilizando datos QCEW.
Figura 3: Empleo de nómina no agrícola informado, no ajustado estacionalmente (azul), ajustado (marrón). NBER definió las fechas de recesión de pico a valle sombreadas en gris. Período en la muestra sombreado en verde claro. Fuente: BLS, NBER, cálculos del autor.
- Ajuste fuera de muestra
La ecuación utilizada para ajustar el modelo se estima durante un período que finaliza en 2019M12. Eso significa que 2020-2022M06 es el período fuera de la muestra que se puede evaluar (ya que los datos de QCEW finalizan en 2022M06). Estas predicciones se muestran en la Figura 4. El verde indica el período dentro de la muestra.
Figura 4: Empleo de nómina no agrícola informado, no ajustado estacionalmente (azul), ajustado (tostado), intervalo de predicción del 95% (líneas grises). NBER definió las fechas de recesión de pico a valle sombreadas en gris. Período en la muestra sombreado en verde claro. Fuente: BLS, NBER, cálculos del autor.
En un período que abarca el confinamiento por la pandemia, el error medio es de 50 mil (recuerde que el empleo NFP en este momento es de unos 153 millones), máximo 1,9 millones y mínimo -866 mil, desviación estándar de 582 mil.
- Implicaciones para el debate
Curiosamente, en el período posterior a la muestra, el modelo tiende a subestimar el empleo informado en su mayor parte. En otras palabras, si las correlaciones históricas se mantienen, entonces la NFP implícita en realidad debería ser más alta que lo informado. A partir de marzo, el número de NFP debería haber sido mayor en 291 mil; ya junio, el NFP reportado fue de 155 mil por encima de lo previsto, por lo que recién en junio tenemos alguna evidencia de sobreestimación. Si bien las NFP reportadas estuvieron por encima de lo pronosticado, es un número mucho más pequeño que casi 1 millón pronosticado por la Reserva Federal de Filadelfia.
Estas no son collection desestacionalizadas. Para convertir mis valores pronosticados a aquellos compatibles con la serie ajustada estacionalmente referenciada ordinary (PAYEMS), agrego el componente estacional estimado por el BLS (PAYEMS-PAYNSA) a los valores pronosticados que se muestran en la Figura 4. Muestro esta serie implícita y el actual en la figura 5.
Figura 5: Empleo de nómina no agrícola informado, desestacionalizado (azul) y ajustado (bronceado), empleo de nómina no agrícola implícito en la revisión de referencia preliminar (azul claro), todo en 000, sa NBER definió fechas de recesión máxima a mínima sombreadas en gris. Período en la muestra sombreado en verde claro. Construcción de serie de revisión de referencia implícita descrita en este publicar. Fuente: BLS, NBER, cálculos del autor.
El valor ajustado de las NFP ajustadas estacionalmente en realidad está bastante cerca de la revisión de referencia implícita, calculada utilizando las cifras de NFP de marzo, actualizadas utilizando QCEW y otros datos, por lo que esto no es demasiado sorprendente.
Muestro un detalle de los datos más recientes, junto con la serie de investigación BLS que ajusta la serie de empleo civil (encuesta de hogares) al concepto NFP (línea verde), así como el ajuste de los datos QCEW de la Fed de Filadelfia para adaptarse a NFP (cuadrados rojos ), en la figura 6.
Figura 6: Empleo de nómina no agrícola informado, ajustado estacionalmente (azul), ajustado (canela), empleo civil de la serie de investigación BLS ajustado al concepto NFP (verde) y serie de la Fed de Filadelfia (cuadrados rojos), todo en 000, sa NBER definido de pico a valle fechas de recesión sombreadas en gris. Fuente: BLS, Reserva Federal de Filadelfia y cálculos del autor.
Mi cifra de NFP de marzo coincide estrechamente con la serie BLS, tanto nsa como sa (donde he usado los ajustes estacionales de BLS). Mi primera observación es señalar que este es un enfoque rápido y sucio. No es una defensa al por mayor de la serie de referencia sin revisar. Ciertamente, hay razones por las que la serie del establecimiento se descarrila. En su evaluación “holística”, Casa y Pugliese/Wells Fargo destacó el hecho de que el modelo de nacimiento/muerte podría haber estado introduciendo la creación de demasiadas empresas nuevas, elevando así el número de NFP. Sin embargo, estoy rastreando usando QCEW, que no está sujeto a errores de estimación de este tipo.
Mi segunda observación es que el hecho de que la serie de la Fed de Filadelfia implique una NFP mucho más baja no significa que una u otra metodología sea equivocado. Podría significar que los procesos de ajuste estacional están distorsionando los resultados (ya sea del lado del BLS o del lado de la Fed de Filadelfia, recordando cómo están cambiando entre errores geométricos y aditivos), o la forma en que la Fed de Filadelfia reconcilió los datos estatales/sectoriales entre los QCEW y la encuesta del establecimiento impartieron error de medición. El tiempo lo dirá, en este caso. Nunca diría que ignoren la serie de la Fed de Filadelfia; solo considere formas alternativas de ver los datos cuando evalúe la plausibilidad de la serie NFP informada. Ahora, la serie de empleo civil está constantemente por debajo de la serie oficial de BLS. Tal vez resulte que la serie de hogares está dando mejores señales sobre el empleo que el establecimiento y el Censo Trimestral de Empleo y Salarios (recordemos que es un censo), pero esto es un poco difícil de entender para mí, especialmente dada la alta variabilidad de la serie de hogares (ver este gráfico).