El censo publica pautas para una controvertida herramienta de privacidad


Mantenga sus calculadoras, estadísticos

ORLANDO, Fla. – ¡Guarden sus calculadoras, estadísticos!

Después de tres años de feroces debates, artículos académicos conflictivos y una demanda, la Oficina del Censo de Estados Unidos anunció el miércoles pautas sobre cómo se aplicará un método estadístico controvertido a los números utilizados para trazar distritos legislativos y del Congreso. El método está destinado a proteger la privacidad de las personas que participaron en el censo de 2020, aunque los críticos han afirmado que favorece la confidencialidad a expensas de cifras precisas.

El método de privacidad agrega “ruido” controlado, o errores intencionales, a los datos para ocultar la identidad de cualquier participante dado en el censo de 2020, al mismo tiempo que proporciona información estadísticamente válida. Las pautas finales anunciadas por la Oficina del Censo pesan más a favor de la precisión que de la privacidad en comparación con versiones de prueba anteriores publicadas por la agencia de estadística que las partes interesadas han estado evaluando.

El debate sobre el método conocido como privacidad diferencial ha resultado en una especie de pelea nerd entre estadísticos, demógrafos y los expertos en redistribución de distritos que discutieron sobre si su aplicación inutilizaría los números utilizados para rediseñar los distritos legislativos y del Congreso. La publicación de las pautas específicas podría intensificar aún más el debate en curso sobre la precisión de las cifras recopiladas durante un recuento nacional que tuvo lugar en medio de una pandemia mundial y un clima político ya sobrecargado.

Si imagina la herramienta de privacidad como un dial con configuraciones más bajas que ofrecen la mayor privacidad y configuraciones más altas que brindan la mayor precisión, la Oficina del Censo marcó la precisión en las pautas finales. El término estadístico para este dial es “épsilon”, y la oficina se decidió por un épsilon de 19,61, significativamente más alto que donde se colocó el dial en versiones anteriores por las que los críticos expresaron su preocupación.

“Las decisiones logran el mejor equilibrio entre la necesidad de publicar estadísticas detalladas y utilizables del Censo de 2020 con nuestra responsabilidad legal de proteger la privacidad de los datos de las personas”, dijo Ron Jarmin, director interino de la Oficina del Censo. “Fueron hechos después de muchos años de investigación y comentarios sinceros de usuarios de datos y expertos externos, a quienes agradecemos su invaluable contribución”.

El demógrafo de la Universidad de Minnesota Steven Ruggles, quien había expresado su preocupación por la precisión de las versiones anteriores, dijo el miércoles que el épsilon en las pautas finales es ahora tan alto que no ofrecerá mucha protección a la privacidad.

“Los inventores de la privacidad diferencial consideran inútil una épsilon tan alta”, dijo Ruggles.

El estado de Alabama demandó en un esfuerzo por evitar que se use la privacidad diferencial en los datos de redistribución de distritos, alegando que produciría números inexactos, y un panel de tres jueces podría tomar una decisión en cualquier momento.

La Oficina del Censo dice que se necesitan más protecciones de privacidad que en décadas pasadas, ya que las innovaciones tecnológicas magnifican la amenaza de que las personas sean identificadas a través de sus respuestas del censo, que son confidenciales por ley. El poder de la computación es ahora tan vasto que puede procesar fácilmente conjuntos de datos de terceros que combinan información personal de calificaciones crediticias y compañías de redes sociales, registros de compras, patrones de votación y documentos públicos, entre otras cosas.

Se espera que los datos de la redistribución de distritos se publiquen a mediados de agosto. En septiembre, la Oficina del Censo dará a conocer datos de prueba del censo de 2010 con privacidad diferencial aplicada utilizando las pautas finales para que los investigadores puedan examinar su precisión.

Los investigadores de la Universidad de Princeton, Ari Goldbloom-Helzner y Sam Wang, dijeron el miércoles en un correo electrónico que la Oficina del Censo estaba respondiendo a las preocupaciones planteadas y la precisión de los objetivos en jurisdicciones más pequeñas. Al estudiar una versión anterior con mayores restricciones de privacidad, los dos investigadores habían dicho anteriormente que la aplicación de la privacidad diferencial no tenía un impacto práctico en la redistribución de los datos.

“En este punto, mi equipo confía en que los datos se ajustarán completamente para la redistribución de distritos”, dijo Wang.

———

.



Source link