Metadatos

Lo que aprenderás
  1. Qué son los metadatos
  2. Qué pueden revelar los metadatos
  3. Por qué es difícil proteger los metadatos

¿Qué son los metadatos?

Los metadatos son toda la información acerca de los datos, no los datos mismos. La mejor manera de ilustrarlo es con algunos ejemplos.

  1. En el caso de una llamada telefónica, los metadatos incluirán los números telefónicos involucrados, la hora de inicio de la llamada y su duración. En el caso de llamadas por celular, es probable que los metadatos incluyan la ubicación del teléfono (las coordenadas GPS), la torre celular a la que estaba conectado e incluso el tipo de teléfono utilizado. Los metadatos de llamadas telefónicas no incluirían la propia transmisión de audio (esta sería “los datos”). Históricamente, el registro de metadatos de llamadas telefónicas se ha hecho con el objeto de facturar el servicio.
  2. La mayoría de las fotografías digitales modernas incluyen información sobre la hora y lugar en que se tomó la fotografía, el tipo de cámara usado y sus configuraciones. En este caso, la fotografía constituye los datos. Muchos sitios, como Facebook, Twitter e Instagram, eliminan estos metadatos para proteger tu privacidad cuando cargas una fotografía o video. Otros, como Google, Flickr y YouTube, no lo hacen.
  3. Casi todas las impresoras a color modernas, a petición del gobierno de Estados Unidos a los fabricantes y por temor a su uso en la falsificación de dinero, imprimen un código forense en cada página, que podría o no ser visible. En este caso, la hoja de papel (menos el código forense) constituye los datos y la información codificada en el código forense, los metadatos. Se sabe que el código forense, visible o no al ojo humano, puede incluir el día y hora en que se imprimió la hoja, así como el número de serie de la impresora.

La primera revelación de Edward Snowden puso en evidencia que la Agencia de Seguridad Nacional (NSA, por sus siglas en inglés) de Estados Unidos recababa todos los metadatos de las llamadas hechas por clientes de Verizon, lo cual obligó a traer los metadatos a la conversación y a la conciencia pública. El resultado fue un debate sobre la invasión a la privacidad.

Previamente, ese mismo año, Associated Press (AP) se resistió a la entrega de metadatos requerida por medio de una orden judicial del Departamento de Justicia. AP declaró: “Estos registros, que potencialmente contienen comunicaciones con fuentes confidenciales, de todas las actividades periodísticas emprendidas por la AP durante el periodo de dos meses brindan un mapa de las operaciones informativas de la AP y revelan información sobre las actividades y operaciones de dicha organización, las cuales el gobierno no tiene razón concebible alguna para conocer.” Una opinión de la corte señaló que, al recabar datos de GPS a través de dichos metadatos, “se puede deducir si alguien es un feligrés, bebedor empedernido, visitante frecuente del gimnasio, marido infiel o paciente externo recibiendo tratamiento médico, o bien si está asociado con ciertos individuos o grupos políticos.”

En un documento interno, la NSA se ha referido a los metadatos como “una de las herramientas más útiles” de la agencia.

Metadatos e internet

Cuando visitas un sitio web, se envía información entre tu computadora y el servidor del sitio a través de internet. En términos sencillos, se envía un mensaje de tu computadora al servidor solicitando el contenido del sitio, y luego se envía dicho contenido desde el servidor hacia tu computadora. La información enviada a través de internet se conoce como tráfico, y cualquier mensaje enviado se divide en muchos mensajes más pequeños, o paquetes. Cada paquete tiene tres partes principales:

  1. El encabezado incluye la dirección de internet del remitente y del receptor (por ejemplo, tu computadora y el servidor del sitio) y una descripción del tipo de datos que se envía (por ejemplo, HTML).
  2. Los datos son el contenido del mensaje (por ejemplo, el contenido de la página web o parte de la página web).
  3. El trailer o pie de página señala el final del paquete y proporciona prueba de que este no ha sido corrompido en tránsito (con una función hash).

Los metadatos se componen del encabezado y el pie de página. Es difícil proteger u ocultar el encabezado puesto que indica a dónde debe enviarse un paquete. Al igual que en una carta, es necesaria una dirección de entrega. Tu dirección de internet, o dirección IP, está vinculada con tu ubicación física; de hecho, es frecuente que tu ubicación física pueda determinarse a partir de tu IP.

Esta descripción es válida para cualquier información enviada a través de internet, incluyendo correos electrónicos, transmisión de video en directo (streaming), llamadas VOIP y mensajes instantáneos.

En contexto: Proteger a un denunciante

En mayo de 2017, Reality Winner reveló documentos de la NSA para reportar la interferencia de Rusia en las elecciones presidenciales de 2016 en Estados Unidos. Su arresto, días antes de que la historia fuera publicada, causó mucha especulación sobre cómo fue identificada tan rápidamente como la denunciante. Muchos señalaron al sitio Intercept debido a su manejo de la historia.

Reality Winner había enviado de forma anónima a Intercept una impresión a color de los documentos. Como es práctica común en el periodismo, Intercept envió una fotografía de los documentos a la NSA para su verificación. Asimismo, tacharon algunas cosas en la fotografía y la publicaron en su informe. Poco después de la publicación de la historia, varias personas señalaron que el código forense de la impresora era visible en la fotografía y mostraba el día y hora en que se imprimió el documento, así como el número de serie de la impresora. Aunque es posible que el FBI haya identificado a Reality Winner a partir de esta información (para proteger a su fuente, Intercept debió haber ocultado el código forense de la fotografía), es más probable que la hayan delatado los registros de acceso a los documentos en su computadora de trabajo.

Qué aprender a continuación

External Resources

Licencia

Icono de Licencia Creative Commons Atribución-NoComercial 4.0 Internacional

A la defensa del disenso Copyright © 2021 por Glencora Borradaile se distribuye bajo una Licencia Creative Commons Atribución-NoComercial 4.0 Internacional, excepto cuando se especifiquen otros términos.