Que es la anonimización de datos

Índice del artículo

¿Qué es el anonimato de datos?

La anonimización de datos es el proceso de proteger información privada o confidencial borrando o encriptando identificadores que conectan a una persona con los datos almacenados. Por ejemplo, puede ejecutar información de identificación personal (PII) como nombres, números de seguridad social y direcciones a través de un proceso de anonimización de datos que retiene los datos pero mantiene la fuente en el anonimato.

Sin embargo, incluso cuando borra los datos de los identificadores, los atacantes pueden usar métodos de anonimización para rastrear el proceso de anonimización de datos. Dado que los datos generalmente pasan a través de múltiples fuentes, algunas disponibles para el público, las técnicas de anonimización pueden hacer referencias cruzadas a las fuentes y revelar información personal.

El Reglamento general de protección de datos (GDPR) describe un conjunto específico de reglas que protegen los datos del usuario y crean transparencia. Si bien el RGPD es estricto, permite a las empresas recopilar datos anónimos sin consentimiento, usarlos para cualquier propósito y almacenarlos por tiempo indefinido, siempre que las empresas eliminen todos los identificadores de los datos.

Técnicas de anonimización de datos

  • Enmascaramiento de datos: ocultar datos con valores alterados. Puede crear una versión reflejada de una base de datos y aplicar técnicas de modificación como la mezcla de caracteres, el cifrado y la sustitución de palabras o caracteres. Por ejemplo, puede reemplazar un carácter de valor con un símbolo como “*” o “x”. El enmascaramiento de datos imposibilita la ingeniería inversa o la detección.
  • Seudonimización: un método de gestión de datos y desidentificación que reemplaza los identificadores privados con identificadores falsos o seudónimos, por ejemplo, reemplazando el identificador “John Smith” por “Mark Spencer”. La seudonimización preserva la precisión estadística y la integridad de los datos, lo que permite que los datos modificados se utilicen para capacitación, desarrollo, pruebas y análisis mientras se protege la privacidad de los datos .
  • Generalización : elimina deliberadamente algunos de los datos para que sean menos identificables. Los datos se pueden modificar en un conjunto de rangos o en un área amplia con límites apropiados. Puede eliminar el número de casa en una dirección, pero asegúrese de no eliminar el nombre de la carretera. El propósito es eliminar algunos de los identificadores conservando una medida de precisión de los datos.
  • Intercambio de datos: también conocido como mezcla y permutación, una técnica que se utiliza para reorganizar los valores de los atributos del conjunto de datos para que no se correspondan con los registros originales. El intercambio de atributos (columnas) que contienen valores identificadores como la fecha de nacimiento, por ejemplo, puede tener más impacto en la anonimización que los valores del tipo de membresía.
  • Perturbación de datos: modifica ligeramente el conjunto de datos original mediante la aplicación de técnicas que redondean números y agregan ruido aleatorio. El rango de valores debe ser proporcional a la perturbación. Una base pequeña puede llevar a un anonimato débil, mientras que una base grande puede reducir la utilidad del conjunto de datos. Por ejemplo, puede usar una base de 5 para redondear valores como la edad o el número de casa porque es proporcional al valor original. Puede multiplicar el número de una casa por 15 y el valor puede conservar su credibilidad. Sin embargo, el uso de bases más altas como 15 puede hacer que los valores de edad parezcan falsos.
  • Datos sintéticos: información elaborada algorítmicamente que no tiene conexión con eventos reales. Los datos sintéticos se utilizan para crear conjuntos de datos artificiales en lugar de alterar el conjunto de datos original o usarlo como está y poner en riesgo la privacidad y la seguridad. El proceso implica la creación de modelos estadísticos basados ​​en patrones encontrados en el conjunto de datos original. Puede utilizar desviaciones estándar, medianas, regresión lineal u otras técnicas estadísticas para generar los datos sintéticos.

Desventajas de la anonimización de datos

El GDPR estipula que los sitios web deben obtener el consentimiento de los usuarios para recopilar información personal, como direcciones IP, ID de dispositivo y cookies. La recopilación de datos anónimos y la eliminación de identificadores de la base de datos limitan su capacidad para obtener valor y conocimiento de sus datos. Por ejemplo, los datos anónimos no se pueden utilizar para esfuerzos de marketing o para personalizar la experiencia del usuario.

Categorías PC

Artículos sobre Ordenadores y computadoreas relacionados:

¿A lo mejor tienes una duda acerca de esta temática?

Entonces tienes diferentes artículos relacionados con referencias sobre este tema. En Eboogle trabajamos cada día para traerte la mejor información y los mejores tutoriales para ayudarte.

Si te ha servido puedes compartir en tus redes sociales, de esta manera más gente pueda resolver sus dudas sobre el funcionamiento de tu PC.

Deja un comentario