Implicaciones del Reglamento General de Protección de Datos (RGPD) en la organización de las tareas de análisis de datos masivos (BigData)
La empresas que se dedican al análisis de datos (Big Data Analytics) y la generación de inteligencia a partir de fuentes abiertas (OSINT) como las redes sociales, tienen que considerar tanto los aspectos éticos como los legales que llevan implícitos.
En Autoritas colaboramos en trabajos de investigación para facilitar la organización de tareas internacionales de evaluación de sistemas de Inteligencia Artificial aplicados al ámbito del procesamiento del lenguaje natural, principalmente al perfilado de autores (author profiling), es decir la detección automática de ciertas características de los autores.
Recientemente hemos analizado las implicaciones del RGPD en la organización de estas tareas proponiendo un método para el seguimiento riguroso de todas sus indicaciones, así como las de las redes sociales de donde recopilamos la información. El objetivo es el respeto escrupuloso del marco de la ética y de la legalidad, como es el control de acceso a los datos, la privacidad, la finalidad científica desvinculada de marcas comerciales, etc.
El principio de responsabilidad proactiva de GDPR supone que el organizador de la tarea de evaluación de datos, aplica medidas técnicas y organizativas para garantizar y demostrar que su tratamiento es conforme al Reglamento. Por lo tanto, el primer paso es identificar y demostrar el consentimiento del sujeto. Se presta especial atención cuando se trate de casos especiales como, menores, y categorías especiales de datos como las de opciones políticas, religiosas, de orientación sexual, etc., o el tratamiento que implique el profiling automático. Además, el organizador debe aplicar medidas técnicas y organizativas como minimizar datos, encriptación, seudonimización, etc. para impedir la identificación de personas. Por último, el organizador debe distribuir los datos de acuerdo con los criterios y normas de la plataforma social y el derecho de supresión y de registrar todas las actividades de tratamiento realizadas con los datos incluyendo a quién se da acceso a los datos, así como para informar que la única finalidad permitida es investigación científica no comercial.
El artículo al que nos referimos se ha publicado en la revista Law and Linguistics, en un Special Issue sobre lingüística forense:
On the Implications of the General Data Protection Regulation on the Organisation of Evaluation Tasks. Francisco Rangel & Paolo Rosso