Generación de datos sintéticos usando Redes Generativas Adversariales para la minería de datos respetuosa de la privacidad
Disciplina académico-profesional: Informática con mención en Ciencias de la Computación


- Autor(es): Montalvo García, Peter Jonathan
- Asesor(es): Alatrista Salas, Hugo
- Fecha: 28-may-2021
- Institución: Pontificia Universidad Católica del Perú
- Jurado: Alatrista Salas, Hugo; Maldonado Cadenillas, Rodrigo Ricardo; Gomez Montoya, Hector Erasmo
- Disciplina académico-profesional: Informática con mención en Ciencias de la Computación
- Grado o título: Magíster en Informática con mención en Ciencias de la Computación
- Institución que otorga el grado o título: Pontificia Universidad Católica del Perú. Escuela de Posgrado.
- Fecha de registro: 28-may-2021
Resumen de la Tesis
La minería de datos permite conocer patrones en grandes volúmenes de datos; pero dentro de estos datos puede haber información sensible que compromete la privacidad. En tal sentido, se han desarrollado técnicas para la minería de datos respetuosa de la privacidad, siendo la más utilizada la privacidad diferencial debido a las propiedades que otorga a los datos resultantes, de la mano de técnicas de aprendizaje profundo. Estas técnicas se han utilizado en conjuntos de datos de números escritos e imágenes, pero no en datos de georreferenciación. El presente trabajo tiene como objetivo medir la eficacia de los datos sintéticos generados a través redes generativas adversariales y privacidad diferencial en datos de georreferenciación. La generación de estos datos se hace a través de selección de datos, sanitización para la obtención de la base de datos sintéticos y evaluación a través de modelos de movilidad a partir de las trazas que sirven para medir la pérdida de información y el riesgo de divulgación. En líneas generales, los resultados demuestran que la aplicación de estas técnicas sobre datos de georreferencia da como producto un conjunto de datos sintéticos con una pérdida de información y riesgo de divulgación bajos, y se concluye que estos conjuntos de datos obtenido se puede realizar una minería de datos similar a la que se haría con los datos originales y sin comprometer información sensible.
Descargar o Leer tesis en PDF
Realizar una Tesis en Perú
Muchos estudiantes en las etapas finales de su ciclo universitario o preparándose para obtener un título profesional o maestría, necesitan buscar información valiosa para completar su trabajo, por lo que recurren a los diferentes repositorios que existen en la internet.
En Tesis del Perú, los estudiantes pueden encontrar tesis de la Pontificia Universidad Católica del Perú, para que puedan obtener orientación para que puedan crear sus tesis.
Sabemos que realizar un trabajo de tesis es una investigación exhaustiva y profunda acerca de un tema. Generalmente, uno no sabe por dónde empezar o no tiene idea cómo organizar cada información dentro del trabajo. Recolectamos tesis de los diferentes repositorios del Perú, esto con la finalidad de brindarles ayuda a la hora de crear sus tesis.
Aquí podrás descargar para leer online la tesis Generación de datos sintéticos usando Redes Generativas Adversariales para la minería de datos respetuosa de la privacidad en formato PDF, este y todas las tesis de pregrado y postgrado que publicamos, están 100% actualizado (de los diferentes repositorios de tesis en Perú).
¿Sabías qué? Renati y demás repositorio son herramientas virtuales que tienen como objetivo almacenar y difundir, a través de sus sitios, las tesis de pregrado y postgrado de los alumnos y docentes de las diferentes universidades del Perú..
¿Cuatro puntos importantes para elaborar una tesis con éxito?
Estos cuatro puntos son fundamentales para elaborar la tesis, así que presta atención para que puedas elaborar tu investigación con mucho éxito.
- Título: Tiene que ser un texto que resuma el tema que se busca investigar. Busca que sea concreto, acotado y con un alto nivel de claridad.
- Problema: Ya con el título, debes colocar un apartado donde se indique cuál es el problema a evaluar o tratar, esto tiene que estar vinculado con el tema central. Ten en cuenta que a la hora de plantear el problema, es práctico recordar que si no existe problema no hay necesidad de estudio.
- Hipótesis: En la hipótesis tenemos que plantear, a través de uno o más argumentos, aquello que consideras que supone el problema de tu investigación.
- Metodología: Cuando menciones la metodología debes dejar en claro cuáles son las herramientas a las que recurrirás. ¿Realizarás encuestas? ¿Recurrirás a material bibliográfico? Identifica cuántas y cuáles son.
¿Cuáles son las partes de una tesis?
- Concebir la idea de investigación
- Planteamiento del problema
- Marco Contextual
- Marco teórico
- Definición del tipo de investigación
- Formulación de la hipótesis
- Diseño de la investigación
- Selección de la muestra
- Recolección de datos
- Análisis de los datos
- Elaboración del reporte de investigación
- Recomendaciones generales
Recomendaciones para descargar la tesis Generación de datos sintéticos usando Redes Generativas Adversariales para la minería de datos respetuosa de la privacidad
- Varios de las tesis para descargar pesan bastantes MB, por o tanto puede tardar en descargar, todo dependerá de tu conexión a internet.
- Para descargar la tesis Generación de datos sintéticos usando Redes Generativas Adversariales para la minería de datos respetuosa de la privacidad, haga click derecho en los enlaces que verá a continuación y seleccione «Guardar enlace como…», o bien haga click izquierdo para visualizar directamente el PDF en tu navegador web.
Tesis: Generación de datos sintéticos usando Redes Generativas Adversariales para la minería de datos respetuosa de la privacidad en formato PDF
Haga click en el siguiente botón para poder descargar la tesis de la Pontificia Universidad Católica del Perú en formato PDF:
- Acceso cerrado
- Enlace al repositorio: http://hdl.handle.net/20.500.12404/19255
- Campo OCDE: http://purl.org/pe-repo/ocde/ford#1.02.00
- Palabras clave: Redes neuronales (Computación) Minería de datos Protección de datos