Facephi lidera la competición de reconocimiento facial en la era de los datos sintéticos (FRCSyn)

Face-recognition-challenge

Los avances recientes en los modelos de reconocimiento facial se han logrado gracias a la disponibilidad de grandes conjuntos de datos y modelos de aprendizaje profundo. Sin embargo, la recopilación de datos a gran escala realizada a través de internet plantea problemas legales, éticos y de privacidad. De esta forma, se valoran métodos alternativos como generar conjuntos de datos de rostros sintéticos y utilizar imágenes sintéticas para entrenar modelos de reconocimiento facial. No obstante, la generación de conjuntos de datos sintéticos con suficientes variaciones sigue siendo un área de investigación activa. 

Este planteamiento se ha llevado a cabo en el Winter Conference on Applications of Computer Vision (WACV) organizando un reto de Reconocimiento Facial en la Era de los Datos Sintéticos (FRCSyn). Se trata del primer reto internacional cuyo objetivo es explorar el uso de datos sintéticos en el reconocimiento facial para abordar las limitaciones existentes en la tecnología. En concreto, el FRCSyn Challenge aborda cuestiones relacionadas con la privacidad de los datos, los sesgos demográficos y las limitaciones de rendimiento en escenarios complicados (disparidades significativas de edad, variaciones de pose y oclusiones). Los resultados logrados en el FRCSyn Challenge contribuyen significativamente a la aplicación de datos sintéticos para mejorar la tecnología de reconocimiento facial. Los participantes desarrollaron y aplicaron estrategias inteligentes para utilizar conjuntos de datos sintéticos en el entrenamiento de modelos de reconocimiento facial. Todos los modelos enviados por los participantes fueron evaluados utilizando conjuntos de datos de referencia y clasificados según su rendimiento en estos conjuntos de datos. 

El potencial de los datos sintéticos en la verificación de identidad: resultados de Facephi 

En Facephi participamos en el FRCSyn Challenge para probar si los datos sintéticos podían sustituir a los datos reales en el entrenamiento de reconocimiento facial, si podían mitigar las limitaciones conocidas de la biometría facial y los desafíos éticos y legales asociados con la recopilación de datos a gran escala. Para ello se utilizan las más actuales arquitecturas de redes neuronales, y diversas técnicas de aumento de datos. 

Nuestro éxito se ha visto reflejado en los resultados, destacando frente al resto de los participantes y demostrando un desempeño excepcional en la primera tarea de calidad del conjunto de datos sintetizados. A la hora de valorar la capacidad para mitigar el sesgo y adaptarse a diferentes bases de datos, conseguimos, a través de la utilizaron datos sintéticos para entrenar los sistemas FR, ser de los mejores en mitigación y reducción del sesgo. Además, en la segunda tarea del concurso, que ofrecía libertad en la elección del modelo, conjunto de datos y entrenamiento, también demostramos resultados competitivos al demostrar la versatilidad y eficacia de nuestro enfoque en diferentes escenarios. Los jueces y expertos elogiaron la originalidad y la calidad de los métodos utilizados, reconociendo nuestro enfoque innovador y la contribución significativa al avance de la investigación en la generación de conjuntos de datos sintéticos para el reconocimiento facial.