Facebook se ha puesto como objetivo mejorar el arte del reconocimiento de imágenes. Para conseguirlo, la compañía de Mark Zuckerberg ha utilizado miles de fotografías añadidas por los usuarios de Instagram. Así lo ha anunciado Facebook en su conferencia anual F8, desvelando una nueva inteligencia artificial que se entrena reconociendo enormes cantidades de fotografías públicas de Instagram, otorgando mejores resultados que la forma tradicional.
Según la compañía, este nuevo enfoque, entrenado en mil millones de imágenes, logró una tasa de precisión en ImageNet1K, una herramienta típica de evaluación de reconocmiento de imágenes, del 85,4%, la tasa más alta jamás obtenida. En un conjunto más amplio, de 3.500 millones de imágenes, pero con un modelo más pequeño, se obtuvo una tasa del 84,1%. Este trabajo supero a su generación anterior, que utilizaba datos supervisados y etiquetados a mano, en un 2%, según FastCompany.com.
Estos esfuerzos son de vital importancia para Facebook, pues podría identificar automáticamente contenido o generar subtítulos de audio para personas con discapacidad visual de una forma mucho más precisa. La industria de la IA se ha sustentado durante mucho tiempo en el etiquetado manual de datos y modelos de captación de decenas de millones de imágenes. Pero la mayor precisión se basa en escalar esos modelos a miles de millones de imágenes, algo que esencialmente no es posible si el etiquetado se realiza manualmente.
Pero Facebook se dio cuenta de que ya tenía un repositorio público de imágenes etiquetadas en sus manos: Instagram. Las fotografías de la app tienen hashtags, a menudo múltiples etiquetas, lo que aumenta la cantidad de información útil. “Dado que los usuarios de Instagram a menudo subtitulan sus fotos con hashtags para prácticamente cualquier cosa imaginable en el mundo visual”, señaló la compañía, “creíamos que sería una fuente ideal de datos de capacitación para los modelos. También nos permitió utilizar hashtags para hacer que las imágenes sean más accesibles”.
Pero muchas de estas etiquetas son imprecisos o poco específicos, generando ruidos que debían eliminarse. Además, respecto a los problemas de privacidad y seguridad, Manohar Paluri, quien lidera el equipo de Applied, señaló que los investigadores tenían mucho cuidado de trabajar solo con los datos públicos, además de no publicar el conjunto de datos. Según Paluri, el equipo se aseguró de que, si los usuarios borraban alguna foto, también se eliminara del proceso. También afirman que abrirán algunos de sus trabajos en este área para que puedan ser aprovechados por toda la comunidad investigadora.
No hay comentarios:
Publicar un comentario