Facebook acaba de poner en GitHub todo el código de Horizon, su plataforma de aprendizaje por refuerzo. Este sistema ya se venía usando en M (el asistente virtual de Messenger), la optimización de la calidad de los vídeos o la mejora de las notificaciones de la red social. Facebook ha sido históricamente un defensor del código abierto y del intercambio de conocimiento técnico en muchas lides, incluso en algo tan estratégico como sus centros de datos. Sin embargo, hasta ahora había protegido cual oro a Horizon, su plataforma de aprendizaje por refuerzo (usando el ensayo y error, junto a recompensas y la minimización de pérdidas, en lugar del entrenamiento mediante conjuntos de datos etiquetados). No es de extrañar: es un pilar fundamental para que su inteligencia artificial se vuelva cada vez más inteligente, valga la redundancia.
Facebook ha utilizado Horizon para un sinfín de aplicaciones, incluyendo M (el asistente virtual de Messenger), la personalización de las sugerencias que se muestran a los usuarios, la optimización de la calidad de los vídeos -teniendo en cuenta el ancho de banda disponible y cuánto del vídeo ya se ha cargado- o la mejora de las notificaciones de la red social.
“Aprovechamos la plataforma Horizon para descubrir nuevas técnicas en aprendizaje por refuerzo basado en modelos y la configuración de recompensas, y utilizamos la plataforma para explorar una amplia gama de aplicaciones adicionales en Facebook (…) Horizon podría transformar la forma en que los ingenieros y los modelos de machine learning trabajan juntos“, explica la compañía en su blog.
Pues bien, eso ha cambiado en el día de hoy, ya que Facebook acaba de poner en GitHub todo el código de esta plataforma, basada a su vez en varios marcos de código abierto como PyTorch 1.0, Caffe2 y Spark.
Según la publicación corporativa, Horizon admite diferentes algoritmos, incluidos los modelos Deep Q-Network (DQN), DQN paramétrico y gradiente de política determinista (DDPG). Además, la compañía planea agregar nuevos modelos y varias mejoras, y espera ver qué puede hacer para tratar con conjuntos de datos masivos.
Con este paso, Facebook sigue el camino hacia el código abierto que ya han llevado a cabo los equipos de IA DeepMind y GoogleBrain de Alphabet/Google y OpenAI, que hace poco pusieron sus respectivos algoritmos de aprendizaje por refuerzo, herramientas de programación y entornos de prueba a disposición del público.
Escrito por
No hay comentarios:
Publicar un comentario