Rodrigo Díaz M.
Meta, propietaria de Facebook, anunció la publicación de un lote de nuevos modelos de inteligencia artificial de su división de investigación que pueden ofrecer una vía hacia una menor participación humana en el proceso de desarrollo de la inteligencia artificial.
El lanzamiento se produce después de que Meta presentara la herramienta en un artículo publicado en agosto, en el que detallaba cómo se basa en la misma técnica de “cadena de pensamiento” utilizada por los modelos de OpenAI, recientemente publicados, para emitir juicios fiables sobre las respuestas de los modelos.
Esta técnica consiste en dividir problemas complejos en pasos lógicos más pequeños y parece mejorar la precisión de las respuestas a problemas complejos en materias como ciencias, codificación y matemáticas.
Los investigadores de Meta utilizaron datos generados íntegramente por la IA para entrenar el modelo evaluador, eliminando también la intervención humana en esa fase.
La capacidad de utilizar la IA para evaluar la inteligencia artificial de forma fiable permite vislumbrar un posible camino hacia la creación de agentes de inteligencia artificial autónomos capaces de aprender de sus propios errores.
Muchos en el campo de la IA imaginan este tipo de agentes como asistentes digitales lo suficientemente inteligentes como para llevar a cabo una amplia gama de tareas sin intervención humana.
Los modelos autoperfeccionados podrían eliminar la necesidad de un proceso a menudo caro e ineficaz que se utiliza hoy en día, denominado aprendizaje por refuerzo a partir de la retroalimentación humana, que requiere la aportación de anotadores humanos que deben tener conocimientos especializados para etiquetar los datos con precisión y verificar que las respuestas a complejas consultas matemáticas y de escritura son correctas.
Otras empresas, como Google y Anthropic, también han publicado investigaciones sobre el concepto de RLAIF (Aprendizaje por refuerzo a partir de los comentarios de la IA). Sin embargo, a diferencia de Meta, estas empresas no suelen hacer públicos sus modelos.
Otras herramientas de IA publicadas por Meta incluyen una actualización del modelo de identificación de imágenes Segment Anything, una herramienta que acelera los tiempos de generación de respuestas LLM y conjuntos de datos que pueden utilizarse para ayudar al descubrimiento de nuevos materiales inorgánicos.