por Mauricio González
maurigs at geekmagazine.mx
Meta, la empresa matriz de Facebook, anunció el viernes la introducción de una serie de nuevos modelos de inteligencia artificial desarrollados por su división de investigación. Destaca entre ellos un “evaluador autodidacta” que podría reducir la necesidad de intervención humana en el desarrollo de la inteligencia artificial.
Este lanzamiento sigue a la presentación de la herramienta en un artículo de agosto, donde se explicó que se basa en la técnica de “cadena de pensamiento” empleada por los recientes modelos o1 de OpenAI para realizar evaluaciones precisas de las respuestas generadas por otros modelos. Un paso adelante en la autonomía de las inteligencias artificiales.
La técnica se basa en descomponer problemas complejos en pasos lógicos más manejables, mejorando la precisión de las respuestas en áreas como ciencias, codificación y matemáticas.
Desarrollos innovadores que marcarán el futuro de la inteligencia artificial
Para entrenar el modelo evaluador, los investigadores de Meta usaron exclusivamente datos generados por inteligencia artificial, eliminando la necesidad de intervención humana en esa etapa.
Según explicaron a Reuters dos investigadores de Meta involucrados en el proyecto, la capacidad de la inteligencia artificial para evaluarse a sí misma de manera fiable abre la puerta a crear agentes autónomos que aprendan de sus propios errores. Muchos en el ámbito de la IA anticipan que estos agentes actuarán como asistentes digitales altamente inteligentes, capaces de realizar una amplia gama de tareas sin intervención humana.
Los modelos autoperfeccionados podrían eliminar la necesidad del costoso y a menudo ineficaz proceso actual de aprendizaje por refuerzo con retroalimentación humana, que requiere anotadores expertos para etiquetar datos con precisión y verificar la corrección de respuestas a consultas matemáticas y de escritura complejas.
“La capacidad de aprender y autoevaluarse es esencial para que la IA alcance un nivel sobrehumano.” Otros gigantes como Google y Anthropic también han investigado el concepto de RLAIF (aprendizaje por refuerzo a partir de retroalimentación de IA). Sin embargo, a diferencia de Meta, estas compañías suelen mantener sus modelos en privado.
Entre las herramientas de IA que Meta lanzó el viernes se encuentra una actualización del modelo de identificación de imágenes Segment Anything, una herramienta para acelerar los tiempos de generación de respuestas LLM, y conjuntos de datos destinados a facilitar el descubrimiento de nuevos materiales inorgánicos.