OpenAI entrenó con éxito un bot de Minecraft utilizando 70.000 horas de gameplay

Jesús Sánchez, 29 noviembre 2022

Ya ha comenzado las ofertas del 14 Aniversario de AliExpress. El segundo evento de ventas más importante del año con muchos descuentos y cupones. Ofertas de hasta el 70% en los mejores productos y códigos de descuento:

  • ESAN05 y KODl05: 5€ de descuento con EUR39 de compra mínima
  • ESAN10 y KODl10: 8€ de descuento con EUR79 de compra mínima
  • ESAN20 y KODl20: 20€ de descuento con EUR159 de compra mínima
  • ESAN40 y KODl40: 40€ de descuento con EUR299 de compra mínima
  • ESAN80 y KODl80: 80€ de descuento con EUR499 de compra mínima

Ver las mejores ofertas

Es posible que no pienses en Minecraft como una herramienta de investigación de IA. ¿Por qué es tan importante instruir a una máquina sobre cómo jugar a un juego sandbox obsoleto? Una investigación reciente realizada por OpenAI sugiere que un bot de Minecraft bien entrenado puede contribuir al avance de la inteligencia artificial.


El objetivo principal de OpenAI ha sido el desarrollo de tecnologías de IA y ML que sean útiles para la humanidad. Se enseñó a un ordenador utilizando más de 71.000 horas de vídeo de personas jugando al juego Minecraft. No es sólo un programa informático que intenta ganar un juego. Fomenta el proceso de aprendizaje automático mediante el uso de la observación y la imitación.

El bot de OpenAI muestra el aprendizaje por imitación en acción (o “aprendizaje supervisado”). A diferencia del aprendizaje por refuerzo, el aprendizaje por imitación consiste en entrenar redes neuronales viendo a personas que realizan diversas tareas. OpenAI utilizó imágenes e instrucciones de juegos para enseñar a su máquina complejas secuencias de juego que necesitarían 24.000 acciones de un humano para realizarlas por sí mismo.

El uso de entradas de vídeo etiquetadas para dar contexto a las acciones y sus resultados es necesario para el aprendizaje por imitación. Esta estrategia, que requiere mucho trabajo manual, restringe los conjuntos de datos disponibles. El aprendizaje por observación del agente se ve obstaculizado por la ausencia de conjuntos de datos.

El equipo de investigación de OpenAI utilizó el preentrenamiento en vídeo (VPT) para aumentar significativamente la cantidad de vídeos etiquetados. Para entrenar a un agente, los investigadores recopilaron 2.000 horas de juego de Minecraft anotadas. El modelo resultante se aplicó para clasificar automáticamente 70.000 horas de material online de Minecraft, esto proporcionó al bot un conjunto de datos más amplio para estudiar y replicar.

El experimento demuestra que YouTube es un recurso valioso para la formación de la IA. El entrenamiento de la IA para realizar actividades específicas, como la navegación por la web y la asistencia física, podría llevarse a cabo mediante el uso de películas que hayan sido debidamente clasificadas por los científicos.

Jesús Sánchez

Redactor

Entusiasta del mundo del audio y la imagen. Con un agudo oído para la calidad del sonido y un buen ojo para la excelencia visual, desentraño la magia que se esconde tras los últimos gadgets de audio y las tecnologías de televisión más punteras. Acompáñame en un viaje para mejorar tu entretenimiento.

Consentimiento