La principal diferencia entre AutoGPT y los chatbots impulsados por IA que se lanzaron recientemente es que AutoGPT no necesita mucha intervención humana. Mientras que herramientas como ChatGPT y el nuevo Bing de Microsoft requieren sugerencias de personas, esta es capaz de investigar por sí sola, aprender de sus errores y adaptar su carga de trabajo en consecuencia. No hace falta decir que promete ser considerablemente más rápido y funcionar con más eficacia que cualquier cerebro humano.
Cuando a un ser humano se le asigna una tarea, la ejecución se lleva a cabo a través de una serie de pasos. Este tipo de proceso se aplica mediante una nueva serie de aplicaciones basadas en inteligencia artificial. Estos sistemas, que son de código abierto y están disponibles casi exclusivamente en forma de código en GitHub, están basados en el modelo GPT-4. El más conocido es AutoGPT, un software que permite crear agentes autónomos basados en IA, capaces de llegar a una solución a través de una serie de pasos, como buscar en la web o ejecutar código.
Cada generación de GPT se puede comparar con una idea
Andrej Karpathy, uno de los miembros fundadores de OpenAI, intenta explicar el concepto de GPT con una analogía en un hilo de Twitter: “Cada generación de GPT puede compararse con un pensamiento; si estos están conectados y enlazados, es posible crear agentes capaces de actuar de forma autónoma con base en un objetivo definido”.
AutoGPT es un software basado en las versiones 4 y 3.5 de GPT, que se utiliza para interpretar los objetivos del usuario, establecer un curso de acción y crear instrucciones intermedias. Está equipado con una memoria a medio-largo plazo, lo que le permite recordar los pasos del razonamiento, y puede acceder a la web, así como a los archivos y todo lo que el usuario ponga a su disposición. Es similar a los complementos de ChatGPT, pero en este caso, es la inteligencia artificial la que decide de forma independiente qué sistemas consultar.
Ya hay muchas versiones disponibles, aunque por ahora están destinadas a los desarrolladores. Además de AutoGPT, existen Baby Agi y Jarvis, de Microsoft. También hay una primera variante abierta al público en general: se llama Agente GPT y se accede desde un navegador, aunque por el momento las funciones más avanzadas están reservadas para quienes están suscritos a la API de OpenAI.
El sistema todavía se encuentra en una fase embrionaria y probablemente aún esté lejos de ser un recurso de automatización para el público en general.
¿Cómo funciona AutoGPT?
Hay cuatro elementos principales que hacen a AutoGPT eficiente y productivo:
- El modelo lingüístico: Emplea GPT-4, la última generación de la tecnología GPT de OpenAI lanzada a mediados de marzo de este año. Esta es la parte que le ayuda a “pensar”.
- Iteraciones autónomas: Está programado para corregir cualquier error y luego aprender de ellos, lo que lo hace más autónomo.
- Almacenamiento de memoria: Se ha integrado con bases de datos vectoriales que permiten almacenar información y mejorar la toma de decisiones en el futuro.
- Multifuncionalidad: Es capaz de navegar por la red en unos instantes, recuperar y almacenar datos y, si es necesario, modificar archivos de datos.
AutoGPT combina GPT-3.5 y GPT-4 a través de la API, lo que permite crear proyectos que se iteran según sus propias instrucciones y revisar cada iteración para mejorarla y trabajar en ella.
Para que AutoGPT funcione, requiere:
- Nombre de la IA.
- Rol de la IA.
- Objetivos (hasta cinco).
Por ejemplo:
- Nombre: Driver-GPT.
- Rol: una inteligencia artificial diseñada para encontrar un curso de conducción deportiva.
- Objetivo 1: Encontrar un curso de conducción sencillo.
- Objetivo 2: Avanzar a un grado superior de conducción deportiva.
Una vez que AutoGPT tiene la descripción y los objetivos, comienza a funcionar hasta que el proyecto alcanza un nivel satisfactorio.
¿Qué hay de nuevo en AutoGPT? En primer lugar, es importante tener en cuenta que GPT es capaz de escribir su propio código con GPT-4; además, GPT ejecuta scripts de Python que le permiten depurar, desarrollar, compilar y mejorar automáticamente de forma recursiva.
AutoGPT es una inteligencia artificial que se mejora a sí misma y demuestra las capacidades de la Inteligencia Artificial General (AGI, por sus siglas en inglés).
El circuito de retroalimentación de AutoGPT funciona de la siguiente manera:
- Piensa.
- Critica.
- Escribe.
- Lee los comentarios.
- Vuelve a empezar.
AutoGPT lee y escribe varios archivos, navega por la web, y revisa constantemente sus sugerencias para asegurarse de que el proyecto es lo que el usuario quiere. Le fijamos un objetivo, recorre la web en busca de la mejor información disponible, y luego realiza la tarea por nosotros de forma independiente, sin dejar de mejorar constantemente.
AutoGPT solicita autorización después de cada solicitud, para garantizar que el proyecto avance en la dirección correcta.
Cómo usar AutoGPT
Para utilizar AutoGPT, se deben usar los créditos de la cuenta de OpenAI. Sin embargo, podés usar hasta 18 dólares incluidos en la versión gratuita.
Como se mencionó antes, AutoGPT requiere permiso después de cada solicitud, lo que significa que se deben realizar muchas pruebas. Esto permite adaptar el proyecto de IA a nuestras necesidades.
Instalación y requisitos
Para utilizar AutoGPT, necesitás:
- Python 3.8 o posterior.
- Clave API de OpenAI.
- Acceso a la API GPT-4.
- Clave API de Python.
- API de ElevenLabs para proyectos de conversión de texto a voz.
En la ventana de CMD, Bash o Powershell, cloná el repositorio:
Andá al directorio del proyecto:
CD ‘Auto-GPT’
Instalá las dependencias necesarias:
pip install -r requirements.txt
A continuación, debés ir a la carpeta y cambiar el nombre de .env.template a .env. Una vez hecho esto, abrí .env y reemplazá las claves por tu propia OPENAI_API_KEY.
Si lo usás con fines de voz, también debés ingresar ELEVEN_LABS_API_KEY.
Cómo obtener las claves:
- Clave de API de OpenAI: https://platform.openai.com/account/api-keys
- Clave de API de ElevenLabs: https://elevenlabs.io
Una vez que hayas configurado todo, ejecutá el script en CMD, Bash o Powershell:
python scripts/main.py
Ahora estás listo para empezar a usar AutoGPT. Si tenés algún problema, podés consultar el repositorio de GitHub.
Demostración de AutoGPT
Podés descargar el video de demostración desde el repositorio de GitHub de AutoGPT:
El experimento de Smallville, una ciudad de 25 inteligencias artificiales
Un experimento realizado por científicos de Google y Stanford, y publicado previamente (sin revisión por parte de la comunidad científica), simula una ciudad virtual llamada Smallville, habitada por 25 inteligencias artificiales. Estas IAs están programadas para interactuar entre sí a partir de una historia personal generada por ChatGPT. Por ejemplo, uno de los personajes, John Lin, es un farmacéutico que trabaja en Willow Market and Pharmacy, le encanta ayudar a las personas, vive con su esposa Mei Lin, profesora universitaria, y su hijo Eddy Lin, un estudiante de música.
A partir de esta minitrama, se pidió a los agentes de ChatGPT que interactuaran según la hora del día y la información en tiempo real sobre su entorno.
Un video de esta simulación está disponible en línea.
El experimento muestra cómo las interacciones sociales y los desarrollos interesantes han surgido en la ciudad virtual: uno de los personajes, Sam, decidió postularse para la alcaldía.
Los investigadores observaron que los agentes compartían información, establecían relaciones y se coordinaban para organizar eventos. En resumen, simularon una comunidad de personas, tal como lo había previsto el estudio. Los investigadores ven un futuro para este tipo de agentes “en foros, en el metaverso o incluso en el espacio físico, gracias a los robots multimodales”.
Evidentemente, siempre es necesario tener en cuenta las cuestiones y los riesgos éticos, como el hecho de que los humanos puedan establecer relaciones parasociales con la IA, o que esta, en un contexto diferente al del experimento, pueda desviarse de los objetivos predefinidos, generar información errónea o representar un peligro para los usuarios humanos que interactúan con ella.
Fuente: Ai4business.it, Network Digital360