Especiales

ChatOpenAI: qué es, cuándo se fundó y qué hace

  • Home
  • Inteligencia Artificial

Pasaron siete años desde el nacimiento de ChatOpenAI, el proyecto creado para hacer que la IA sea ética y segura: qué cambió, los últimos proyectos, y cómo funcionan GPT-3 y DALL-E 2.

Publicado el 09 Oct 2024

ChatOpenAI

ChatOpenAI fue fundada en diciembre de 2015 en San Francisco como una organización sin fines de lucro dedicada a la investigación y el desarrollo de la inteligencia artificial (IA). Su objetivo principal es “garantizar que la inteligencia artificial general beneficie a toda la humanidad”.

Desde 2019, el término “OpenAI” refiere tanto a la sociedad con fines de lucro limitados, OpenAI LP, como a su empresa matriz sin fines de lucro, OpenAI Inc.

Los inicios de ChatOpenAI

El capital inicial de la fundación, que alcanzó los mil millones de dólares, provino de varias figuras y empresas destacadas. Entre los principales inversores estuvieron Elon Musk, director ejecutivo de Tesla y SpaceX; Peter Thiel, cofundador de PayPal; Sam Altman, presidente de la aceleradora de startups Y Combinator; Amazon Web Services; y la consultora tecnológica india Infosys.

En febrero de 2018, Musk renunció a la junta directiva de ChatOpenAI debido a un posible conflicto de intereses con el desarrollo de IA en Tesla, aunque continuó como donante de la organización.

En 2019, se fundó OpenAI LP, una empresa de “beneficio limitado”, para permitir mayores inversiones en computación en la nube, contratación de personal y desarrollo de supercomputadoras basadas en IA. Esta estructura también fijó un límite negociado a los beneficios económicos para los inversores y empleados.

“Queremos aumentar nuestra capacidad para reunir capital sin desviar nuestra misión original, y ninguna estructura legal existente logra este equilibrio adecuado”, escribieron Greg Brockman (presidente y director de tecnología) e Ilya Sutskever (científico jefe) en el blog de la empresa en marzo de 2019.

En julio de ese mismo año, OpenAI LP anunció una inversión de mil millones de dólares por parte de Microsoft, lo que marcó el comienzo de una asociación de investigación con la compañía fundada por Bill Gates, que además se convirtió en el proveedor exclusivo de servicios en la nube para OpenAI.

OpenAI LP es una subsidiaria de la organización sin fines de lucro OpenAI Inc., que absorbe los retornos económicos más allá del límite acordado.

Análisis de inversiones de Microsoft

En enero de 2024, la Comisión Europea decidió iniciar una auditoría de la inversión de Microsoft en ChatOpenAI, basándose en el Reglamento de concentraciones de la UE. La preocupación de las autoridades antimonopolio no era tanto el acuerdo en sí, sino el impacto que esta asociación podría tener en el mercado de la tecnología y la competencia.

La demanda interpuesta por Elon Musk

En marzo de 2024, Elon Musk, cofundador de ChatOpenAI, presentó una demanda contra la empresa, acusándola de priorizar beneficios para Microsoft en lugar de cumplir con su misión original de “beneficiar a la humanidad”. Musk argumentó que ChatOpenAI se había transformado en una filial cerrada y de facto de Microsoft. Posteriormente, en agosto de 2024, Musk retiró la demanda, aunque planea volver a presentarla en el futuro.

ChatOpenAI

Acuerdo entre ChatOpenAI y News Corp

En mayo de 2024, ChatOpenAI y News Corp firmaron un acuerdo por varios años, mediante el cual OpenAI obtuvo permiso para mostrar el contenido de los medios de News Corp en respuesta a las consultas de los usuarios. Este convenio busca mejorar los productos de ChatOpenAI y ofrecer a las personas información confiable que les permita tomar decisiones informadas basadas en fuentes de noticias respetables.

Deserciones en ChatOpenAI

En mayo de 2024, Alya Sutskever, una de las cofundadoras de ChatOpenAI, decidió abandonar la empresa. Un mes después, lanzó Superinteligencia Segura (SSI), el primer laboratorio del mundo dedicado exclusivamente a desarrollar una superinteligencia segura.

Esta no es la primera vez que ChatOpenAI sufre bajas importantes en su equipo. En 2021, Darío Amodei, quien fuera director de seguridad de inteligencia artificial en ChatOpenAI, creó su propia startup, Anthropic. Esta empresa consiguió recaudar 4.000 millones de dólares de Amazon y otros cientos de millones de inversores de capital de riesgo, alcanzando una valuación de más de 18.000 millones de dólares.

Por otro lado, Jan Leike, cercano colaborador de Sutskever, también dejó ChatOpenAI al asegurar que sus diferencias con la dirección habían “llegado a un punto de ruptura”, dado que, según él, “la cultura y los procesos de seguridad han quedado relegados frente a la ambición por lanzar productos llamativos”. Leike se unió a Anthropic, uno de los principales rivales de OpenAI.

En agosto de 2024, John Schulman, otro de los cofundadores de ChatOpenAI y uno de los principales arquitectos de ChatGPT, también dio el salto a Anthropic. Esta salida se suma a la de otras figuras importantes que dejaron la compañía de inteligencia artificial en los últimos meses. Schulman declaró que su intención es trabajar en la alineación de sistemas de IA (asegurar que actúen conforme a los valores humanos) dentro de Anthropic, empresa que se presenta como pionera en priorizar la seguridad en su desarrollo de inteligencia artificial.

Apple se une a la junta directiva de ChatOpenAI como observadora

En julio de 2024, Apple se integró como observadora en la junta directiva de ChatOpenAI. Esto se dio como parte de un acuerdo entre ambas empresas para incorporar funciones de inteligencia artificial en los dispositivos de Apple. Este rol permite a Apple tener una posición similar a la de Microsoft, principal socio de ChatOpenAI. Sin embargo, está previsto que tanto Microsoft como Apple abandonen sus asientos en la junta en el futuro para evitar conflictos relacionados con regulaciones antimonopolio.

¿Cómo funciona ChatOpenAI?

Según su sitio web oficial, OpenAI LP emplea a unas 100 personas en tres áreas principales: desarrollo de capacidades, que se enfoca en hacer evolucionar los sistemas de IA; seguridad, para garantizar que los sistemas sean éticos; y políticas, encargadas de la gobernanza adecuada de estos sistemas.

OpenAI LP es la rama operativa de OpenAI Inc, una organización sin fines de lucro que gestiona programas de divulgación y formación, como OpenAI Residency, una iniciativa que absorbe a los becarios y trainees de la empresa.

En sus primeras rondas de financiación, ChatOpenAI limitó el retorno de inversión (ROI) a 100 veces el valor invertido, aunque se anunció que ese múltiplo irá disminuyendo en futuras rondas debido a la reducción de riesgos.

¿Qué hace ChatOpenAI?

La misión de ChatOpenAI, según su sitio web oficial, es “garantizar que la inteligencia artificial general (AGI) –es decir, los sistemas altamente autónomos que superen a los humanos en la mayoría de los trabajos económicamente viables– beneficie a toda la humanidad”.

En 2016, ChatOpenAI lanzó OpenAI Gym, una plataforma dedicada al aprendizaje por refuerzo, y Universe, una plataforma para medir y entrenar la IA a través de juegos y aplicaciones.
Después de esto, llegaron:

  • RoboSumo: robots humanoides que aprenden de forma competitiva.
  • Juego de debate: un juego que enseña a las máquinas a discutir sus decisiones y puso sobre la mesa el tema de la IA explicable.
  • OpenAI Five: cinco bots que, en un videojuego, aprenden a jugar contra humanos mediante prueba y error.
  • Dactyl: una IA que entrena a un robot usando el mismo algoritmo de aprendizaje por refuerzo que los bots de OpenAI Five.

Sin embargo, la verdadera fama de ChatOpenAI llegó con GPT-2, un modelo de inteligencia artificial lingüística entrenado para predecir la siguiente palabra de una oración y, por lo tanto, capaz de traducir o generar textos automáticamente, así como respuestas en conversaciones.

En febrero de 2019, se lanzó una versión “reducida” del GPT-2 por preocupaciones sobre su mal uso, ya que la generación automática de textos puede ser una herramienta poderosa para crear noticias falsas creíbles. A pesar de esos miedos, la versión completa salió en noviembre del mismo año.

La siguiente evolución, el GPT-3, se anunció en 2020, pero su código fuente nunca fue público, y el acceso solo se proporcionó a través de una API de Microsoft.

En enero de 2021, ChatOpenAI lanzó DALL-E, una versión del GPT-3 entrenada para generar imágenes a partir de descripciones textuales. Simplemente con agregar un subtítulo, la red neuronal crea una imagen correspondiente. En abril de 2022, se anunció DALL-E 2, capaz de producir imágenes con una resolución cuatro veces mayor que su predecesor.

¿Cómo funcionan el GPT-3 y el DALL-E 2?

El GPT-3 y DALL-E 2 se basan en una red neuronal artificial construida bajo el modelo de transformador. El modelo de aprendizaje profundo de transformador se apoya en el principio de la autoatención: el algoritmo decide qué “peso” asignar a cada entrada, selecciona las más relevantes y, a partir de ellas, genera la salida.

Si lo simplificamos, podríamos imaginar que cada palabra de una oración es una entrada. El modelo de transformador decide cuáles son las palabras más importantes y, con ellas, genera el texto, la imagen o responde en una conversación.

DALL·E 2 Explained

A diferencia de las redes neuronales recurrentes o convolucionales, el modelo transformador permite procesar todas las entradas al mismo tiempo: la oración completa o todo el párrafo, en lugar de ir palabra por palabra. Esto lo hace mucho más eficaz en tareas de procesamiento del lenguaje natural (PNL).

Pero hay que aclarar que esto implica pasar de una IA puramente sintáctica, que genera resultados basándose en la posición de las entradas, a una IA semántica, que interpreta el significado de esas entradas en función del contexto. Es decir, una IA capaz de reconstruir el contexto a partir de unos pocos insumos clave. Suena más fácil de lo que realmente es.

La transición definitiva hacia una Inteligencia General Artificial (AGI) dependerá de que logremos superar este desafío. Y ChatOpenAI está en la frontera de esa evolución.

Sora, un modelo de video de nueva generación

En febrero de 2024, ChatOpenAI lanzó Sora, un modelo de video generativo que convierte descripciones textuales breves en películas detalladas y en alta definición, con una duración de hasta un minuto.

GPT-4, el modelo más potente

El 14 de marzo de 2023, ChatOpenAI presentó al mundo el GPT-4. Desde entonces, la startup facilitó el acceso a este modelo, permitiendo que otras empresas y desarrolladores lo utilicen para crear aplicaciones personalizadas y sacar provecho de su potencial.

GPT-4 supera ampliamente al GPT-3: es más preciso y puede, por ejemplo, aprobar el examen de habilitación para ejercer como abogado, calcular impuestos de manera instantánea y ofrecer descripciones detalladas de imágenes.

GPT-4o, el doble de rápido que el GPT-4 Turbo

El 13 de mayo de 2024, ChatOpenAI presentó el GPT-4o, un nuevo modelo que marca un gran avance, especialmente en términos de accesibilidad y experiencia de usuario. Este lanzamiento fue anunciado por Mira Murati, directora de tecnología de ChatOpenAI, durante el evento Spring Updates. La “o” en su nombre hace referencia a “omni”, lo que significa que el modelo es multimodal por naturaleza: puede procesar y generar texto, imágenes y otros elementos visuales de manera fluida.

ChatOpenAI

Se acerca SearchGPT

El 25 de julio, Sam Altman anunció la llegada de SearchGPT, el nuevo motor de búsqueda de ChatOpenAI. Se trata de un “prototipo temporal de capacidades avanzadas de búsqueda con IA, que proporciona respuestas rápidas y oportunas, respaldadas por fuentes claras y confiables”. Por el momento, el acceso está limitado a un pequeño grupo de usuarios y editores, con el fin de recolectar comentarios antes de su lanzamiento masivo.

Modo de voz avanzado

El 31 de julio de 2024, ChatOpenAI lanzó un chatbot de inteligencia artificial avanzado, con el que se puede hablar directamente. Este bot, disponible solo para algunos usuarios seleccionados, es la apuesta de ChatOpenAI para desarrollar una nueva generación de asistentes de voz impulsados por IA, con capacidades superiores a las de Siri o Alexa, permitiendo conversaciones más fluidas y naturales. Este modo de voz avanzado ofrece interacción en tiempo real, permite interrumpir al asistente en cualquier momento y es capaz de percibir y responder a las emociones del usuario.

Fuente: Ai4business.it, Network Digital360

Prohibida su reproducción total o parcial.

¿Qué te ha parecido este artículo?

¡Su opinión es importante para nosotros!

I
Redacción InnovaciónDigital360
Temas principales

Especificaciones

T
tecnología

Nota 1 de 5