En una entrevista exclusiva para Innovación Digital 360, Juan Pablo Pereira, COO & Co-Founder en BrainLogic AI / Zapia AI, explicó cómo fue que, buscando resolver una de las limitaciones a nivel tecnológico más grandes que tiene la región, que tiene que ver con el acceso a las últimas soluciones y herramientas que surgen dentro de este campo, decidieron darle vida a un novedoso asistente personal con Inteligencia Artificial diseñado específicamente para América Latina.
Pereira señaló que Zapia es “un asistente de bolsillo” que no solo comprende el idioma de quien se comunica con él, sino que también está enfocado en satisfacer sus necesidades culturales y tecnológicas. Está presente en WhatsApp y se puede utilizar a través de mensajes de texto o audios. A su vez, el cofundador destacó la importancia de la información en tiempo real, una característica que describe a este asistente y lo diferencia de otros reconocidos del mercado, como ChatGPT.
Zapia combina varios Large Language Models (LLMs) con algoritmos propios y de terceros. Casi todos estos LLMs están basados en una tecnología llamada Transformers, que a su vez, surgen a raíz de un artículo publicado por Google en 2017. “Cuando creamos Zapia decidimos hacerlo agnóstico a los distintos LLMs que hay en el mercado, lo cual nos trae muchas ventajas, como poder usar el mejor LLM para cada tipo de consulta”, afirmó Pereira.
Índice de temas
¿Cuál fue la inspiración detrás de la creación de Zapia como un “asistente personal de bolsillo con IA”, y enfocado en Latam?
Hace muchos años que mi socio Martín Alcalá Rubí está en el mundo de la tecnología, creando productos de Inteligencia Artificial para Estados Unidos.
Martín siempre sintió que era injusto que los mejores productos tecnológicos demoraran tanto en llegar a América Latina o que llegaran versiones con funcionalidades limitadas. A finales de 2022, con la llegada de ChatGPT, empezó una nueva revolución de Inteligencia Artificial. Por primera vez las computadoras empezaron a hablar el idioma de las personas y eso abre las puertas a muchos productos basados en IA que van a surgir en los próximos años.
Latinoamérica es un continente con muchas particularidades culturales y tecnológicas. Por ejemplo, es el continente con mayor penetración de Whatsapp y es un continente donde el habitante medio no usa la computadora, solo el teléfono móvil. Por eso, creemos que los asistentes personales creados en Estados Unidos, no van a funcionar bien en América Latina por un buen tiempo, y a todos en el equipo de Zapia nos parece injusto que esta tecnología que le va a aumentar tanto la calidad de vida a los latinos, demore tanto en llegar. Así surge Zapia, como el primer asistente de inteligencia artificial, 100% enfocado en América Latina. Queremos que los Latinos puedan tener el mejor asistente de Inteligencia Artificial.
¿Qué aspectos tecnológicos hacen que Zapia sea único en comparación con otros asistentes de IA disponibles en el mercado?
Si bien todavía estamos en versiones tempranas de Zapia, ya es uno de los asistentes más avanzados del mercado y con muchas ventajas para el usuario.
Además de estar dentro de Whatsapp, y de que los clientes se pueden comunicar con Zapia por mensajes de texto o audio, Zapia es uno de los pocos asistentes que tienen acceso a información en tiempo real. Si has usado ChatGPT o la mayoría de los asistentes que están basados en la tecnología de OpenAI, la última actualización de información que tienen es de septiembre de 2021, dos años atrás. En cambio Zapia puede responder consultas sobre temas de la actualidad, como por ejemplo, cómo va a estar el clima hoy, cuales son las principales noticias del día, a que hora juega mi equipo favorito, y donde puedo comprar determinado producto.
A su vez, en las próximas versiones de Zapia, vamos a incluir nuevas funcionalidades que están enfocadas en ayudar a los clientes a resolver tareas del mundo real, como hacer reservas, comprar productos y servicios, y mucho más. Al hacer todo esto con foco exclusivo en América Latina, queremos que nuestro asistente sea el que más ayude a los latinoamericanos a vivir mejor.
¿Cómo se utiliza la IA y el procesamiento del lenguaje natural en Zapia para comprender y responder a las consultas de los usuarios?
Zapia combina varios Large Language Models (LLMs) con algoritmos propios y de terceros. Casi todos estos LLMs están basados en una tecnología llamada Transformers, que a su vez, surgen a raíz de un artículo publicado por Google en 2017. Curiosamente Google publicó ese artículo gratis, en el cual introducía los Transformers al mundo y está es la tecnología en la cual está basada ChatGPT, que es considerado por muchos como la mayor amenaza para Google.
Cuando creamos Zapia decidimos hacerlo agnóstico a los distintos LLMs que hay en el mercado, lo cual nos trae muchas ventajas, como poder usar el mejor LLM para cada tipo de consulta. Esto nos da una ventaja sobre los asistentes creados por las grandes empresas de Silicon Valley (Google y OpenAI principalmente) que se acentúa con nuestro foco en América Latina.
Sabemos que Zapia puede transcribir mensajes de voz automáticamente. ¿Pueden explicar brevemente cómo funciona esta característica desde el punto de vista tecnológico?
La herramienta de transcripción de audios de Zapia es una de las más usadas. Es muy intuitiva; con solo re-enviarle un audio a Zapia, Zapia lo transcribe. También podés pedirle que cree un resumen, e incluso que te prepare una respuesta. A los usuarios les encanta.
Técnicamente, el sistema opera en varios pasos. El primer paso es limpiar el audio, es decir eliminar los ruidos de fondo y ajustar el volumen. El segundo paso es hacer una transcripción básica. Esto es algo que tecnológicamente es posible desde hace una década, pero la precisión era baja. Lo innovador que tiene Zapia al transcribir audios es el paso 3, que usa inteligencia artificial para entender el contexto del audio, y predecir la siguiente palabra. En base a esto se corrige la transcripción y se vuelve mucho más precisa. ¡Funciona increíblemente bien! Y lo más espectacular es la velocidad. Puede transcribir un audio de 5 minutos en cuestión de pocos segundos.
¿Qué desafíos técnicos tuvieron que superar al desarrollar Zapia para que fuera efectivo en múltiples idiomas y dialectos latinoamericanos?
Los desafíos técnicos más importantes estuvieron relacionados con la escalabilidad de la plataforma. Salimos al mercado hace apenas un mes, y el crecimiento fue mucho más rápido de lo que esperábamos. El sistema no estaba pronto para escalar a ese ritmo, y el equipo de ingeniería se tuvo que poner “el equipo al hombro” y trabajar incontables horas para arreglar problemas técnicos complejos.
Desde el lado de idiomas y dialectos, los Large Language Models son muy sofisticados y están preparados para entender múltiples idiomas y dialectos, tanto por texto como por mensaje de audio. Por eso, con Zapia se puede hablar en casi cualquier idioma y dialecto y vemos que muchos clientes están usando Zapia para hacer traducciones.
¿Qué papel desempeñan los algoritmos de machine learning en la funcionalidad de Zapia y cómo evolucionarán con el tiempo?
Los algoritmos de machine learning son la base del funcionamiento Zapia. Los LLMs que usamos para crear las respuestas a los usuarios están basados en algoritmos de machine learning.
Técnicamente, los algoritmos de los LLMs fueron entrenados en base a una gran base de datos, y en base a un contexto y una pregunta, pueden predecir la siguiente palabra de una frase con un altísimo grado de coherencia.
En Zapia, nuestro trabajo es ir adaptando el comportamiento de los algoritmos a las necesidades del público latinoamericano. Es parte de nuestro proceso de hyper localización. Nuestro equipo de ingeniería, que viene de trabajar en Inteligencia Artificial en empresas como Google, Etsy y Landing AI, está todo el tiempo probando el estado del arte de modelos de lenguaje a medida que van siendo publicados, y detectando que tiene utilidad específica para nuestro gran objetivo de mejorar la calidad de vida de los latinoamericanos.
¿Pueden compartir algunos ejemplos concretos de cómo Zapia está utilizando la IA para mejorar la calidad de vida de los usuarios en Latinoamérica?
Cuando decidimos crear Zapia, nos propusimos usar la Inteligencia Artificial para ayudar a los Latinoamericanos a ahorrar tiempo y dinero, y vivir mejor. Ese es nuestro gran objetivo a largo plazo y para eso trabajamos todos los días.
En la versión Beta, los usuarios ya pueden usar Zapia para muchísimas cosas, que les ayudan a ahorrar tiempo. En esta nota, ya hemos hablado de funcionalidades como Transcribir Audios y Traducir Idiomas, pero también sabemos que Zapia puede ayudar a los usuarios con tareas más complejas, que no fueron para las que originalmente creamos el producto. Por ejemplo, Zapia puede ayudar a los usuarios a escribir una carta para conseguir un trabajo, puede ayudar a los usuarios a solucionar tareas educativas o a crear una dieta balanceada. Si bien lo correcto es buscar ayuda con un profesional, y eso es lo que siempre recomendamos, nos pone muy contentos que Zapia pueda ayudar a los usuarios con estos temas porque sabemos que en América Latina, no todos los usuarios pueden acceder a un profesor particular o un nutricionista.
Sin embargo, en el futuro de Zapia vamos a crear nuevas funcionalidades que ayuden a los usuarios a ahorrar tiempo y dinero en tareas del mundo real, como poder comprar un producto al mejor precio, o conseguir al mejor prestador de un servicio.
¿Qué importancia tiene la privacidad de los datos en el desarrollo y uso de Zapia, y cómo se están abordando las preocupaciones relacionadas con la seguridad y la privacidad?
Para nosotros el tema de seguridad y privacidad es un tema central y nos lo tomamos muy en serio. Entre otras medidas que estamos tomando, anonimizamos la información de los clientes, de forma tal que nosotros no podemos asociar un mensaje o una conversación con una persona.
A su vez, al atender a nuestros clientes a través de whatsapp, usamos los canales seguros y encriptados de Meta que cumplen con los más altos estándares internacionales. Los servicios de base de datos están hosteados en los proveedores de Cloud más confiables a nivel mundial, garantizando la seguridad de los datos.
Artículo publicado originalmente en 05 Oct 2023