Es la película de la semana en Silicon Valley. Ha pasado poco más de una década desde que se estrenó ‘Her‘ y ya podemos decir que ha dejado de ser ciencia ficción para convertirse en algo muy real. Esta semana las dos grandes empresas de inteligencia artificial han presentado dos proyectos (GPT-4o y Astra) que nos recuerdan claramente a Samantha, el asistente virtual de voz protagonizado por Scarlett Johansson.
El nivel de expectación con los nuevos agentes de IA con voz es tan alto que incluso Sundar Pichai, CEO de Google, ha tenido que dar su visión sobre el asunto. En un encuentro con periodistas internacionales realizado durante el Google I/O 2024 y en el que desde Xataka hemos participado, se le ha preguntado por las relaciones que tendremos con la IA, sobre las futuras gafas de Google y un repaso a cómo Gemini está propagándose rápidamente por toda la compañía. «Empieza una nueva era», afirman desde Google. Así lo explica su máximo responsable.
Lo primero que defiende Sundar Pichai es que «en Google llevamos en el camino de la IA desde hace mucho, mucho tiempo. Es genial ver que ahora estamos aprovechando estos beneficios de la IA en todos nuestros productos».
Aunque el momento que cambió la tendencia fue la llegada de ChatGPT, desde Google aprovechan cualquier oportunidad para justificar que ellos ya eran referentes desde mucho antes. Eran tiempos donde el equipo de DeepMind realizaba trabajos espectaculares, aunque propios del mundo académico y muy alejados de los servicios de Google que usamos.
El año que hablaremos con la IA (y esta verá lo que hacemos)
«Debido al tamaño de nuestros productos, creemos que realmente podemos ayudar a los usuarios en una escala muy grande. Nuestros modelos de Gemini fueron construidos nativamente de forma multimodal y ahora con Project Astra estamos viendo cómo eso se está haciendo realidad», describe Pichai.
En la misma línea iba Sergey Brin, el fundador de Google con quien también hemos tenido la oportunidad de coincidir esta semana. «No esperaba que nuestros experimentos fueran a llegar tan lejos», nos explicaba Brin, en referencia a que Gemini se creó con el texto en mente, pero al ser multimodal ya se dejó la puerta abierta a lo que este año vamos a ver. «Es una visión que ya tuvimos cuando fuimos uno de los primeros en entrenar, desde cero, un modelo multimodal nativo«, explica Pichai, de nuevo defendiendo que Google no sigue los pasos de otras empresas, pese a que sus demostraciones sí estén llegando más tarde.
Nos referimos a poder hablar con la IA. El New York Times fue uno de los primeros esta semana en afirmar que la era de ‘Her’ ha llegado. Y aunque, como apuntan desde El País, esta comparación no es más que una estrategia de marketing para magnificar las posibilidades de la IA, es divertido discutir sobre sus implicaciones sociales.
«Antes de decir nada más, tengo que decir que quiero a mi mujer», bromeaba Pichai antes de contestar sobre ‘Her’. «Con cada tecnología, a medida que se avanza, existen muchos casos de uso duales. Con la voz, habrá por ejemplo quien quiera utilizar la IA para preservar memorias de sus seres queridos ya fallecidos. Es una tecnología muy poderosa. Y sí, también habrá gente que con el tiempo pueda establecer relaciones más profundas con estos asistentes o agentes de IA. Y sí, también creo que deberíamos prepararnos para todas esas posibilidades. Creo que por eso es tan importante que esta tecnología se implemente de manera responsable. Y estamos comprometidos en hacerlo así. Pienso en protecciones como SynthID, que hemos hecho con imágenes y lo vamos a llevar a la voz y vídeo también».
Pichai no se ha enamorado de una IA, pero sí nos explica cuando se enamoró de la IA. «Fue cuando vi una demostración de Google Brain, ahora en DeepMind. Cuando las redes neuronales fueron capaces de reconocer la imagen de un gato. Ese momento fue la primera vez que en mi mente fue algo especial. Un momento donde me di cuenta que esta tecnología iba a funcionar», recuerda el CEO de Google.
En este Google I/O, que el propio Pichai bromea describiéndolo como la versión tech del ‘Eras Tour’ de Taylor Swift pero «con menos cambios de vestuario», también se han presentado avances más allá de la multimodalidad. La IA no solo ahora trabajará con voz y vídeo, también tendrá un mejor contexto. Esto lo representa Google con la versión de Gemini Pro con hasta dos millones de tokens, disponible en preview. La memoria y el contexto al que tendrán acceso las IA será mucho mayor, lo que nos permitirá tener conversaciones más largas y con más factores en juego. Algo que también recuerda a ‘Her’.
El tercer aspecto que defiende Pichai es el de los agentes de IA. En el sentido de que podrán hacer acciones por nosotros: «ya sea una búsqueda haciendo consultas complejas, o Gemini tratando de planificar un viaje. Con el tiempo, podremos tenerlo en Chrome, en segundo plano, ayudándonos en nuestros proyectos. Creo que estamos bien posicionados por nuestro liderazgo en investigación, infraestructura, innovación y nuestra huella global».
Google está interiorizando Gemini de golpe. No es una tarea fácil. Google dispone de cerca de unos 180.000 empleados en todo el mundo. Y en poco más de un año han forzado a todos los equipos a que la IA sea una parte troncal de su trabajo. Prueba de la prioridad que se le está dando es que Demis Hassabis, CEO de DeepMind, ha tenido un rol muy destacado durante el Google I/O e incluso suena como posible sucesor de Pichai en el puesto de CEO. Algo a priori difícil de concebir, pues Hassabis es un perfil más técnico y tiene, según describe Business Insider la idea de gestionar cada día decenas de equipos variados y centenares de miles de trabajadores «sería una pesadilla para él».
«Estamos en una etapa en la que todos los diferentes productos y proyectos de Google estamos interiorizando Gemini y repensando cómo hacemos las cosas. Y es realmente emocionante, porque estamos viendo cómo dar el siguiente paso y buscando cuál es la forma correcta de trabajar para los usuarios», describe Pichai.
«Estamos hablando de una de las tecnologías más trascendentales en las que la humanidad trabajará jamás», afirma el CEO de Google. No en pasado, sino en futuro. Como si una vez consigamos que la IA sea totalmente autónoma, ya no tendremos más tareas donde los humanos tengamos un papel mejor.
«Es un punto de inflexión. Desde Google llevamos invirtiendo en esto desde hace mucho tiempo; construyendo modelos de referencia y trabajando para implementarlo en la vida diaria de miles de millones de personas. Me encanta la innovación y para mí, creo que esta ha sido una gran semana para estar en el mundo de la tecnología», se enorgullece.
De Android a las gafas
En la demostración de Project Astra se ve a un usuario interactuando por voz y vídeo a través de unas gafas. Sundar Pichai confirma los planes de Google de lanzar sus propias gafas con Astra y abre la puerta a crear un ecosistema nuevo alrededor de ellas: «Project Astra es parte de nuestra tecnología en móviles, pero creo que como realmente se aprovecha es con un formato tipo gafas. Siempre ha sido nuestra visión. Vamos a invertir en crear un ecosistema de gafas inteligentes de realidad aumentada. Próximamente tendremos interesantes productos de los que hablaros».
En el pasado el Google I/O giraba totalmente alrededor de Android. Esta vez ha quedado desplazado al segundo día. Son otros tiempos. Entre las novedades de Android 15 tenemos el plan para acabar con las llamadas de SPAM mediante la IA. Y estará basado en Gemini Nano.
«Es un momento increíble ver cómo los sistemas operativos están evolucionando. Cada año vamos a poder empaquetar más en el dispositivo. Lo que ahora es Gemini Flash acabará siendo Gemini Nano. Creo que la capacidad de trasladar más inteligencia al dispositivo va a ampliar enormemente las posibilidades. Como lo que hemos visto con la detección de estafas de manera privada, si eliges participar. Pero es solo la punta del iceberg. La IA del dispositivo nos ayudará con nuestros documentos, con las fotos… en cualquier momento que se lo digamos», describe alegremente Pichai, que además apunta a que piensa en el largo plazo: «siento que en mi cabeza hay una década de planes con todos los proyectos que quiero que los equipos construyan. Y ahí empezamos a trabajar. Y lo que es una década pueden acabar siendo unos pocos años».
Este es un año de elecciones. Más de 3.000 millones de personas van a votar este año. En Google están pendientes del papel que puede tener la IA en ellas, pero Pichai se muestra confiado.
«Es probablemente una de las cuestiones más importantes del momento. Desde Google invertimos desde hace tiempo en proteger la integridad de las elecciones. Es una de nuestras máximas prioridades como compañía, particularmente en productos como Search y Youtube. Hemos desplegado SynthID y el RED Team, para ocuparnos. También investigamos con Project Jigsaw. Primero entendemos los patrones y luego actuamos. Y compartimos esa información con la gente adecuada y los gobiernos afectados».
«Creo que hemos hecho un gran y creo que estamos en un momento que como sociedad ya sabemos discernir fácilmente lo que es real y lo que no. Soy cautelosamente optimista de que podremos hacer nuestra parte correctamente. Creo que lo que está en juego en el futuro es más difícil, pero para este año soy cautelosamente optimista».
Como uno de los directivos más poderosos del mundo, Sundar Pichai tiene respuesta diplomática preparada incluso para las preguntas más polémicas. Sobre Project Nimbus y el despido de casi una treintena de trabajadores por protestar, el CEO de Google responde que esos despidos «no tienen nada que ver con expresar las preocupaciones». Pichai defiende que Google «más que ninguna otra compañía«, permite a sus empleados «expresarse». Lo justifica como establecer un «código de conducta, de una forma que no sea destructiva para el lugar de trabajo».
«Tenemos claro que no queremos que nuestros sistemas de IA se desplieguen en sistemas de emergencia para armas y demás. Project Nimbus es una empresa que ha firmado acuerdos comerciales con un gobierno, como muchos otros acuerdos comerciales. En esos acuerdos hay unas condiciones de uso y siempre están vigentes», describe James Manyika, VP de Investigación, Tecnología y Sociedad en Google.
Sobre los gobiernos, Pichai termina hablando sobre la importancia de la regulación de la IA. «Tiene sentido para mí que los países piensen sobre este extraordinario e importante tema. Si me pongo en su posición, cuando piensas en el impacto de la IA en la sociedad, es lógico que se quiera tener un debate y establecer un equilibrio. La IA va a traer una gran oportunidad económica, pero también va a afectar a muchos industrias. A medida que pasa el tiempo tengo claro que necesitamos más marcos globales. Lo que hace que Internet sea la fuerza que es hoy es porque es un bien global; porque todos estamos de acuerdo en estándares comunes y en una forma de trabajar juntos. Espero que con la IA pueda aplicarse también».