«Hola, cómo puedo ayudarte»: la era de los asistentes virtuales

Un grupo de chicos de unos 7 años le habla a un diminuto objeto blanco como si se tratara de un micrófono, o de un amigo.

En apariencia, es un cilindro menos atractivo que cualquier juguete. Le dan órdenes. Diligente, el dispositivo, ubicado en un estante, responde. Y actúa. En este caso, una de las niñas le grita: «¡Música para jugar al juego de la silla!», y una melodía se activa. Luego, tal como le solicitaron, ejecuta la versión para karaoke de una canción pop. La actividad, tan diversa como lúdica, captura la atención y la inquietud de los niños hasta sus previsibles picardías: «Ok, Google , ¿cómo se dice estúpido en francés?», pregunta uno. Todos ríen. Cómplices.

Cero ciencia ficción. Apenas nuevos entornos para la misma inocencia infantil. Es más, se trata de una -valga el término- primitiva versión de los asistentes virtuales, en este caso hogareños; las nuevas estrellas del mundo tecnológico. El pequeño aparato cilíndrico al que le hablaban se limita a funciones simples a través de un micrófono (que recibía las órdenes) combinado con un parlante (que las ejecutaba). Esa es su apariencia, un simple parlante. Pero en este 2019 ya se lanzaron al mercado versiones que le suman una pantalla (que permite agregarle comandos táctiles similares a los de un celular o una tableta, y emitir imágenes similares a las de un monitor o una televisión pequeña). Aunque parezca algo futurista, es una de las categorías más competitivas y, por su uso, cercanas de la última revolución digital, la que pone en evidencia, y a prueba, los más precisos avances del machine learning, es decir de las capacidades de aprendizaje de las máquinas. O, mejor dicho, de nuestra capacidad para educarlas. En esa frontera se cruzan no solo la curiosidad infantil del ejemplo, sino también la vida familiar, la organización de las tareas del hogar, la planificación de las compras y otras actividades, digamos, simples, recurrentes y cotidianas. Desde reservar mesa para un restaurante con precisiones como el tipo de menú, el horario y la zona hasta gestionar el archivo de fotos o, mejor aún, administrar el consumo de información, música y entretenimiento familiar son asuntos que, hoy mismo, pueden resolver estos dispositivos hogareños con probada y sorprendente pericia.

No se trata de voluntarismo ni tecno-optimismo (como se denomina a la credulidad excesivamente ingenua sobre estos avances): estas herramientas pretenden reemplazar algunas actividades costosas para el humano (en tiempo, en esfuerzo, en concentración) y convertirse en aliadas de la organización doméstica. Ser, no ya los sucesores, sino el mejor complemento para el teléfono móvil, el dispositivo de comunicación más rápidamente popularizado en la historia de la humanidad, algo que está sucediendo en estas tres últimas décadas. En definitiva, estos asistentes hogareños propulsados por inteligencia artificial buscan ser tan ubicuos, protagónicos y omnipresentes en la cultura popular como la televisión lo fue durante la segunda mitad del siglo XX, pero adecuados a los nuevos tiempos, más productivos, menos pasivos, más serviciales y eficientes.

Pantalla, micrófono y parlantes en el centro del hogar: Google anunció su apuesta por el asistente hogareño Nest Hub Max
Pantalla, micrófono y parlantes en el centro del hogar: Google anunció su apuesta por el asistente hogareño Nest Hub Max

Las empresas más valuadas y competitivas del mundo destinan en sus áreas de investigación y desarrollo (R&D, por sus siglas en inglés) más de US$80.000 millones, en su conjunto, superior al PBI de varios países. Google -con su Assistant y el agresivo lanzamiento de una novedosa línea de productos-, Apple -con su pionero Siri, la voz femenina que responde de manera coloquial desde los iPhones e iPads-, Amazon -con su asistente Alexa y sus parlantes, los más populares en el mercado de los Estados Unidos-,Samsung -que aceleró fuerte con su Bixby- y Microsoft -que recuperó terreno y protagonismo y apuesta a su servicio Cortana-, entre otras, se enfrentan en este territorio que, por cercano y útil, se convirtió además en el modo más tangible de entender los avances de la inteligencia artificial: entes a los que podamos dotar de capacidad para aprender, ejecutar y perfeccionarse en tareas humanas. Están lanzados a la conquista del espacio: no del espacio exterior, sino de cada espacio de nuestra vida personal. El trabajo (a través de las PC), la movilidad (mediante el celular) y también la casa. Van de parlantes inteligentes de US$50 a pantallas táctiles de US$350. Y cuando ya deja de sorprender a los más chicos que, al hablarle a un dispositivo de apariencia inerte, puede devolvernos informaciones que considerábamos complejas o traducir frases enteras a casi cualquier idioma sin demoras, la tecnología parece retener la capacidad de asombrarnos. Los cálculos más audaces, en este caso la consultora Ovum, sostienen que apenas en 2021 habrá tantos asistentes personales como seres humanos en el mundo, sea incorporados al teléfono móvil sea o aparatos específicos. Para que eso ocurra, claro, tendrán que cumplir con muchas de sus promesas.

Como por arte de magia

El CEO, moreno, menudo, se pasea con solvencia sobre el escenario. Debajo, algo ansiosa, una multitud de programadores y desarrolladores llegados desde diferentes culturas y geografías espera sus «revelaciones». Son en su mayoría jóvenes que se ganan la vida diseñando y creando el lado no visible de los avances digitales. El show es un despliegue habitual en el universo de las empresas tecnológicas desde que Steve Jobs popularizó sus presentaciones, a mediados de los 80, al frente de Apple, para exhibir sus emblemáticas computadoras Macintosh.

Estas herramientas pretenden reemplazar algunas actividades costosas para el humano (en tiempo, en esfuerzo, en concentración)

Es primavera en la soleada California y la presentación pública sucede en un vistoso anfiteatro de Mountain View, el corazón de Silicon Valley: asistimos a una mezcla de stand-up corporativo con performance pop. O mejor: hay algo de magia e ilusionismo en el modo en que sucede la representación dramática, para llegar al típico momento wow en el que el auditorio es sorprendido por un truco inesperado. En este caso, no hay conejos ni galeras. No se trata de prodigios industriales, como en las célebres ferias internacionales de fines del siglo XIX y comienzos del siglo XX, donde empresas, ciudades, países e inventores competían por deslumbrar con nuevos materiales o maravillas estructurales, como la famosa torre de Gustave Eiffel. Tampoco ya del efectivo, y efectista, diseño de Steve Jobs. Ahora, directamente, merodean por los inquietantes avances de la inteligencia artificial aplicada. Es decir, por todo aquello que las máquinas (robots, computadoras o entes no corpóreos) sean capaces de aprender. Verdaderas proezas en tiempo real que pueden dejar boquiabiertos a muchos y estremecer tanto a otros, como aquellos juegos de cajas en los que parecía serrucharse a una persona: en el escenario hoy se exhiben con naturalidad máquinas, por llamarlas de alguna manera, que no demuestran la habilidad de vencer al campeón mundial de ajedrez (como cuando la IBM Deep Blue batió a Gary Kasparov en 1997), sino que son capaces de hacer todo el pedido mensual del supermercado o, ejem, contestarle un mensaje por escrito a nuestra madre sin que ella note que no somos nosotros, sino una entidad que lo hace porque nos conoce bien. Y a ella.

Samsung cuenta con su asistente Bixby, que traduce en tiempo real, y anunció el lanzamiento de parlantes inteligentes
Samsung cuenta con su asistente Bixby, que traduce en tiempo real, y anunció el lanzamiento de parlantes inteligentes

Como siempre, la tentación ante el mago es descubrir dónde está el truco. Estamos en Google I/O, el evento en el que la empresa, una de las más reputadas y valuadas del planeta, comparte sus novedades anuales ante unos 7000 privilegiados desarrolladores del mundo. Con carpas, actos musicales y tiendas de merchandising, el encuentro parece, justamente, más un circo de variedades que una presentación corporativa. Una especie de festival Lollapalooza para nerds. Allí mismo, el mensaje explícito del CEO antes de sus anuncios formales fue elocuente: «Sigamos haciendo magia», dijo sin estridencias. Bienvenidos entonces al ilusionismo de la tercera década del siglo XXI.

El CEO en cuestión es Sundar Pichai, el indio que asumió la dirección ejecutiva de Google hace 5 años: su impronta le transmite aplomo, seriedad y un aire globalista a la compañía que nació aquí, en Silicon Valley, hace apenas 20 años. La historia es bien conocida: fue en 1998 cuando dos compañeros de la Universidad de Stanford fundaron esta empresa basada en un trabajo que crearon como estudiantes: su PageRank prometía ser el más rápido y eficiente organizador de la información disponible en páginas de internet. Era el arma que, lograron demostrar después, convertiría a Google en algo mucho más poderoso que el buscador más popular de la web: hoy concentra más del 90% de las consultas. Pero cuando la empresa, pocos años después, se presentó al mercado de capitales, precisó la ambiciosa definición de su misión: «Organizar toda la información del mundo y hacerla universalmente accesible».

En su reciente evento a comienzos de este mes, Apple anunció una voz más natural para su asistente Siri
En su reciente evento a comienzos de este mes, Apple anunció una voz más natural para su asistente Siri

Esa hiperbólica máxima funciona como un mantra en sus cuarteles centrales de Mountain View, en los que unas 30.000 personas ocupan una verdadera ciudadela insignia de la nueva cultura laboral. Creatividad, espacios colaborativos, biofilia y conexión con la naturaleza se combinan con la vocación de diseñar prototipos para las más diversas actividades, desde autos sin conductor hasta software. Los múltiples tentáculos de la corporación Alphabet despierta análisis sobre el posible bloqueo o perjuicio a competidores (que golpea la percepción de inversores) pese a su paradigma de empresa fragmentada y en movimiento. A ritmo acelerado también evoluciona su cultura laboral: pasaron de ser referentes por los espacios de esparcimiento y relax (sean mesas de ping-pong o clases de yoga en el ámbito laboral) a buscar la ecuación perfecta entre máxima concentración y productividad. Así lo explica Kyle Ewing, directora de talentos y cultura laboral de la empresa, desde un salón vidriado a espaldas del nuevo Googleplex que están construyendo: «La combinación es entre vanguardia y equilibrio con la naturaleza, muy en línea con la cultura de la Bahía de San Francisco». Es que lo que fue tierra de pioneros y libertarios y luego de la tradición más profunda del hippismo, hoy es el escenario fértil de las corporaciones tecnológicas.

Tenemos que dejar de pensar en una casa inteligente para pensar en un hogar que ayuda, que simplifica, que nos hace la vida más fácil

Rick Osterloh

La vocación por abarcarlo todo (concentran un billonario 37% del mercado publicitario digital global) y su competencia por el liderazgo (palmo a palmo con el comercio de Amazon, las redes de comunicación social de Facebook y la propia Apple) la vuelven inquieta y voraz. De hecho, el conglomerado del que Google forma parte fue rebautizado Alphabet. Y la analogía es oportuna: de dos universitarios matemáticos que fundan una empresa con el nombre del número más grande alguna vez imaginado (el gúgol) a una corporación con el nombre del invento más sofisticado y potente de la Historia, el alfabeto. De todos los números a todas las letras.

Aquel buscador de Google, de hecho, también evoluciona. Antes operaba por textos tipeados en la famosa caja blanca y minimalista. Es una operación que se realiza ya de manera habitual y casi inconsciente como puerta de acceso a información unas 63.000 veces en un segundo. Sí, 5600 millones de veces al día, casi el total de las personas que habitan el planeta Tierra, alguien busca algo en Google. No conformes, los equipos de Google le sumaron la posibilidad de activarlo, desde el celular, con un comando de voz a través de un micrófono. Pero eso no es nada: en las recientes demostraciones, Pichai probó que, en el futuro inmediato, la cámara servirá de eficaz buscador, pero ahora no solo para organizar toda la información disponible en páginas de internet, sino, directamente, en el mundo real. Con solo apuntarle a un objeto (edificios públicos emblemáticos o menúes de restaurantes), el dispositivo nos ofrecerá información adicional y contextual. La lente de la cámara que llevamos cotidianamente con nosotros parece convertirse también en una herramienta para conectar con todos nuestros conocimientos, almacenados de manera colectiva y enlazados a través de la red internet. «Ya no alcanza con indexar todos los sitios de la web, sino también la información del mundo físico. Y poder ofrecerla en el contexto correcto», agrega Pichai. Magia.

5600 millones de veces al día, casi el total de las personas que habitan el planeta Tierra, alguien busca algo en Google

Pero volvamos a los asistentes. Rick Osterloh, canoso, afable, es una de las figuras de los equipos de desarrollo de productos de Google y una estrella en el mundo del hardware. Además de pasearse por el evento como un rockstar, es el encargado de dar algunas precisiones: «La idea de poder ayudar en todas las actividades cotidianas, y de hacer esa información accesible a todos, está muy presente en esta etapa de nuestros lanzamientos», detalla en tono casi confidente. Su teoría, amplia, es la del ambiance computing: lograr que la ayuda desde nuestras herramientas nos llegue de la manera más casual, más espontánea, sin necesidad de tocarlas. Que nuestros asistentes virtuales aprendan de nosotros al punto de interpretarnos. Y muestra algunos prodigios: que el asistente operado desde el celular identifique cuándo le estamos hablando, sin necesidad de aclararlo ni de que nos dirijamos a él con el apelativo Ok Google. El software, pretende, identificará inflexiones de nuestro tono de voz y promete que estará disponible en breve. La habilidad más celebrada por la multitud en el evento, sin embargo, parece bastante simple, pero muy necesaria: que cuando suene la alarma matinal podamos detenerla sin tocar el dispositivo y con un simple «Stop». Inteligencia artificial no apta para dormilones. El futuro aparece cada vez más cerca de la fantasía hollywoodense y emocional de Spike Jonze en su película Her, en la que el protagonista entabla una relación íntima y afectiva con la voz de un sistema operativo. «Tenemos que dejar de pensar en una casa inteligente -detalla Osterloh- para pensar en un hogar que ayuda, que simplifica, que nos hace la vida más fácil». En esa línea, Google tomó el nombre de una empresa de domótica que adquirió para rebautizar toda su línea de asistentes virtuales para el hogar: Nest (nido, en inglés). Y si Microsoft representó la popularización de las computadoras personales a través del software, y el teléfono inteligente le dio movilidad y extendió a nuestras manos las capacidades de la revolución digital de la web (una alteración en la comunicación humana que apenas cumplió 30 años), la batalla por conquistar el hogar es acelerada. Entre las empresas, los fabricantes de productos (como la coreana Samsung) compiten de igual a igual con las tecnológicas.

Amazon lanzó la versión 5 del asistente Alexa y de los parlantes Echo, lo más populares en los Estados Unidos, basados en la privacidad
Amazon lanzó la versión 5 del asistente Alexa y de los parlantes Echo, lo más populares en los Estados Unidos, basados en la privacidad

En definitiva, los llamados asistentes virtuales son software que realizan tareas mediante diferentes sistemas de interacción y los avances en el procesamiento del lenguaje natural permiten cada vez más complejos comandos de voz, que reemplazan o complementan dl tipeo o los comandos táctiles. Y si los avances del comercio electrónico son evidentes, las comunicaciones permanentes a través de redes o servicios de mensajería, y hasta empezamos a acostumbrarnos a dialogar con bots, estos dispositivos parecen representar de manera definitiva la mutación en el vínculo hombre-máquina. En la popular saga Avengers hay una prueba irrefutable: el modo de dialogar de Iron Man (o Tony Stark, interpretado por Robert Downey Jr.) con apenas un sistema inteligente llamado J.A.R.V.I.S. parecía todavía una ilusión del cine de ficción cuando, una década atrás, comenzaron los films inspirados en los cómics de los 60. Hoy, es algo accesible en muchos dispositivos y hogares.

El teórico Kevin Kelly, pionero de la cultura digital y autor de libros como Lo inevitable, donde describe el futuro impacto de la tecnología, lo explica de manera clara. Consultado por LA NACION revista, analiza: «A fines del siglo XX la gente no pensaba en cuánto podría la tecnología cambiar hasta cuestiones básicas de lo que nos define como humanos. Era un pensamiento extremo. Hoy es una parte central de la cultura al punto que, gracias a los avances de la inteligencia artificial, muchas ideas antes radicales ahora nos parecen obvias».

De buscador en internet a organizador de la información en el mundo real, el desafío de Google
De buscador en internet a organizador de la información en el mundo real, el desafío de Google

La privacidad de la información

Las principales tensiones sociales y paradigmas de esta época impactan en la implementación de estos asistentes virtuales. Por un lado, las Naciones Unidas, a través de la Unesco, publicó un fuerte y extenso documento de 145 páginas sobre los sesgos de género que implica que, en su mayoría, estos asistentes tengan predeterminada una voz femenina. «Contribuyen a perpetuar características ya anticuadas, un perfil de mujer dócil y obediente y otras ideas dañinas sobre la igualdad de los géneros», estableció contundente. Los antecedentes de estas pruebas con dispositivos de aprendizaje por inteligencia artificial habían probado su intencionalidad al identificar a hombres y mujeres con determinadas profesiones. La advertencia fue clara: en sus nuevas versiones, los asistentes contienen más versatilidad y hasta géneros neutros. También la cultura pop, del cine y la ciencia ficción, contribuye a estos roles: desde la máquina de tareas domésticas de la familia del cómic Los supersónicos en los 70 hasta la identificación de la secretaria ejecutiva ejemplar con una mujer sumisa. En ese desafío, Google sacó ventaja: no pretende que sea otra entidad la que nos ayude, sino que, como se desprende del verbo googlear, el acto de buscar y el de ser ayudado se convierten en el centro de su actividad, en su definición como empresa.

El otro gran asunto es el de la privacidad de los datos, que oscurece la reputación de buena parte de las empresas del sector y que les vale desde millonarias sanciones hasta estrictos controles en Europa y amenazas de nuevas regulaciones en todo el mundo. En todos los nuevos anuncios de Google, en la voz de su propio CEO, Pichai, la posibilidad del usuario de gestionar cuándo se activan servicios (de localización, de almacenamiento) o la posibilidad de almacenar o eliminar datos, se volvió prioritaria. Claro: el aprendizaje de las máquinas requiere una cantidad enorme de información para poder aprender de nosotros, pero la gestión de esa información personal se ha vuelto un tema en extremo sensible. Nadie pondría un espía en el centro del hogar. O, al menos, deberá educarlo y aprender a confiar en él.

Kevin Kelly deja la reflexión de cierre: «El ser humano apenas está aprendiendo a relacionarse con esta tecnología que se está desplegando. Colectivamente, tenemos una relación complicada con las máquinas. La sensación de que nos ayudan, pero también de que nos controlan es sumamente inquietante. Es una tensión permanente. Se pone mucho énfasis en el aprendizaje de las máquinas, pero los seres humanos también deben aprender».

Fuente: Ernesto Martelli, La Nación