3. Asistentes virtuales de voz

3.1.  Asistentes de voz y aplicaciones

Los asistentes de voz son programas de software basados en la inteligencia artificial que son capaces de reconocer el lenguaje con una elevada precisión (gracias al machine learning) y responder a comandos de voz para ejecutar una serie de tareas y preguntas según las fuentes de información disponibles, de modo que posibilitan a los usuarios interactuar con diferentes plataformas y hardware mediante la voz.

Los asistentes de voz pueden estar integrados en diversos tipos de plataformas y dispositivos, entre los que podemos destacar:

  • Altavoces inteligentes. También conocidos como smart speakers o asistentes domésticos. Se trata de dispositivos inalámbricos de comandos de voz con una serie de tecnologías integradas, como los asistentes virtuales y la inteligencia artificial, que permiten controlar la domótica de la vivienda, reproducir música, consultar información, aportar entretenimiento, etc. Los altavoces más populares son: Amazon Echo, Google Home y HomePod.
  • Smartphones o teléfonos inteligentes. Están integrados en el teléfono independientemente del sistema operativo; por ejemplo, Google Assistant en Pixel y Pixel XL.
  • Smartwatch y wearables. Por ejemplo, Siri se encuentra disponible en el Apple Watch; Google Assistant está presente en diversos wearables.
  • Electrodomésticos. Google Assistant está disponible en televisores que tienen incluido Android TV.
  • Automóviles. Google Assistant también se puede utilizar en vehículos gracias a Android Auto.
  • Sistemas operativos. Están insertados como parte del propio sistema operativo; por ejemplo, Cortana en Microsoft Windows o Siri en los dispositivos iOS de Apple.

3.2.  Principales players

Los principales players que están influyendo en la búsqueda por voz y fomentando el desarrollo de esta tecnología son las denominadas empresas GAFA: Google, Amazon, Microsoft y Apple, con sus correspondientes asistentes digitales:

  • Google Now (lanzamiento en 2012) y Google Assistant (lanzamiento en 2016).
  • Alexa de Amazon (lanzamiento en 2014).
  • Cortana de Microsoft (lanzamiento en 2014).
  • Siri de Apple (lanzamiento en 2011).

3.2.1.  Google

El asistente de Google tiene el liderazgo en relación con las funcionalidades que ofrece a los desarrolladores, a pesar de haber sido lanzado después de Alexa.

Google Assistant destaca por la facilidad de uso y las funcionalidades de búsqueda. Está integrado en dispositivos Android, por lo que tiene un gran alcance, y también se puede acceder a él en el navegador Chrome, lo que permite utilizarlo en cualquier dispositivo móvil o en el ordenador. Por otro lado, están disponibles los altavoces inteligentes Google Home y Home Mini.

Una utilidad adicional de este asistente inteligente es que integra todos los productos de Google y se sirve de su propio buscador. De hecho, permite acceder al historial de búsqueda, lo que puede ayudar a personalizar las respuestas para que sean más útiles. Esto es posible ya que la mayoría de las búsquedas se realiza a través de Google.

Google ha ayudado a impulsar un cambio en el marketing digital hacia un lenguaje más natural para las búsquedas por voz alejándose de las comunes palabras clave. Este cambio de enfoque hacia un lenguaje más natural ha sido un verdadero impacto en las estrategias SEO. Según Google Data (2017), alrededor del 70 % de las búsquedas realizadas a través del asistente de Google refleja un lenguaje natural y no centrado en las típicas palabras clave que las personas escriben en una búsqueda web.

La búsqueda por voz a través de Google ha influido en el SEO local, especialmente las búsquedas que suelen terminar con near me/«cerca de mí», o aquellas que se espera que estén basadas en la ubicación.

3.2.2.  Amazon

Amazon es un importante innovador en el mundo de la búsqueda por voz. El principal enfoque de Alexa es dirigir las compras a través del marketplace. Alexa está disponible en una aplicación para dispositivos móviles, pero gran parte de su crecimiento puede atribuirse al aumento de los altavoces inteligentes, especialmente el popular Amazon Echo, que fue el primer altavoz inteligente en introducirse en el mercado en el año 2015, según afirma Seifert (2015). Al tratarse del primer altavoz inteligente, obtiene una posición dominante en el mercado. De hecho, en el año 2018 representaba una cuota de mercado del 72 % según Kinsella y Mutchler (2018b). Amazon también está intentando conseguir que los asistentes de voz sean más comunes en el área empresarial con el lanzamiento de Alexa for Business a finales de 2017, según Walker (2017).

Amazon Echo dispone de diversas funcionalidades y permite la integración con terceros mediante aplicaciones en las que los usuarios pueden realizar gestiones y solicitar productos o servicios.

Mientras que otras organizaciones han tenido más dificultades para monetizar sus asistentes digitales, Amazon tiene una gran ventaja competitiva gracias a la popularidad dominante del marketplace Amazon.com en las compras online. Según Kim (2018), aludiendo a un estudio de CIRP, los propietarios de Amazon Echo gastan de promedio 1.700 dóla-
res al año en Amazon, mientras que los miembros de Amazon Prime gastan 1.300 dólares
al año.

A pesar de que Alexa no sea el asistente digital dominante en móviles u ordenadores, no hay duda de que Amazon está aquí para permanecer en el mercado de las búsquedas por voz.

3.2.3.  Microsoft

Cortana se lanzó por primera vez en 2014, originalmente para Windows Phone 8.1, por lo que es uno de los primeros players en el mercado de búsqueda por voz. El uso de Cortana creció rápidamente a medida en que se integró en todos los teléfonos con Windows y se implementó en Windows 10, donde destaca su uso actualmente.

Tiene un papel importante en las búsquedas por voz a través de los ordenadores e, incluso, ayuda a realizar la configuración de un nuevo ordenador. Según Tsai (2018), es el asistente inteligente más utilizado en las empresas.

Destaca por el uso en el ámbito laboral y en el de los juegos online; sin embargo, Microsoft no se ha centrado en el desarrollo de un asistente doméstico mediante un altavoz inteligente como el resto de players. Por este motivo, el impacto en este mercado ha sido débil.

Cortana es el asistente perfecto para profesionales, ya que ayuda a los usuarios a ser más productivos gracias a que permite un fácil acceso a los correos electrónicos mediante Microsoft Outlook y a todas las funciones de Office 365.

En relación con la cuota de mercado de altavoces inteligentes en Estados Unidos, según el estudio de Kinsella y Mutchler (2018a), aunque Apple amenazaba con romper el duopolio Amazon/Google, ambos mantuvieron el 85 % del total de la cuota de mercado en 2018.

Amazon continuó teniendo el liderazgo a pesar de que su cuota de mercado se redujo de aproximadamente del 72 % al 61 %. Google fue una empresa importante que pasó de un 18,4 % a casi un 24 %, lo que representa precisamente la mitad de la disminución de la cuota de mercado de Amazon.

Los altavoces inteligentes pueden haber liderado la reciente popularización de la voz pero también cabe mencionar el uso de los asistentes de voz en los smartphones.

Siguiendo el estudio de Kinsella y Mutchler (2018a) sobre la adopción de los consumidores de los asistentes de voz, más de 146 millones de usuarios los han probado en smartphones, en comparación con los más de 50 millones de usuarios que usan los altavoces inteligentes.

Figura 2. Cuota de mercado de los altavoces inteligentes en Estados Unidos 2018-2019

Adopción de las principales tecnologías para alcanzar los 50 millones de usuarios (en años)

Siguiendo este mismo estudio, Apple iOS y Android lideran la cuota de mercado en smartphones en Estados Unidos. En cuanto al uso de asistentes de voz en smartphones, Apple Siri representa un 44 %, mientras que Google Assistant tiene el 30 %, seguido de Amazon Alexa con un 17 % y, por último, Samsung Bixby y Microsoft Cortana con un 4 %, respectivamente.

Figura 3. Porcentaje de uso de los asistentes de voz en los smartphones

Adopción de las principales tecnologías para alcanzar los 50 millones de usuarios (en años)

3.2.4.  Apple

El asistente inteligente de Apple, Siri, lleva integrado en el sistema operativo desde el año 2011 junto con el lanzamiento del iPhone 4s. Se incorporó por primera vez en las aplicaciones de mensajería y meteorología antes de convertirse en un asistente digital más avanzado. A pesar de su temprano lanzamiento, Apple se ha quedado atrás respecto a sus competidores.

Siri se volvió popular gracias a sus chistes, que aportaron al asistente digital un poco más de personalidad de lo que los usuarios podrían haber esperado inicialmente. Es un producto de iOS, lo que significa que ha sido diseñado específicamente para utilizarlo en dispositivos Apple, especialmente el iPhone. Esta diferenciación genera lealtad entre los usuarios de Apple pero puede complicar la expansión y el crecimiento entre los usuarios que no tienen este sistema operativo, especialmente a medida que aumenta el uso de altavoces inteligentes.

El altavoz inteligente de Apple, HomePod, se introdujo a principios de 2018, está soportado por Siri y ofrece la misma serie de funcionalidades típicas de los altavoces inteligentes, pero se ve limitado por su endogamia, como cualquier otro producto de Apple. Se caracteriza más por ser un altavoz de alta calidad que por ser un asistente virtual. Esta situación repercute en la cuota de mercado, que es una de las más bajas en 2018 según Kinsella y Mutchler (2018a).

3.3.  Principales comandos: las acciones de Google Assistant y las habilidades de Alexa

Una de las mejores maneras para entender cómo obtener ventajas de las aplicaciones de las búsquedas por voz es comprender completamente cómo funcionan estos asistentes. A continuación, analizaremos las posibilidades de los dos de los asistentes más utilizados: Google Assistant y Alexa.

Los comandos de estos asistentes toman diferentes nombres. En Alexa se llaman skills y en Google Assistant se llaman «acciones». No todas las funciones vienen por defecto; algunas tienen que ser activadas por los usuarios; por ejemplo, para habilitar una función en Alexa, basta con decir «Alexa, habilita la skill X».

La mayoría de los comandos son creados por desarrolladores independientes, de forma similar a las aplicaciones de los smartphones. Igual que estas, hay una variedad interminable de cosas que poder pedir a los asistentes por voz.

Las aplicaciones más populares son las relacionadas con los altavoces inteligentes para reproducir música. Es tan sencillo como decir: «Alexa, pon música de Michael Jackson» para que la música de este cantante se empiece a reproducir; incluso, se puede ser más específico y pedir una canción o un álbum concreto del artista.

Cabe destacar el incremento en los últimos años de los podcasts y audiolibros, que están ganando popularidad por la accesibilidad a diferentes comandos como «Pausa», «Reanuda», «Empieza desde el principio», que facilitan la escucha de los programas o libros en los que se esté interesado.

Además, uno de los objetivos de gran utilidad de los asistentes es el de entretenimiento. Se puede pedir a Google Assistant que sintonice nuestro programa favorito o que nos cuente un chiste o una historia para entretenernos. También existen numerosos juegos en audio, como el Trivial o piedra, papel o tijera.

Otra de las funciones primarias para las que se usan los asistentes es el acceso a información. Este tipo de búsquedas suele estar relacionado con noticias recientes, el tiempo y las condiciones del tráfico. En el caso de Alexa, gran parte de esta información se recoge en una función llamada Flash Briefings, que ofrece titulares de diversos temas. Gracias a ella, los usuarios pueden mantenerse actualizados acerca de lo que sucede a su alrededor. Basta con decir: «Alexa, ¿cuál es mi resumen informativo?» para que ella actualice los contenidos en el orden de preferencia que se ha seleccionado previamente. En cuanto a Google Assistant, existen muchas acciones diferentes que muestran noticias y titulares; se pueden mostrar todas las noticias de una fuente determinada, las últimas noticias ordenadas por temas, etc.

Los asistentes tienen como finalidad hacer la vida cotidiana del usuario más fácil. Se puede pedir a un asistente que cancele una suscripción a un servicio, preguntarle las cantidades de una receta específica, pedirle que deletree cómo se escribe una palabra o que diga su significado. También ayudan a los usuarios a navegar por sitios web, cronometrar un tiempo determinado o fijar una alarma. Google Calendar ha ayudado a muchas personas a organizar su agenda con el recordatorio de eventos, reuniones y tareas. Los fans de los deportes pueden preguntar cómo ha finalizado un partido, cuántos puntos lleva un equipo o curiosidades sobre jugadores como «¿Por qué a Fernando Torres se le llama el Niño?».

Los asistentes tienen como finalidad hacer la vida cotidiana del usuario más fácil

Una de las grandes tendencias recientes de estos asistentes es la promoción de un estilo de vida más saludable. Google Assistant tiene una acción llamada Qué entrenamiento que consiste en la recomendación de diferentes tipos de entrenamientos según el objetivo
que el usuario persiga. También se pueden pedir recomendaciones sobre restaurantes cercanos o encargar comida a domicilio. Ayuda, igualmente, a gestionar las finanzas ofreciendo información al respecto o, incluso, puede generar pagos a través de Google Pay diciendo «Google, paga a Daniel 15 euros por la cena de ayer». Está hecho.

Una posibilidad muy interesante que ofrece Alexa es la ayuda para preparar entrevistas; diciendo «Alexa, entrevístame», esta empezará a realizar las preguntas más básicas de una entrevista para que se pueda practicar.

A continuación, se expone un cuadro con ejemplos prácticos reales llevados a cabo durante esta investigación interactuando con el asistente por voz de Google.

Cuadro 1.  Consultas reales al asistente de Google

Función

Categoría

Búsqueda

Respuesta

Obtener
información local

Tiempo

«OK, Google, ¿qué tiempo hace hoy?»

«Hoy en Madrid va a estar parcialmente nublado. Se prevé una temperatura máxima de seis grados y una mínima de cero grados» (se muestra página de tiempo).

Comida

«OK, Google, panaderías en Pacífico»

«Aquí tienes panaderías cerca de Madrid» (se muestra mapa).

Horarios

«¿A qué hora ponen hoy Los Vengadores en Madrid?

«Hoy echan Los Vengadores: Endgame en Yelmo Cines Ideal a las cuatro, cinco y seis menos cuarto; también lo ponen en cines Capitol y cines Renoir Princesa» (se muestran las sesiones).

Navegación

«OK, Google, ¿cómo voy a la Embajada de Estados Unidos desde Avenida de América?»

«De acuerdo, la mejor forma de ir a la Embajada de Estados Unidos desde Avenida de América en coche es por la A2. Tardarías 14 minutos con tráfico moderado» (se muestra la ruta en Google Maps).

Planear
la jornada

Tráfico

«OK, Google, ¿cómo está el tráfico hoy para ir al trabajo?»

«Como el tráfico es fluido desde tu ubicación, tardarás aproximadamente 26 minutos» (se muestra la ruta en Google Maps).

Recordatorios

«OK, Google, recuérdame mañana ir a Correos a las nueve de la mañana».

«Perfecto. Te lo recordaré mañana a las nueve de la mañana» (se muestra el recordatorio añadido).

Vuelos

«OK, Google, ¿a qué hora sale el primer avión a Londres el miércoles desde
Madrid?»

«Esto es lo que he encontrado» (se muestra la página de Rumbo.es con vuelos Madrid-Londres).

Preguntar
al asistente

Noticias
actualizadas

«OK, Google, dime las últimas noticias de hoy»

«Aquí tienes las noticias más recientes» (se reproducen las últimas noticias de El País y el boletín de Radio Nacional de España).

Cálculos

«OK, Google, ¿cuánto es 7 × 7?»

«7 × 7 es igual a 49» (se muestra la calculadora).

Traducciones

«OK, Google, ¿cómo es 'almohada' en inglés?»

«Pillow» (se muestra el traductor).

Finanzas

«OK, Google, ¿cuántos puntos ha subido Iberdrola en la bolsa?»

«Ahora mismo, la cotización de Iberdrola es 8,1 euros con una subida del 2,07 % desde ayer» (se muestra el resultado con la fecha y hora).

Respuesta web

«OK, Google, muéstrame los mejores blogs de marketing»

«Aquí tienes» (se muestra la página de 40deFiebre.com con los mejores blogs de marketing digital).

Reproducir
archivos
multimedia

Música

«OK, Google, pon Joaquín Sabina»

«Perfecto, voy a intentar poner Joaquín Sabina en Spotify» (se reproduce Y nos dieron las diez en Spotify).

Podcasts

«OK, Google, reproduce el podcast de Carlos Ríos»

«Aquí tienes un resultado de la web» (se muestra la página iVoox.com con el podcast 37, Entrevista a Carlos Ríos: azúcar, dieta...).

Vídeos

«OK, Google, pon Radio Televisión Española»

«Vale, pues te pongo Radio Tele-
visión Española en YouTube» (se muestra vídeo del canal de YouTube).

Entretenimiento

Conocer al asistente

«OK, Google, ¿cuántos años tienes?»

«Soy muy joven. Pero no veas cómo controlo en internet».

Juegos

«OK, Google, vamos a jugar a adivinanzas»

«Con mi cara roja, mi ojo negro y mi vestido verde, a todo el campo alegro. ¿Qué soy? Una amapola».

Entretenimiento

«OK, Google, cuéntame un chiste»

«Vale, aquí va: Se abre el telón y se ve un burro; encima, otro burro, y encima de ese, otro burro. Se cierra el telón. ¿Cómo se llama la película? Triburrón».

Fuente: Elaboración propia.

En definitiva, se estima que existen más de 70.000 skills para Alexa en Estados Unidos y más de 1 millón de acciones para Google Assistant. Esta es la razón por la que es importante para las empresas entender las capacidades de adaptación de los dispositivos a la funcionalidad por voz y aprovecharlas al máximo. Es un ciclo que se repite constantemente y hay que saber estar posicionados del lado que permita obtener mayores ventajas.