Descubre cómo Google DeepMind está revolucionando la inteligencia artificial con un equipo de voces sorprendentes en Gemini

hace 6 días

La inteligencia artificial basada en voz está en plena expansión, transformando la forma en que interactuamos con la tecnología. Con la reciente incorporación del equipo de Hume AI a Google DeepMind, el futuro de la comunicación entre humanos y máquinas se vuelve cada vez más emocionante y prometedor. ¿Cómo afectará esto nuestra vida cotidiana y el mercado en general? Vamos a desglosarlo.

Índice
  1. Aspectos clave: Google, Hume AI y la carrera por la inteligencia de voz
  2. Google DeepMind integra el equipo de Hume AI para avanzar en Gemini
  3. Hume AI continúa operando de manera independiente
  4. Reconocimiento de voz y emociones como un enfoque estratégico
  5. Un patrón creciente de adquisiciones centradas en el talento
  6. Impulso de la industria hacia la IA de voz
  7. Preguntas y respuestas: Google, Hume AI y el desarrollo de IA centrada en la voz
  8. Lo que esto implica: la voz como interfaz de alto riesgo para plataformas de IA
  9. Fuentes:

Aspectos clave: Google, Hume AI y la carrera por la inteligencia de voz

El acuerdo entre Google y Hume AI resalta la creciente importancia de la inteligencia de voz en el panorama tecnológico actual. A continuación, algunos puntos esenciales:

  • Incorporación de talento: Google DeepMind ha traído a bordo a Alan Cowen, CEO de Hume AI, junto con un equipo de ingenieros destacados bajo un acuerdo de licencia.
  • Colaboración estratégica: Hume AI continuará operando de manera independiente, lo que les permitirá seguir proporcionando su tecnología a otras empresas de inteligencia artificial.
  • Licencia no exclusiva: Google tiene derechos de uso sobre ciertas tecnologías de Hume AI, lo que permitirá una integración sin perder la independencia de la startup.
  • Enfoque en la voz y emociones: La carrera por desarrollar sistemas de IA que comprendan la voz y las emociones es cada vez más intensa entre las principales plataformas de IA.
  • Patrón de adquisiciones de talento: Este movimiento se inscribe en una tendencia más amplia en la que empresas de IA prefieren adquirir talento en lugar de realizar adquisiciones completas.

Google DeepMind integra el equipo de Hume AI para avanzar en Gemini

El acuerdo permite que Alan Cowen y su equipo se concentren en el desarrollo de las capacidades de voz de Gemini, un área en la que Google ha estado invirtiendo significativamente. Esta colaboración está diseñada para mejorar la interacción del usuario al hacer que las máquinas puedan entender mejor la comunicación humana.

Los detalles financieros del acuerdo no se han hecho públicos, pero se ha confirmado que Google obtendrá derechos no exclusivos sobre ciertas tecnologías de Hume AI, lo que les permitirá integrarlas en sus procesos internos.

Hume AI continúa operando de manera independiente

A pesar de la salida de su CEO y varios ingenieros clave, Hume AI seguirá funcionando como una empresa autónoma. Esto significa que continuarán desarrollando y ofreciendo su tecnología a otras compañías de inteligencia artificial. Según Ettinger, el nuevo CEO, la empresa tiene planes de lanzar nuevos modelos en los próximos meses y espera generar $100 millones en ingresos este año.

Hasta la fecha, Hume AI ha recaudado cerca de $80 millones y su intención es mantener su papel en el ecosistema de IA, lo que podría tener implicaciones significativas para el desarrollo de tecnologías de reconocimiento emocional en México y otros países.

Reconocimiento de voz y emociones como un enfoque estratégico

Hume AI se ha destacado por sus modelos de voz emocionalmente conscientes, que son capaces de interpretar estados de ánimo y emociones a través de la voz. En 2024, lanzaron su Empathetic Voice Interface, un sistema de IA conversacional diseñado para responder con inteligencia emocional.

Por su parte, Google ha estado mejorando sus propios esfuerzos en el ámbito de la voz, implementando la función Gemini Live, que permite conversaciones habladas con su chatbot. Recientemente, han lanzado un modelo de audio nativo para el API de Gemini, mejorando así su capacidad para gestionar flujos de trabajo más complejos impulsados por voz.

Un patrón creciente de adquisiciones centradas en el talento

El acuerdo con Hume AI se enmarca en una tendencia más amplia en la que las empresas de inteligencia artificial prefieren adquirir equipos de talento en lugar de comprar startups completas. Este fenómeno ha sido observado con otras empresas, como Google y OpenAI, que también han realizado movimientos similares en el pasado reciente.

La Comisión Federal de Comercio (FTC) de EE. UU. ha comenzado a examinar más de cerca estas transacciones, que permiten a las grandes empresas absorber talento especializado mientras evitan el escrutinio regulatorio que conlleva una adquisición tradicional.

Impulso de la industria hacia la IA de voz

Grandes jugadores en el campo de la inteligencia artificial, como OpenAI y Meta, también están invirtiendo fuertemente en capacidades de voz. OpenAI está desarrollando nuevos modelos de audio para un dispositivo personal de audio que espera lanzar pronto, mientras que Meta ha acelerado su estrategia de audio mediante la adquisición de Play AI y la expansión de características de voz en sus gafas inteligentes Ray-Ban.

El interés en la IA de voz sigue en aumento. Por ejemplo, ElevenLabs, una compañía de generación de voz AI, ha reportado un ingreso recurrente anual de más de $330 millones, lo que indica un creciente interés tanto a nivel empresarial como de consumidores por sistemas impulsados por voz.

Preguntas y respuestas: Google, Hume AI y el desarrollo de IA centrada en la voz

Q: ¿Qué está adquiriendo Google de Hume AI?
A: Google está incorporando a Alan Cowen y varios ingenieros clave de Hume AI bajo un acuerdo de licencia, en lugar de adquirir la compañía completa.

Q: ¿Seguirá Hume AI operando?
A: Sí. Hume AI continuará funcionando de manera independiente y seguirá licenciando su tecnología a otras empresas de inteligencia artificial.

Q: ¿Qué tecnologías está licenciando Google?
A: Google ha recibido derechos no exclusivos sobre ciertas tecnologías de Hume AI, aunque no se han revelado detalles específicos.

Q: ¿Por qué las empresas de IA están buscando acuerdos de "acqui-hire"?
A: Estas transacciones permiten a las empresas incorporar talento especializado rápidamente, evitando el escrutinio regulatorio asociado con adquisiciones completas.

Lo que esto implica: la voz como interfaz de alto riesgo para plataformas de IA

Este acuerdo no solo se trata de añadir características de voz a Gemini; refleja cómo la voz se está convirtiendo en una interfaz central para la próxima fase de interacción con la IA. Con la evolución de los sistemas de IA, la capacidad de escuchar, interpretar el tono y responder adecuadamente se vuelve crucial para la usabilidad y la confianza del usuario.

Los sistemas de voz emocionalmente conscientes pueden influir en la comodidad de los usuarios al interactuar con la IA en tiempo real, especialmente en situaciones donde escribir no es práctico. Para los desarrolladores, la voz se está estableciendo como una capa competitiva que puede diferenciar a los asistentes que parecen útiles de aquellos que solo son transaccionales.

Además, este acuerdo destaca cómo las grandes plataformas de IA están compitiendo menos por el acceso a datos y más por el talento especializado. Al incorporar equipos con experiencia en reconocimiento de voz y emociones, como lo hace Google, están priorizando capacidades centradas en el ser humano que son difíciles de replicar rápidamente.

A medida que los dispositivos, wearables y asistentes de voz continúan evolucionando, la habilidad para entender no solo qué se dice, sino cómo se dice, podría ser el factor determinante en qué sistemas de IA se integren de manera natural en la vida cotidiana de los usuarios.

Fuentes:

Nota del editor: Este artículo fue creado por Alicia Shapiro, CMO de AiNews.com, con apoyo en redacción, imágenes y generación de ideas de ChatGPT, un asistente de IA. Sin embargo, la perspectiva final y las decisiones editoriales son únicamente de Alicia Shapiro. Agradecimientos especiales a ChatGPT por su asistencia en la investigación y apoyo editorial en la elaboración de este artículo.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Subir