Ultimas Noticias

Xiaomi ha lanzado un modelo de IA por voz. No es para móviles, es para la guerra de los coches

Xiaomi fue una de las primeras marcas en anunciar un asistente de voz con IA para sus móviles, aunque es poco conocido porque solamente funciona en China. Siete años después, el gigante asiático ha anunciado un nuevo modelo de IA por voz, pero esta vez su enfoque no está en los móviles, sino en los coches y el hogar conectado.

MiDashengLM-7B. Xiaomi ha bautizado a su nuevo modelo con este nombre tan poco atractivo y difícil de recordar. Está compuesto por dos partes clave: el codificador de audio con IA Dasheng  y el decodificador de Alibaba Qwen2.5-Omni-7B. Combinados, el sistema es capaz de reconocer no sólo nuestra voz, también sonidos ambientales, música y ruido de fondo. Xiaomi presume de que ofrece un “rendimiento de primer nivel en 22 benchmarks públicos”. En concreto, ha superado a Whisper de OpenAI en tareas de comprensión de audio no verbal.

En el coche. Xiaomi ya ha encontrado 30 aplicaciones de su nuevo modelo de voz para distintos productos. El control por voz comprende el entorno acústico y responde acorde al contexto, por ejemplo si hay un sonido inusual en el coche. También han pensado en una función que nos ayuda a mejorar la pronunciación para aprender idiomas mientras conducimos y la posibilidad de “despertar” al coche con la voz antes incluso de que entremos en el habitáculo. Su capacidad para detectar sonidos anómalos también lo hace útil desde el punto de vista de la seguridad, tanto del coche con un modo antirrobo más potente, como en el hogar a través de altavoces inteligentes.

En el hogar. El nuevo modelo  posibilita la activación de funciones inteligentes mediante sonidos, como por ejemplo que se enciendan las luces al aplaudir o que se apague el aire acondicionado cuando salimos por la puerta, sin tener que pedírselo con la voz. Xiaomi asegura que su sistema tiene una latencia muy baja y una gran capacidad de procesamiento en paralelo, lo que le permite funcionar en dispositivos con escasos recursos, como cámaras o altavoces, y mantener un buen rendimiento en entornos con muchos dispositivos conectados como una casa.

Código abierto. China ha elegido el bando del open-source en la carrera de la IA y el nuevo modelo de voz Xiaomi sigue la línea. MiDashengLM-7B es de código abierto y opera bajo licencia Apache 2.0, que permite el uso comercial y libre modificación. Eso abre la puerta a su uso por parte de otros desarrolladores y también en el ámbito académico. Además, Xiaomi ha hecho públicos todos los datos que se han usado para el entrenamiento  del modelo. El objetivo es claro: atraer a la comunidad de desarrolladores y que su ecosistema de audio se convierta en estándar, fortaleciendo su posición competitiva.

Experiencia conversacional. La industria del automóvil está dando un giro en el que el software se posiciona como el factor diferenciador  número uno. Ya no es sólo si corre más o lo cómodo que sea de conducir, son los sistemas de conducción autónoma, la interfaz de su pantalla y especialmente el control por voz. Según este estudio, los asistentes de voz con IA serán un estándar en los coches para 2033. Quien tenga la mejor experiencia conversacional tendrá una clara ventaja y Xiaomi ha dado un paso importante en esta dirección.

Imagen de portada | Xataka con iconos de zky.icon

En Xataka | Xiaomi sigue perdiendo dinero con sus coches eléctricos… pero están siendo su mayor acierto

source

Mostrar más
Botón volver arriba