La popularidad de las interfaces de voz ha crecido enormemente permitiendo la interacción con una amplia variedad de dispositivos. El éxito de estas interfaces depende de la eficiencia del detector de palabra clave, que es el responsable de identificar una palabra específica que permite iniciar la comunicación usuario-dispositivo. Al detectar la palabra, el dispositivo empieza a atender a la petición del usuario, lo que permite una interacción fluida y sin interrupciones.
La precisión y la velocidad de detección determinan la usabilidad y efectividad de las interfaces. Por ello, el equipo de Digital Life Disruption Lab ha presentado en el Deep Learning Barcelona Symposium 2023 una propuesta para una detección precisa aprovechando la fuerza de diferentes clasificadores. Concretamente, la información de entrada se analiza con modelos basados en diferentes tecnologías y posteriormente la decisión final se toma considerando las salidas de todos los modelos. Además, proponen la detección en dos fases, siendo la primera fase ligera y permitiendo una reacción rápida a la petición del usuario, mientras que la segunda fase es la detección basada en conjuntos de clasificadores, permitiendo así una verificación precisa.
Detección de palabras clave empleando conjuntos de clasificadores

Tiempo de lectura: 1 min
Contenidos relacionados
Medios de comunicación
Contacta con nuestro departamento de comunicación o solicita material adicional.






