Word Error Rate
WER (del inglés Word Error Rate) es una medida comúnmente utilizada en la evaluación de sistemas de reconocimiento del habla o de traducción automática.
Concepto
editarCalcula el número mínimo de inserciones, borrados y sustituciones de una palabra por otra, necesarios para transformar una frase en otra. Esta medida se basa en la distancia de edición o distancia de Levenshtein, con la salvedad de que esta última se calcula a nivel de letra y WER lo hace a nivel de palabra.
En tareas tanto de traducción automática como de reconocimiento del habla, se calcula WER entre la frase generada por el sistema y una frase de referencia correcta.
donde
- S es el número de sustituciones,
- B es el número de borrados,
- I es el número de inserciones,
- N es el número de palabras que tiene la frase de referencia.
Para hallar el valor mínimo de WER entre dos frases se utiliza un algoritmo de programación dinámica.
Si consideramos que son las primeras palabras de la frase generada y las primeras de la frase de referencia:
donde es 1 si las palabras y son diferentes y 0 si son iguales.