- Word Error Rate
-
WER es una medida comunmente utilizada en la evaluación de sistemas de reconocimiento del habla o de traducción automática.
Calcula el número mínimo de inserciones, borrados y sustituciones de una palabra por otra, necesarios para transformar una frase en otra. Esta medida se basa en la distancia de edición o de Levensthein, con la salvedad de que esta última se calcula a nivel de letra y WER lo hace a nivel de palabra.
En tareas tanto de traducción automática como de reconocimiento del habla, se calcula WER entre la frase generada por el sistema y una frase de referencia correcta.
donde
- S es el número de sustituciones,
- B es el número de borrados,
- I es el número de inserciones,
- N es el número de palabras que tiene la frase de referencia.
Para hallar el valor mínimo de WER entre dos frases se utiliza un algoritmo de programación dinámica.
Si consideramos que t1,t2...,tn son las primeras i palabras de la frase generada y r1,r2...rn las r primeras de la frase de referencia:
donde Δ(i,j) es 1 si las palabras ti y rj son diferentes y 0 si son iguales.
Wikimedia foundation. 2010.