- Identificador de textos
-
Un identificador de textos es un programa informático desarrollado para identificar el autor o la fuente de un texto anónimo a través del análisis de su estructura gramatical y sintáctica.
Según Jorge Majfud, la idea del identificador de texto se basa en que
"en el mundo digital no tenemos la caligrafía del escritor ni el golpe de tecla de la máquina de escribir, pero tenemos un rastro inequívoco, si se lo analiza a gran escala: la sintaxis y la gramática que, desde un punto de vista radical, es como las huellas dactilares de cada persona.Como el tono de voz y como cualquier expresión humana, la gramática profunda de cada individuo es casi tan particular como su ADN. No hay en el mundo dos personas que escriban exactamente igual. Por supuesto que en el proceso de investigación y prueba, también consideramos y valoramos la autodeformación deliberada: faltas ortográficas realizadas a posteriori o intencionalmente, desplazamientos forzados de adjetivos o de sustantivos, una duplicación pronominal donde no la había, una variación en el dativo, un complemento indirecto redundante, una voz pasiva en lugar de la activa, eliminación de artículos o abuso de gerundios, de leísmos o de tiempos verbales como el pasado perfecto (más propio de España que de Chile, por ejemplo), adopción de estilos de clases sociales que le son ajenas al autor, etc. No obstante, al igual que aquellos que escribían a mano intentaban deformar su propia letra para crear el anonimato, esta deformación es prácticamente imposible ante los ojos de un experto calígrafo. En el mundo digital no tenemos la ventaja del trazo de la mano en el papel pero, en cambio, poseemos un número de ocurrencias que multiplican varias veces las cartas a mano. Por otro lado, con el uso de una computadora especializada de poder mediano, es posible realizar millones de combinaciones sintácticas y gramaticales. Es aquí que, a partir de un determinado número de textos, la identidad se reconoce con una precisión que no deja dudas. Esta idea puede resultar extraña o compleja, pero es fácil de comprender si recurrimos a una metáfora: si una persona se saca una cantidad X de fotografías y en cada una cubre una parte diferente de su rostro haciendo irreconocible su identidad en cada una de las fotografías, evidentemente basta un numero específico de fotos “enmascaradas” para tener el retrato exacto, desenmascarado, del hombre de las múltiples caras. Un experimento semejante se podría hacer con los diferentes personajes representados por un mismo actor. La combinación no arrojaría ninguno de sus personajes particulares sino el retrato del actor."[1]Referencias
- ↑ «"El identificador de texto"». Alfa.com (05-02-2011). Consultado el 05-02-201.
Enlaces externos
Wikimedia foundation. 2010.