Validación cruzada

Validación cruzada

La validación cruzada o cross-validation, es la práctica estadística de partir una muestra de datos en subconjuntos de tal modo que el análisis es inicialmente realizado en uno de ellos, mientras los otros subconjuntos son retenidos para su uso posterior en la confirmación y validación del análisis inicial.[1] Es una técnica muy utilizada en Inteligencia Artificial para validar los modelos generados a partir de un conjunto de datos o muestra.

La validación simple consiste en dividir en dos conjuntos complementarios los datos de la muestra, usar uno de ellos para construir el modelo (training set) y usar el otro para medir el ratio de error del modelo construido (test set). Por desgracia de esta manera se suele sobrestimar el modelo construido.

La validación cruzada aplica k-veces la validación simple, dividiendo en k conjuntos la muestra (k-fold cross validation). En cada iteración se construirá y evaluará un modelo, usando uno de los conjuntos como test set y el resto como training set. Al final obteniendo la media aritmética de los ratios de error obtenidos conseguiremos el ratio de error para la muestra final.

La elección del valor k dependerá del tamaño y características de la muestra, pero un valor muy utilizado es 10-fold.

Otras técnicas de evaluación
  • Bootstrap
Material Externo


Referencias

  1. Kohavi, Ron (1995). «A study of cross-validation and bootstrap for accuracy estimation and model selection». Proceedings of the Fourteenth International Joint Conference on Artificial Intelligence 2 (12):  pp. 1137–1143. http://www1.cs.columbia.edu/ids/oldwebsite_before_12_2005/library/accest.ps. (Morgan Kaufmann, San Mateo)

Wikimedia foundation. 2010.

Игры ⚽ Нужно решить контрольную?

Mira otros diccionarios:

  • Reactividad cruzada — Saltar a navegación, búsqueda Reactividad cruzada es la reacción entre un antígeno y un anticuerpo que fue generado contra un antígeno diferente pero similar. Por definición, un anticuerpo es específico para un antígeno que lo crea. Sin embargo,… …   Wikipedia Español

  • Relación cuantitativa estructura actividad — Saltar a navegación, búsqueda {La relación cuantitativa estructura actividad (en inglés, Quantitative structure activity relationship, QSAR, o bien, quantitative structure property relationship, QSPR, es el proceso por el cual la estructura… …   Wikipedia Español

  • Cruzado — Saltar a navegación, búsqueda Cruzado, el participio del verbo cruzar, puede referirse a: Lo relativo a la cruz, el símbolo del cristianismo, muy utilizado en heráldica. Los cruzados o caballeros cruzados, los participantes en las Cruzadas.… …   Wikipedia Español

  • David Wechsler — (Lespezi, 12 de enero, de 1896 2 de mayo, de 1981) fue un psicólogo norteamericano. Desarrolló escalas de inteligencia bien conocidas, como la Wechsler Adult Intelligence Scale (WAIS) y la Wechsler Intelligence Scale for Children (WISC).… …   Wikipedia Español

  • Heráldica municipal de Navarra — Armas del rey de Navarra y sus doce linajes de «Ricos Hombres» (Las más importantes baronías de la época) Libro de la Armería del Reino de Navarra siglo: XVI. La heráldica municipal de Navarra (en euskera: Nafarroako udalerrien heraldika) se… …   Wikipedia Español

  • Trabajo social — El trabajo social se define según la Federación Internacional de Trabajadores Sociales[1] y la Asociación Internacional de Escuelas de Trabajo Social (IASSW)[2] como La profesión de trabajo social que promueve el cambio social, la resolución de… …   Wikipedia Español

  • Carbono orgánico total — Saltar a navegación, búsqueda Carbono Orgánico Total (COT; a veces TOC por su nombre en inglés, Total organic carbon) es la cantidad de carbono unido a un compuesto orgánico y se usa frecuentemente como un indicador no específico de calidad del… …   Wikipedia Español

Compartir el artículo y extractos

Link directo
Do a right-click on the link above
and select “Copy Link”