- KNIME
-
KNIME Desarrollador KNIME.com GmbH
knime.orgInformación general Última versión en pruebas 2.3.3
16 de marzo de 2011Género Minería de datos Sistema operativo Multiplataforma; funciona al menos en Linux, Windows, Mac OSX y cualquier S.O. que soporte máquina virtual Java Plataforma Java Licencia GPL Estado actual En producción En español KNIME (o Konstanz Information Miner) es una plataforma de minería de datos que permite el desarrollo de modelos en un entorno visual. Está construido bajo la plataforma Eclipse.
Contenido
Historia
Fue desarrollado originalmente en el departamento de bioinformática y minería de datos de la Universidad de Constanza, Alemania, bajo la supervisión del profesor Michael Berthold. En la actualidad, la empresa KNIME.com GmbH, radicada en Zúrich, Suiza, continúa su desarrollo además de prestar servicios de formación y consultoría.
Características
KNIME está desarrollado sobre la plataforma Eclipse y programado, esencialmente, en java. Está concebido como una herramienta gráfica y dispone de una serie de nodos (que encapsulan distintos tipos de algoritmos) y flechas (que representan flujos de datos) que se despliegan y combinan de manera gráfica e interactiva.
Los nodos implementan distintos tipos de acciones que pueden ejecutarse sobre una tabla de datos:
- Manipulación de filas, columnas, etc., como muestreos, transformaciones, agrupaciones, etc.
- Visualización (histogramas, etc.).
- Creación de modelos estadísticos y de minería de datos, como árboles de decisión, máquinas de vector soporte, regresiones, etc.
- Validación de modelos, como curvas ROC, etc.
- Scoring o aplicación de dichos modelos sobre conjuntos nuevos de datos.
- Creación de informes a medida gracias a su integración con BIRT.
El carácter abierto de la herramienta hace posible su extensión mediante la creación de nuevos nodos que implementen algoritmos a la medida del usuario. Además, existe la posibilidad de utilizar de llamar directa y transparentemente a Weka y o de incorporar de manera sencilla código desarrollado en R o python/jython.
KNIME integra diversos componentes para aprendizaje automático y minería de datos a través de su concepto de fraccionamiento de datos (data pipelining) modular. La interfaz gráfica de usuario permite el montaje fácil y rápido de nodos para preprocesamiento de datos (ETL: extracción, transformación, carga), para el análisis de datos y modelado y visualización. KNIME es desde 2006 utilizado en la investigación farmacéutica,[1] pero también se utiliza en otras áreas, como: análisis de datos de cliente de CRM, inteligencia de negocio y análisis de datos financieros.
Licencia y soporte
KNIME es una herramienta de código abierto que puede ser descargada y utilizada gratuitamente bajo los términos de la licencia GPLv3 con una excepción que permite que otros usuarios utilicen el bien definido nodo de API para añadir extensiones de propiedad[2] Esto también permite a los proveedores comerciales de software agregar envolturas enlazando sus herramientas hacia KNIME.
La compañía que lo desarrolla ofrece, adicionalmente, la posibilidad de contratar servicios de soporte en varios niveles, además de brindar servicios de consultoría y formación.
Referencias
- ↑ Abhishek Tiwaria and Arvind K.T. Sekhar: Workflow based framework for life science informatics, Computational Biology and Chemistry, Volume 31, Issues 5–6, Pages 305–319, Elsevier, October 2007.
- ↑ KNIME 2.1.0 lanzado (released, en inglés)
Véase también
- Portal:Software libre. Contenido relacionado con Software libre.
- Weka - algoritmos de aprendizaje automático que se pueden integrar en KNIME
- Environment for DeveLoping KDD-Applications Supported by Index-Structures - marco de minería de datos con muchos algoritmos de agrupamiento (clustering)
Enlaces externos
- (en inglés) Sitio web oficial
- (en inglés) KNIME Labs
- Primeros pasos con Knime, por marce hernandez
- (en inglés) proyecto Eclipse
- (en inglés) KNIME y principiantes
- (en inglés) KNIME para quimioinformática
- (en inglés) Extensiones Schrödinger para KNIME
Categorías:- Paquetes de software estadístico
- Minería de datos
- Software libre programado en Java
Wikimedia foundation. 2010.