Web mining

Web mining

El Web mining o Webmining es una metodología de recuperación de la información que usa herramientas de la minería de datos para extraer información tanto del contenido de las páginas, de su estructura de relaciones (enlaces) y de los registro de navegación de los usuarios.

Contenido

Tipos de minería de la Web

Web mining - es la aplicación de técnicas de minería de datos para descubrir los patrones de la Web. De acuerdo a los objetivos de análisis, la minería web se puede dividir en tres tipos diferentes, que son la minería de uso de la Web, minería del contenido de la Web y minería de la estructura de la Web.

En este sentido podemos definir el Web mining en tres variantes:

  1. Minería del contenido de la Web, o Web Content Mining;
  2. Minería de la estructura de la Web, o Web Structure Mining;
  3. Minería de los registro de navegación en la Web, o Web Usage Mining.

Minería del uso de la Web

La minería del uso de la Web es un proceso de extracción de información útil a partir de los registros del servidor, es decir, del historial de los usuarios. La minería del uso de la Web es el proceso de descubrir lo que los usuarios buscan en Internet. Algunos usuarios pueden estar mirando sólo los datos textuales, mientras que otros pueden estar interesados en los datos multimedia.

Minería del contenido de la Web

Minería del contenido de la Web es el proceso de descubrir información útil de texto, imagen, audio o datos de vídeo en la web. La minería de contenido web a veces se llama la minería de textos web, porque el contenido del texto es la zona más ampliamente investigado. Las tecnologías que se utilizan normalmente en la minería de contenido web son PNL (procesamiento de lenguaje natural) e IR (recuperación de información). Aunque la minería de datos es un término relativamente nuevo, la tecnología no lo es. Las empresas han utilizado los ordenadores de gran alcance para tamizar a través de volúmenes de datos de escáner de supermercados y analizar los informes de investigación de mercado durante años. Sin embargo, las continuas innovaciones en el poder, equipo de procesamiento, almacenamiento en disco y software de estadística están aumentando drásticamente la precisión de análisis, mientras reduciendo el coste.

Minería de la estructura de la Web

Minería de la estructura de la Web es el proceso de utilización de la teoría de grafos para analizar el nodo y la estructura de conexión de un sitio web. Según el tipo de web de los datos estructurales, estructura de minería de la Web se pueden dividir en dos tipos:

  • El primer tipo es la extracción de patrones a partir de hipervínculos de la web. Un hipervínculo es un componente estructural que conecta a la página web en una ubicación diferente.
  • El otro tipo es la minería de la estructura del documento. Se está utilizando la estructura de árbol para analizar y describir el HTML (Hyper Text Markup Language) o XML (eXtensible Markup Language) tags dentro de la página web.

Pros y contras Web mining

Pros

Web Mining esencialmente tiene muchas ventajas que hace que esta tecnología atractiva para las sociedades, incluidas las agencias de gobierno. Esta tecnología ha permitido que el comercio electrónico para hacer marketing personalizado, que finalmente resulta en mayores volúmenes de comercio. Las agencias gubernamentales están utilizando esta tecnología para clasificar las amenazas y la lucha contra el terrorismo. La capacidad de predicción de la aplicación de la minería puede beneficia a la sociedad mediante la identificación de actividades delictivas. Las compañías pueden establecer una relación mejor atención al cliente, dándoles exactamente lo que necesitan. Las empresas pueden entender las necesidades del cliente mejor y pueden reaccionar a las necesidades del cliente más rápido. Las empresas pueden encontrar, atraer y retener a los clientes, ya que pueden ahorrar en los costes de producción mediante la utilización de la visión adquirida de los requisitos del cliente. Se puede aumentar la rentabilidad de fijación de precios objetivo sobre la base de los perfiles creados. Incluso se puede encontrar el cliente que podría defecto a un competidor de la compañía tratará de retener al cliente ofreciendo ofertas promocionales a los clientes específicos, reduciendo así el riesgo de perder un cliente.

Contras

Web mining la tecnología en sí misma no crea problemas, pero esta tecnología cuando se utiliza en los datos de carácter personal puede causar problemas. La cuestión ética más criticada sobre el uso de Web Mining es la invasión de la privacidad. La privacidad se considera perdida cuando la información relativa a una persona se obtiene, se usa o difusión, especialmente si esto ocurre sin su conocimiento o consentimiento. Los datos obtenidos serán analizados, y agrupados para formar perfiles, los datos serán anónimos antes de la agrupación a fin de que ningún individuo pueda ser vinculado directamente a un perfil. Pero por lo general los perfiles de grupo se utilizan como si fueran perfiles personales. Así, estas aplicaciones de individualizar a los usuarios de juzgar por sus clics del ratón. De-la individualización, se puede definir como una tendencia de juzgar y tratar a las personas sobre la base de las características del grupo en lugar de en sus propias características individuales y el fondo. Otra preocupación importante es que las empresas de recogida de los datos para un propósito específico podrían utilizar los datos para un fin totalmente distinto, y esto viola fundamentalmente los intereses del usuario. La tendencia creciente de la venta de datos personales como una mercancía alienta a propietarios de sitios web para el comercio de datos personales obtenidos de su sitio. Esta tendencia ha aumentado la cantidad de datos capturados y comercializados aumenta las posibilidades de la vida privada de ser invadido. Las empresas que compran los datos tienen la obligación de hacer que el anonimato y que estas empresas se consideran autores de cualquier versión específica de los patrones de la minería. Son legalmente responsables de los contenidos de la liberación; cualquier inexactitud en la publicación resultará en demandas serias, pero no hay ninguna ley que les impide el comercio de los datos. Algunos de los algoritmos de minería podrían utilizar los atributos de polémica como el sexo, raza, religión u orientación sexual a categorizar a los individuos. Estas prácticas pueden ser en contra de la legislación contra la discriminación. Las aplicaciones hacen que sea difícil identificar el uso de tales atributos polémicos, y no hay ninguna norma firme contra el uso de algoritmos de este tipo con tales atributos. Este proceso podría resultar en una denegación de servicio o un privilegio a una persona basándose en su raza, religión u orientación sexual, ahora esta situación puede evitarse con los altos estándares éticos gestionados por la empresa de minería de datos. Los datos recogidos son en forma anónima para que, los datos obtenidos y los patrones obtenidos no se puedan remontar a un individuo. Puede parecer como si esto no plantea ninguna amenaza a la vida privada, en realidad muchos de información adicional se puede deducir por la aplicación de la combinación de dos datos por separado sin escrúpulos por parte del usuario.

Véase también

Enlaces externos


Wikimedia foundation. 2010.

Игры ⚽ Поможем сделать НИР

Mira otros diccionarios:

  • Web mining — is the application of data mining techniques to discover patterns from the Web. According to analysis targets, web mining can be divided into three different types, which are Web usage mining, Web content mining and Web structure mining.Web usage …   Wikipedia

  • Web-Mining — Unter Web Mining versteht man die Übertragung von Techniken des Data Mining zur (teil)automatischen Extraktion von Informationen aus dem Internet, speziell dem World Wide Web. Web Mining übernimmt Verfahren und Methoden aus den Bereichen… …   Deutsch Wikipedia

  • Web Mining — Unter Web Mining (web mining) auch Webmining versteht man die Übertragung von Techniken des Data Mining zur (teil)automatischen Extraktion von Informationen aus dem Internet, speziell dem World Wide Web. Webmining übernimmt Verfahren und Methoden …   Deutsch Wikipedia

  • Web-Forschung — bezeichnet die empirische und methodische Forschung über oder mit Hilfe des Internets. Sie weist dabei drei Hauptbezüge auf: Internet als Gegenstand Internet als Medium Internet als Methode Inhaltsverzeichnis 1 Begriffliche Abgrenzung 2… …   Deutsch Wikipedia

  • Web Scraping — Der Begriff Screen Scraping (engl., etwa: „Bildschirm auskratzen“) umfasst generell alle Verfahren zum Auslesen von Texten aus Computerbildschirmen. Gegenwärtig wird der Ausdruck jedoch beinahe ausschließlich in Bezug auf Webseiten verwendet… …   Deutsch Wikipedia

  • Mining in South Africa — has been the main driving force behind the history and development of Africa s most advanced and richest economy. Large scale and profitable mining started with the discovery of a diamond on the banks of the Orange River in 1867 by Erasmus Jacobs …   Wikipedia

  • Mining in Egypt — has had a long history that goes back to predynastic times. Egypt has substantial mineral resources, including 48 million tons of tantalite (fourth largest in the world), 50 million tons of coal, and an estimated 6.7 million ounces of gold in the …   Wikipedia

  • Mining in Cornwall — first began in the early Bronze Age approximately 2,150 BC and ended with the South Crofty tin mine closing in 1998.HistoryMining in Cornwall has existed from the early Bronze Age around 2,150 B.C. Cornwall is thought to have been visited by… …   Wikipedia

  • Web 3.0 — is one of the terms used to describe the evolutionary stage of the Web that follows Web 2.0. Given that technical and social possibilities identified in this latter term are yet to be fully realised the nature of defining Web 3.0 is highly… …   Wikipedia

  • Mining industry of Ghana — accounts for 5% of the country s GDP and minerals make up 37% of total exports, of which gold contributes over 90% of the total mineral exports. Thus, the main focus of Ghana s mining and minerals development industry remains focused on gold.… …   Wikipedia

Compartir el artículo y extractos

Link directo
Do a right-click on the link above
and select “Copy Link”