lunes, 19 de noviembre de 2012

Minería de Datos


Dentro del campo de investigación se está generando un nuevo campo: el Sentiment Analysis (Análisis sentimental) que sirve para ver los comportamientos a través de textos en espacios interactivos como foros o en el mismo Twitter como podemos ver con Twitter Sentiment.
Según wikipedia la minería de texto, a veces denominada como minería de datos de texto, se refiere al proceso de deducir a partir de un texto la información de alta calidad.
La minería de datos habitualmente incluye el proceso de entrada [input] de texto y  la evaluación e interpretación de la salida [output].
 “Alta calidad” en minería de texto usualmente se refiere a alguna combinación de la relevancia, novedad e interés.
Las tareas de minería de texto incluyen la categorización, agrupación de texto, extracción de la entidad, producción de taxonomías granulares, análisis de sentimientos, resumen del documento y modelización de la relación de la entidad.
Las técnicas de minería de texto nos permiten  descubrir redes sociales a partir de documentos publicados en Internet y de comunicación online basada en texto.

Para descubrir redes sociales  a partir de datos textuales se dan los siguientes pasos:
  • §  Descubrimiento del nodo. Se identifican todas las referencias a las personas usando nombres, pronombres y dirección de correo electrónico.
  • §  Correferencia y resolución del alias. Se diferencia entre personas con el mismo nombre y creando una identidad individual para esos múltiples alias.
  • §  Descubrimiento del enlace. Las conexiones sociales están determinadas entre las personas identificadas en los dos primeros pasos.
  • §  Identificación de la relación y del rol. Se identifica los tipos de vínculos y se asignan los roles
Además, el software de minería de texto se puede usar para construir grandes expedientes, puede actuar también con una capacidad similar a un de analista de inteligencia o el bibliotecario de investigación. Se utiliza también en correos electrónicos o filtros de spam.

Referencia:
http://fernandosantamaria.com/blog/2012/01/mineria-de-texto-el-auge-por-el-analisis-textual-y-la-analitica-de-las-interacciones-sociales/

No hay comentarios:

Publicar un comentario