NetOwl es una suite de productos de análisis de texto e identidades multilingües que analiza big data en forma de datos de texto (informes, web, medios sociales, etc.) así como datos estructurados de entidades sobre personas, organizaciones, lugares y cosas.

NetOwl
Tipo negocio
Industria Software
Sede central Chantilly (Estados Unidos)
Productos NetOwl Extractor, NetOwl NameMatcher, NetOwl EntityMatcher, NetOwl TextMiner
Sitio web https://www.netowl.com/

NetOwl utiliza enfoques basados en la inteligencia artificial (IA), incluidos el procesamiento del lenguaje natural (NLP), el aprendizaje automático (ML) y la lingüística computacional, para extraer entidades, relaciones y eventos; realizar análisis de sentimientos; asignar latitud/longitud a las referencias geográficas en el texto; traducir nombres escritos en idiomas extranjeros; realizar la coincidencia de nombres y la resolución de identidades.[1][2][3]​ Los usos de NetOwl incluyen búsqueda y descubrimiento semánticos,[4]​ análisis geoespacial,[5]​ el análisis de inteligencia,[6]​ el enriquecimiento de contenidos,[7]​ la supervisión del cumplimiento de la normativa,[8]​ la supervisión de las ciberamenazas,[9]​ la gestión de riesgos[10]​ y la bioinformática.[11]

Historia

editar

El primer producto de NetOwl fue NetOwl Extractor, que se lanzó inicialmente en 1996.[12]​ Desde entonces, Extractor ha añadido muchas capacidades nuevas, como la extracción de relaciones y eventos, la categorización, la traducción de nombres, el geoetiquetado y el análisis de sentimientos, así como la extracción de entidades en otros idiomas. Posteriormente se añadieron otros productos a la suite NetOwl, concretamente TextMiner, NameMatcher y EntityMatcher.

NetOwl ha participado en varios eventos de evaluación comparativa de software de análisis de textos y entidades patrocinados por terceros. NetOwl Extractor fue el sistema de extracción de entidades con nombre mejor valorado en la Conferencia de Comprensión de Mensajes MUC-6 patrocinada por DARPA y el sistema de extracción de enlaces y eventos mejor valorado en MUC-7.[13][14]​ También fue el sistema con mayor puntuación en varias de las tareas de evaluación de extracción automática de contenidos (ACE) patrocinadas por el NIST.[15]​ NetOwl NameMatcher fue el sistema mejor valorado en el MITRE Challenge for Multicultural Person Name Matching.[1]

Productos

editar

La suite NetOwl incluye, entre otros, los siguientes productos de análisis de textos y entidades:

Análisis de texto

editar

NetOwl Extractor realiza la extracción de entidades de textos no estructurados mediante procesamiento de lenguaje natural (NLP), aprendizaje automático (ML) y lingüística computacional. Extractor también realiza la extracción de relaciones semánticas y eventos, así como el geoetiquetado de textos.[3][5]​ Se utiliza para una variedad de fuentes de datos que incluyen tanto fuentes tradicionales (por ejemplo, noticias, informes, páginas web, correo electrónico) como medios sociales (por ejemplo, Twitter, Facebook, chats, blogs).[8]​ Se ejecuta en una variedad de plataformas de análisis de Big Data, incluyendo Apache Hadoop y la tecnología High-Performance Computer Cluster (HPCC) de LexisNexis.[7]​ Se ha integrado con varias herramientas analíticas de terceros, como Esri ArcGIS y Google Earth/Maps.[5]

Análisis de identidad

editar

NetOwl NameMatcher y EntityMatcher realizan la coincidencia de nombres y la resolución de identidades para grandes bases de datos de entidades multiculturales y multilingües utilizando enfoques de aprendizaje automático (ML) y lingüística computacional.[1][2]​ Se utilizan para aplicaciones como antilavado de dinero (AML), listas de vigilancia, cumplimiento normativo, detección de fraude, etc.

Véase también

editar

Referencias

editar
  1. a b c "SRA International." Washington Post. Retrieved 2013-07-02.
  2. a b Zelenko, Dmitry, and Chinatsu Aone. “Discriminative Methods for Transliteration.” In Proceedings of 2006 Conference Empirical Applications of Natural Language Processing (2006). Retrieved 2013-05-20.
  3. a b Maybury, Mark (2012). Multimedia Information Extraction, Hoboken, New Jersey: John Wiley & Sons, Inc., p. 18. Retrieved 2013-07-02.
  4. Jackson, Peter; Moulinier, Isabelle (2002). Natural Language Processing for Online Applications: Text Retrieval, Extraction, and Categorization, Philadelphia: John Benjamins B.V., p. 117, ISBN 90-272-4989-X. Retrieved 2013-07-02.
  5. a b c Smith, Susan. “Notes from the GEOINT 2007 Symposium.” GISCafe (2007-10-29). Retrieved 2013-07-02.
  6. Indurkhya, Nitin et al. (2005). Text Mining: Predictive Methods for Analyzing Unstructured Information, New York: Springer, p. 154-155, ISBN 0-387-95433-3. Retrieved 2013-07-02.
  7. a b Guess, Angela (2012-01-19). "LexisNexis Releases New Version of Lexis Advance". semanticweb.com. Retrieved 2013-07-28.
  8. a b Aone, Chinatsu, et al. “Assentor®: an NLP-based Solution to E-mail Monitoring.” In Proceedings of the Seventeenth National Conference on Artificial Intelligence and Twelfth Conference on Innovative Applications of Artificial Intelligence (2000), pp. 945-540. Retrieved 2013-05-20.
  9. "SRA’s Dusty Rhoads and Jim McClave: How to strengthen your company’s cybersecurity". ExecutiveBiz (2009-07-02). Retrieved 2013-08-06.
  10. “Nasdaq on the prowl.” CNN Money (1997-09-17). Retrieved 2013-07-02.
  11. Zaremba, Sam, et al. “Text-mining of PubMed abstracts by natural language processing to create a public knowledge base on molecular mechanisms of bacterial enteropathogens.” BMC Bioinformatics, 10:177 (2009-06-10). Retrieved 2013-05-20.
  12. Hudgins-Bonafield, Christine. “Filtering Knowledge On The Net Just Got Simpler.” Archivado el 30 de marzo de 2003 en Wayback Machine. NetWork Computing (1996-05-31). Retrieved 2013-09-03.
  13. Aone, Chinatsu, et al. "SRA: Description Of The IE2 System Used For MUC-7." Archivado el 9 de diciembre de 2006 en Wayback Machine. In Proceedings of the 7th Message Understanding Conference (1998). Retrieved 2013-05-20.
  14. Sundheim, Beth M. "Overview of Results of the MUC-6 Evaluation." Archivado el 12 de diciembre de 2006 en Wayback Machine. In Proceedings of the 6th Conference on Message Understanding (1995), pp. 13-31. Retrieved 2013-05-20.
  15. The ACE 2005 (ACE'05) Evaluation Plan. Retrieved 2013-05-20.

Enlaces externos

editar