Digital forensic imaging for law enforcement and corporate investigations The increasing diversity, size and sophistication…
BASIS – Rosette Base Linguistics (RBL)
Realice búsquedas en muchos idiomas con alta precisión
Rosette® Base Linguistics (RBL) permite a las aplicaciones empresariales buscar o procesar textos de forma eficaz en muchos idiomas al proporcionar un conjunto completo de servicios lingüísticos. RBL enriquece el texto original en su idioma nativo para el mejor procesamiento de idioma natural de su tipo, mejorando así la velocidad y la precisión.
Funciones morfológicas avanzadas
Analizador Léxico
RBL identifica con precisión y separa cada palabra mediante modelos estadísticos avanzados. El producto de referencia que se obtiene (también conocido como segmentación) minimiza el tamaño del índice, optimiza la precisión de la búsqueda e incrementa la relevancia.
Lematización
RBL encuentra la forma real de diccionario de cada palabra, conocida como lema, usando vocabulario, contexto y análisis morfológico avanzado. La indexación del morfema de base incrementa la relevancia de la búsqueda y reduce el índice de búsqueda al no indexar todas las formas con sus inflexiones. También se ponen a disposición lemas alternos para complementar la indexación.
Descomposición
RBL descompone palabras compuestas en componentes secundarios y remite cada elemento individual para que sea indexado. Esto es especialmente útil para incrementar la relevancia de la búsqueda en idiomas como el alemán y el coreano.
Etiquetado de categorías gramaticales
Como parte del proceso de lematización, se usan modelos estadísticos para determinar la categoría gramatical correcta, incluso de palabras ambiguas. Cada referencia se etiqueta entonces para comprensión optimizada y relevancia de búsqueda.
Extracción de frases nominales
Ciertos sustantivos, especialmente nombres propios, pueden ser confusos al tratar de identificarlos como entidades individuales. RBL agrupa los sustantivos y sus modificadores, lo cual es útil en la agrupación de documentos y extracción de conceptos.
Detección de oraciones
El inicio y fin de cada oración se identifica automáticamente aun cuando el uso del puntaje pudiera ser ambiguo.