|
|
Ils constituent le cœur technologique de la plate forme de développement sémantique LINGWAY KM et ont nécessité plus d’une centaine d’année-homme de développement. En savoir plus sur le Traitement Automatique de la Langue (TAL) 1- Ressources et services linguistiques Ensemble de ressources et de services linguistiques (dictionnaires et grammaires électroniques), dont un dictionnaire multilingue de 60 000 mots représentant 150 000 concepts et de puissants services linguistiques d'analyse automatique de la langue (reconnaissance des mots à partir de leurs différentes formes, reconnaissance des mots composés, reconnaissance du sens des mots, expansion de synonymes, identification de groupes de mots ...). En savoir plus 2- Recherche sémantique multilingue Ce composant de recherche sémantique multilingue en "texte intégral" est basé sur l'indexeur "Open Source" Lucène. Il peut être utilisé de manière autonome, mais peut également être interfacé avec tout indexeur en "texte intégral" disposant d'un langage de recherche booléen (Des connecteurs sont notamment disponibles pour Exalead, Hummingbird et Oracle). Ce composant interprète les questions en langage naturel et les traduit en requêtes booléennes adaptées à l'indexeur sous-jacent, ce qui permet de réduire le silence et le bruit, facilite l'accès à tous les documents répondant à une question et permet à des non spécialistes d'accéder à l'information. 3- Recherche et catégorisation Ce composant de recherche et de catégorisation de phrases, questions ou énoncés courts, verbatims par exemple, permet de classer plus rapidement une information dans une nomenclature métier (Classification Internationale des Brevets, par exemple). 4- Analyse et structuration de textes Ce composant permet la transformation d'un texte quelconque en une structure XML enrichie par des marqueurs indiquant la structure générale d'un texte, repérant des entités nommées (personnes, organisations, produits, lieux, …), des index thématiques (descripteurs libres ou contrôlés), ou encore des phrases importantes sous un point de vue donné, pour en faciliter la lecture. Il permet également de constituer une base des données extraites. Ce composant permet également de produire une indexation automatique conforme à la norme Dublin Core du W3C. Il est notamment très utile dans des projets de reprises de sites Intranet anciens que l'on veut mettre dans de nouveaux formats plus modernes. 5- Recherche approximative Ce composant permet l'accès à une liste de noms ou de libellés en orthographe approximative : correction d'erreurs typographiques, phonétique, de soudure ou de coupure. Il permet de trouver plus vite l’information dans un site de commerce électronique par exemple. |
|||
| > Présentation |
| > Clients |
| > Partenaires |
| > Documentation |
| > FAQ |
| > Démonstrations |
| > Presse |
|
||



