Technologie Eptica Lingway

Eptica Lingway conçoit une technologie de Traitement Automatique du Langage Naturel (TALN) à la pointe de l’innovation en matière de recherche et d’analyse sémantique.

Grâce à son moteur de recherche intelligent basé sur un traitement automatique du Langage Naturel, la technologie Eptica Lingway offre le plus haut niveau de pertinence du marché. Il s’appuie sur un lexique multilingue unique de plus de 300 000 concepts, enrichi en permanence par l’équipe d’ingénieurs linguistes d’Eptica Lingway. D’autre part, la technologie Eptica Lingway permet de détecter automatiquement la langue : cette fonctionnalité permet d’identifier rapidement l’origine de la langue du message entrant. 15 langues sont ainsi reconnues : anglais, français, espagnol, allemand, portugais, italien, grec, néerlandais, russe, danois, finlandais, suédois, chinois, japonais, et coréen.

La technologie Eptica Lingway est issue de dizaines d’années d’investissement en R&D. Elle permet d’offrir des solutions d’analyse et de recherche à la fois rapides et efficaces qui sont mis en œuvre dans plusieurs domaines.

Moteur sémantique

Le moteur sémantique combine une puissante analyse linguistique et sémantique, avec une recherche sémantique optimisée. Mais il ne s’agit pas du simple ajout de deux fonctions distinctes, car l’analyse est utilisée pour booster la recherche, et la recherche utilisée pour affiner l’analyse : c’est dans ce sens que 1+1=3, le tout est supérieur à la somme des parties.

Le moteur sémantique d’Eptica Lingway s’appuie sur un ensemble de composants linguistiques et sémantiques qui constituent son cœur de technologie et ont nécessité plus d’une centaine d’années-homme de développement…

En savoir +

Ingénierie linguistique

Grâce notamment à Eptica-Lingway, des progrès considérables ont été enregistrés ces dernières années dans le domaine du TAL (Traitement Automatique du Langage Naturel – Natural Language Processing (NLP) en anglais) ou de l’Ingénierie Linguistique, son autre appellation. Et ceci à partir du moment où l’on a pu décomposer le problème, trop vaste pour être abordé globalement, en plusieurs sous-problèmes, correspondant eux-mêmes à plusieurs sous-tâches articulées entre elles.

A noter, que cette décomposition est faite à la fois au niveau des ressources linguistiques (dictionnaires et règles de grammaire) et au niveau des algorithmes (analyseurs, transducteurs, …).

Le cœur de la technologie du moteur Lingway est basé sur ces différents niveaux d’analyse, pour lesquels autant de modules spécialisés sont utilisés…

En savoir +

Lexique

A

Analyse

Opération consistant à présenter sous une forme concise et précise les données caractérisant l’information contenue dans une séquence textuelle, un document ou un ensemble de documents (du verbatim au corpus). Dans le cas de l’analyse linguistique ou le parsing, l’information contenue dans la séquence textuelle est présentée sous forme de diagramme ou arbre plus ou moins complexe dont les éléments intermédiaires et les éléments terminaux ont des propriétés spécifiques à la linguistique (morphologie, syntaxe, sémantique…

C

Catégorisation

Opération consistant à placer un document à un ou plusieurs endroits d’un plan de classement.

Le moteur Lingway peut effectuer une catégorisation automatique dans un plan de classement définit par l’utilisateur (à ne pas confondre avec Clustering).

Clustering

Le clustering ou « classification » consiste à extraire des groupes (« clusters ») de documents à partir d’un ensemble de documents non classifiés. Autrement dit, il s’agit d’une organisation automatique d’un ensemble de documents en sous-groupes. Cette opération repose généralement sur un calcul de proximité entre documents. Le clustering est une méthode de recherche d’informations de type bottom up (ascendante).

Le moteur Lingway réalise le clustering de l’ensemble de documents retrouvés suite à une requête (bouton « groupe »)

En savoir +

Ressources linguistiques

Les ressources linguistiques sont organisées autour de 3 niveaux de dictionnaires et concernent 10 langues :  les dictionnaires standards, les dictionnaires “métiers”, les dictionnaires utilisateurs.

Ce sont des dictionnaires propres à une application donnée, qui viennent compléter ou modifier les deux précédents niveaux. Ils comprennent en général quelques centaines de mots.

Ils peuvent être réalisés à partir d’outils d’extraction de terminologies multilingues.
Une présentation détaillée des ressources linguistiques et dictionnaires proposés par Eptica-Lingway est disponible sur demande.

Les deux premiers niveaux sont construits sur le même modèle et sont régulièrement mis à jour par Eptica-Lingway. Le niveau utilisateur utilise un modèle très simplifié qui permet de modifier les dictionnaires sans nécessiter de connaissances particulières en linguistique ou en ingénierie documentaire et une mise en œuvre immédiate ne nécessitant aucun traitement informatique particulier.

Au total, l’ensemble de ces ressources lexicographiques, représentent plus de 300 000 concepts, centralisés dans une base de données unique…

En savoir +

 

Une question ? Une demande de démo ? Contactez-nous :

Votre nom*

Votre prénom*

Votre email*

Votre société*

Votre téléphone*

Etes vous un humain ? Saisissez le texte présenté sur l'image

captcha

Sujet

Votre message