|
|
A - B - C - D - E - F - G - H - I - J - K - L - M - N - O - P - Q - R - S - T - U - V - W - X - Y - Z C Catégorisation Opération consistant à placer un document à un ou plusieurs endroits d’un plan de classement. Voir aussi Indexation Lingway KM peut effectuer une catégorisation automatique dans un plan de classement définit par l’utilisateur. [à ne pas confondre avec Clustering] En savoir plus Clustering Le clustering ou "classification" consiste à extraire des groupes ("clusters") de documents à partir d'un ensemble de documents non classifiés. Autrement dit, il s'agit d'une organisation automatique d'un ensemble de documents en sous-groupes. Cette opération repose généralement sur un calcul de proximité entre documents. Le clustering est une méthode de recherche d'informations de type bottom up (ascendante). Lingway KM réalise le clustering de l'ensemble de documents retrouvés suite à une requête (bouton "groupe"). En savoir plus Concept Un concept est un objet qui représente l'abstraction d'un terme ou plus généralement d'un ensemble de termes synonymes dans une ou plusieurs langues, cet objet étant indépendant de sa réalisation linguistique (la façon de le nommer). Cet objet sert à décrire des propriétés indépendantes de la langue (des propriétés conceptuelles). Par exemple, le concept <marteau> appartient à la classe <instruments>, et ce, indépendamment de la langue. Dans Lingway KM, le dictionnaire décrit 150.000 concepts qui sont reliés à 5 langues. Les concepts sont reliés entre eux par un ensemble de relations formant un réseau sémantique. Exemple : le concept n° 344 est une sorte de concept n° 765 – Le concept n° 344 se dit « fauteuil » en français et « armchair » en anglais. Le concept n° 765 se dit « meuble » en français et « furniture » en anglais. En savoir plus A - B - C - D - E - F - G - H - I - J - K - L - M - N - O - P - Q - R - S - T - U - V - W - X - Y - Z Haut de page D Descripteur Terme ou Entité nommée utilisé pour caractériser (Indexation2) un document. Un descripteur peut être libre ou contrôlé. Descripteur libre Descripteur choisi indépendamment de toute liste d’autorité. Lingway KM effectue une indexation en descripteurs libres de plusieurs natures différentes : l es « thèmes », qui sont des termes extraits du texte et les entités nommées, également extraites du texte. En savoir plus Descripteur contrôlé Descripteur choisi obligatoirement dans une liste d’autorité, généralement un thésaurus. Dans Lingway KM il est possible de définir une liste d’autorité. En savoir plus Dictionnaire [électronique] Base de données regroupant l’ensemble de l’information linguistique et conceptuelle nécessaire pour l’analyse des textes et des questions. Le dictionnaire comprend la description morphologique des mots, leur décomposition en sens, leur rattachement aux concepts et le réseau sémantique entre les concepts. Le dictionnaire générique de Lingway, comporte environ 150.000 concepts rattachés à 5 langues. Dictionnaire utilisateur Dictionnaire venant modifier le dictionnaire général pour l’adapter à une application particulière. Lingway KM permet de gérer un dictionnaire utilisateur dont le modèle est très simplifié par rapport au dictionnaire générique, afin d’en rendre l’utilisation très facile. En savoir plus Domaine sémantique Activité ou discipline dans laquelle un mot est utilisé avec un sens donné. Par exemple le mot « souris » a un certain sens dans le domaine « informatique » et un autre dans le domaine «zoologie». Dans le dictionnaire Lingway, il existe environ 350 domaines sémantiques qui sont essentiellement utilisés pour déterminer le sens des mots dans les questions. Les domaines apparaissent dans la fenêtre « analyse » qui donne l’interprétation de la question. En savoir plus A - B - C - D - E - F - G - H - I - J - K - L - M - N - O - P - Q - R - S - T - U - V - W - X - Y - Z Haut de page E Entité nommée Descripteur particulier désignant un objet (typiquement une personne, un lieu, une organisation) par son nom. Par extension, on inclut également les valeurs et les dates dans les entités nommées. Lingway KM extrait ces différents types d’entités nommées. En savoir plus Expansion sémantique Opération consistant à construire à partir d’un terme de départ donné (en utilisant le réseau sémantique du dictionnaire) une liste de termes dont le sens est voisin, généralement en vue de la construction d’une équation de recherche dans la base de données documentaire. Dans Lingway KM, l’expansion sémantique est paramétrable par une « distance sémantique » permettant d’aller plus ou moins loin dans l’expansion. En savoir plus A - B - C - D - E - F - G - H - I - J - K - L - M - N - O - P - Q - R - S - T - U - V - W - X - Y - Z Haut de page I Indexation Indexation-1 Il s'agit de l'indexation dite "full-text". Opération qui consiste à produire à partir d'un ensemble de documents, un liste (dite "inversée") de mots avec les liens vers les documents dans lesquels chaque mot apparaît. Cette opération est faire pour l'ensemble des mots sauf ceux déclarés dans un "anti-dictionnaire", généralement des mots outils, verbe être, etc. Dans Lingway KM une indexation full-text est réalisée ; elle est utilisée par la recherche sémantique. En savoir plus Indexation -2 Opération consistant à affecter des descripteurs à des documents. Indexation contrôlée Mode d’indexation des documents par des descripteurs choisis dans une liste d’autorité. Dans Lingway KM il est possible de définir une liste d’autorité. Dans ce cas un texte comportant un descripteur de la liste d’autorité sera systématique indexé par ce descripteur, indépendamment de tout calcul statistique. En savoir plus Indexation libre Mode d’indexation des documents par des descripteurs choisis indépendamment d’une liste d’autorité. Dans Lingway KM les descripteurs libres sont choisis parmi l’ensemble des termes et entités nommées extraits du texte, par des méthodes statistiques tenant compte de la fréquence du terme dans l’ensemble du corpus et dans le document à indexer. En savoir plus Indexation mixte Mode d’indexation des documents combinant indexation contrôlée et indexation libre. Lingway KM permet une indexation mixte. En savoir plus A - B - C - D - E - F - G - H - I - J - K - L - M - N - O - P - Q - R - S - T - U - V - W - X - Y - Z Haut de page L Liste d’autorité Liste de descripteurs devant être retenus pour indexer un document. Cette liste peut être structurée de différentes manières (voir thésaurus, taxonomie, plan de classement). A - B - C - D - E - F - G - H - I - J - K - L - M - N - O - P - Q - R - S - T - U - V - W - X - Y - Z Haut de page M Méta donnée En général, donnée sur une donnée. Dans notre domaine, il s'agit des données structurées sur un document ou un ensemble de documents. Ces données peuvent inclure les descripteurs, mais également tout type d'information sur le document, auteur, publication, date, infos légales, typologie du document, etc. Dans l'age de l'Internet, les méta-données sont aux documents ce que les fiches des catalogues étaient aux livres des bibliothèques. Lingway KM produit automatiquement des méta-données de chaque document traité, dans le format standard en s’inspirant des conventions du Dublin Core. En savoir plus A - B - C - D - E - F - G - H - I - J - K - L - M - N - O - P - Q - R - S - T - U - V - W - X - Y - Z Haut de page P Plan de classement Structure hiérarchique permettant le classement et le repérage de documents ou d'ensembles documentaires. Il est généralement représenté par une liste hiérarchisée de descripteurs ou Taxonomie. Voir Catégorisation Il est possible de charger un plan de classement dans Lingway KM. En savoir plus Post coordination Mode d’indexation combinant plusieurs descripteurs élémentaires entre eux. Par exemple un document décrivant un garage sera décrit par les 2 descripteurs « réparation » et « voiture ». Voir aussi Pré Coordination. Pré coordination Mode d’indexation par des descripteurs complexes, mots composés ou expressions. Par exemple un garage sera décrit par un descripteur « réparation de voiture ». Voiraussi Post Coordination et plan de classement Lingway KM sait reconnaître des descripteurs pré coordonnés. En savoir plus A - B - C - D - E - F - G - H - I - J - K - L - M - N - O - P - Q - R - S - T - U - V - W - X - Y - Z Haut de page R Réseau sémantique Ensemble d'objets (de concepts) reliés entre eux par des relations sémantiques. Dans Lingway KM désigne les concepts et le graphe des relations sémantiques dont il existe une vingtaine de types, dont la relation hiérarchique, la proximité sémantique, partie-de, etc. En savoir plus A - B - C - D - E - F - G - H - I - J - K - L - M - N - O - P - Q - R - S - T - U - V - W - X - Y - Z Haut de page T Taxonomie Réseau sémantique dans lequel la seule relation est la relation hiérarchique (générique-spécifique). Voir aussi Plan de classement. Terme Mot simple, mot composé ou expression plus ou moins complexe désignant généralement un objet ou une opération. Lingway KM identifie les termes saillants d'un document ou d'un corpus sur une double base linguistique et statistique. Des « patrons » linguistiques décrivent la forme syntaxique possible d’un terme (nom-préposition - nom, nom-adjectif, etc.) et des calculs statistiques déterminent les termes à retenir comme descripteurs pour l’indexation d’un document ou d'un corpus. En savoir plus Thème Dans Lingway KM, désigne un descripteur qui est un terme par opposition à une entité nommée. En savoir plus Thésaurus Liste d’autorité munie d’une structure de type réseau sémantique généralement constituée de deux relations principales : la relation hiérarchique (TG d'un descripteur à son générique ou son inverse TS d'un descripteur à un spécifique) et la relation de proximité (TA ou "terme associé"). De plus, les thésaurus recensent souvent des termes non descripteurs qu'ils rattachent à des descripteurs (relation EM ou "employer" d'un terme au descripteur, ou EP "employé pour" du descripteur vers le terme non descripteur. Il est possible d’intégrer un thésaurus dans Lingway KM. Les descripteurs apparaissent alors dans la liste des thèmes préfixés par « TH ». En savoir plus Haut de page |
|||


