Titre : | La sélection des attributs lors de la mise en correspondance (matching) pour le couplage d'enregistrements |
Auteurs : | Benyahia miloud, Directeur de thèse ; Sayah Mohammed Mouaad, Auteur ; Louazani Chahra zed, Auteur |
Type de document : | texte imprimé |
Editeur : | Algèrie:unv saida-Dr Moulay Tahar, 2021-2022 |
Format : | 67p. / 29cm |
Accompagnement : | CD |
Note générale : | Bibliographie |
Langues: | Français |
Catégories : | |
Mots-clés: | Record linkage, clés de blocage, blocage, Matching, sélection des attributs. |
Résumé : |
Le processus d'identification des paires d'enregistrements qui représentent la même entité du monde réel dans plusieurs bases de données, communément appelé couplage d'enregistrements ou le record linkage (RL), est l'une des étapes initiales importantes de nombreuses applications d'exploration de données. Le record linkage peut être défini comme un processus en trois étapes : (i) Le nettoyage et la normalisation (ii) L’indexation et le blocage (iii) La mise en correspondance des paires d’enregistrements indexés (Matching). Une clé de blocage (BK: Blocking Key) peut être choisie comme un attribut unique où avec la concaténation de plusieurs attributs, deux paramètres importants contrôlent les performances des clés de blocage : la valeur de la clé de blocage (BKV: blocking key value) et le nombre de clés de blocage et elle est utilisée durant les deux dernier étapes de RL. Les caractéristiques d'attribut qui affectent la décision de sélection comprennent le niveau d'erreurs dans les valeurs d'attribut et le nombre (et la distribution) des valeurs d'attribut, c'est-à-dire le contenu informationnel de l'attribut. Les résultats obtenus à partir des expériences sur des data sets du monde réel ont montré l’efficacité de choisir des clés de blocage différentes dans chaque étapes de RL. |
Note de contenu : |
1-Qualité de Données 2-Record Linkage 3-Analyse et conception 4-Implémntation |
Exemplaires (1)
Code-barres | Cote | Support | Localisation | Section | Disponibilité |
---|---|---|---|---|---|
TECT01829 | T.I.MS00646 | Périodique | Ouvrages | 27 | Libre accès Disponible |