CIGen
Collectif Informatique pour la Généalogie
Les recherches multi-critères : c'est quoi, ça marche comment ?

Le concept de filtre

Les filtres

Toute recherche d'information repose sur le concept de filtre : on veut filtrer les informations pertinentes dans l'ensemble de toutes les informations possibles

Un filtre, c'est un peu comme un passoire : quand on fait passer l'eau et les pâtes, on conserve les pâtes dans la passoire et on jette l'eau, on a conservé l'élément pertinent (oui, les pâtes) et ignoré (jeté) les éléments inintéressants (l'eau)

On garde l'eau ou on la jette ?

Le premier souci, c'est qu'un filtre - une passoire - ne donne aucune indication sur quel élément est pertinent et quel élément est à jeter : si vous passez les pâtes, l'élément pertinent c'est ce qui reste dans la passoire, mais si vous passez du thé, l'élément pertinent c'est ce qui traverse la passoire.

En recherche d'information, il y a la même question : quand vous indiquez un nom, est-ce que vous voulez tous les relevés qui comportent ce nom (ceux qui ont le nom sont les éléments pertinents) ou uniquement ceux qui ne comportent pas ce nom (ceux qui ont le nom sont les éléments à jeter). La plupart du temps, le filtre est dit positif, ce qui signifie que les éléments retenus sont ceux qui comportent le filtre, ceux qui comportent le nom recherché. Mais ce n'est pas une obligation, il faut donc être attentif à la façon dont les questions sont formulées.

Bien, on vient de définir un filtre : c'est quelque chose qui accepte des éléments mélangés et sépare d'un côté ceux que l'on souhaite et d'un autre ceux que l'on rejette.

Application à la généalogie

Et en généalogie ?

Un filtre sur nom=DUPONT

La passoire ça va être un programme, évidemment. Mais ce qui fait qu'une passoire laisse ou non passer quelque chose, c'est sa maille : une maille petite laisse passer les liquides et guère autre chose, une maille large laissera passer plus de choses. Le fonctionnement de la passoire dépend de sa maille.

En informatique, on va évidemment retrouver quelque chose de similaire : ce sera l'élément sur lequel porte le filtre. Par exemple, un filtre pourrait avoir comme "maille" la condition "le nom doit être DUPONT" ou "l'année doit être supérieure à 1726".

Bon, évidemment, on ne créé pas d'avance tous les filtres possibles, rien que pour les noms, ce serait titanesque. Un filtre va donc s'exprimer comme "Le doit être quelque chose" et on remplacera ce "quelque chose" par le vrai nom cherché par le généalogiste.

Les filtres successifs

Filtres successifs

Filtres successifs d'un tas d'or

Bon, tout cela est fort bien, mais c'est totalement insuffisant dans la vraie vie : un tel filtre, unitaire, ne répond qu'à un nombre limité de cas.

Imaginons que vous vouliez trier des pièces d'or par taille (j'allais dire des graviers, mais ça fait moins rêver !).

Vous ne pouvez pas utiliser une seule passoire avec une seule maille : vous allez utiliser plusieurs passoires successivement. La première aura une maille large pour ne garder que les plus grosses pièces. La seconde aura une maille un peu plus resserée pour les pièces légèrement plus petites, etc.

Le nombre de "passoires" dépendra du nombre de tas que vous souhaitez obtenir.

Application à la généalogie

Et en généalogie ?

Un filtre sur nom=DUPONT

En généalogie, il est relativement rare qu'on cherche quelque chose dans un tas de pièces d'or. Il est plus habituel de faire des recherches dans des relevés.

Nos filtres vont jouer le même rôle que les différents tamis :

Il faut donc imaginer une recherche comme une suite de filtres : on parle de recherche multi-critères car il y a plusieurs filtres ou critères de sélection.

Bien sûr, chaque filtre peut être plus ou moins simple : ici, on n'a évoqué que "nom=DUPONT" ou "année=1679" mais rien n'empêche d'imaginer des filtres comme "nom commence par DUP" ou "année est comprise entre 1679 et 1687" ou encore "la commune est à moins de 10km de Limoges".

Recherche dans des données disparates

Données disparates

Il y a cependant encore une difficulté : jusqu'à présent, nous avons seulement considéré que nous filtrions des éléments de même nature : des relevés, des pièces d'or. Mais en généalogie, les relevés sont en fait assez diversifiés : on a des relevés de baptêmes, des relevés de mariage, des relevés d'enrolement ou de recensement.

Le contenu des relevés est tellement disparate qu'on ne peut plus les considérer comme de même nature : entre les relevés de monuments aux morts où on a un nom et un prénom et des relevés d'actes notariaux où certains peuvent lister plusieurs dizaines de personnes, il n'y a que peu de points communs. Faire une recherche dans un tel amoncellement, c'est comme chercher à filtrer un mélange de pièces d'or et de meubles : comment définir des mailles (énormes) qui laissent passer une bibliothèque mais bloquent une pièce de 10 centimes ???

Plusieurs solutions ont été imaginées.

Approche 1 : la recherche saucissonnée

1. Recherche saucissonnée

Un filtre sur des mariages uniquement

La première, comme illustré sur la droite (et utilisée sur de multiples sites comme GeneaBank), a été de créer des recherches centrées sur un seul type de relevés. Pour chercher les baptême et mariages du même Paul DUPONT, il faut entrer plusieurs fois ces critères.

L'avantage est la simplicité, la facilité de comprendre le fonctionnement. L'inconvénient c'est l'impossibilité de consulter en même temps des documents de nature différente : parfois, voir tous les documents dans l'ordre chronologique éclaire la recherche.

Approche 2 : critères minimalistes

2. Critères minimaux

Critères minimaliste (source : Geneanet)

La seconde, comme on le voit sur la copie d'écran de Geneanet à gaiuche, a été de restreindre les filtres possibles aux seuls éléments communs à tous les relevés : nom, prénom, lieu, date. Geneanet a rajouté les parents, pour chercher les descendants d'un couple, mais ne s'est pas aventuré plus loin.

L'avantage est de combiner la simplicité et la combinatoire des résultats : on peut cette fois chercher aussi bien des baptêmes que des pages de livres, des photos de tombes ou des actes notariaux. Ceci répond à la principale critique de l'approche précédente.

Mais la difficulté a été reportée ailleurs : ce type de recherche manque de potentiel. Par exemple, on peut chercher Paul DUPONT mais il est totalement impossible d'exprimer que ce Paul DUPONT doit être un parrain de quelqu'un. On ne peut pas non plus chercher un acte chez un notaire ou dans un cimetière donné : ce ne sont pas des critères communs à tous les documents, puisqu'on ne trouve pas de notaire ou de cimetière par exemple sur un acte de naissance.

Approche 3 : critères exhaustifs

2. Critères maximaux

Critères in extenso

La troisième approche, présentée sur l'image à droite (une copie d'écran de la recherche dite avancée de genIndex), a été de proposer tous les critères possibles et imaginables et de se débrouiller ensuite pour les appliquer uniquement aux documents pertinents. On peut alors chercher des baptêmes et des tombes, indiquer un nom, et le prénom du père, ainsi qu'un numéro de concession dans le cimetière.

Les critères nom et prénom du père s'appliqueront alors aux baptêmes (qui n'ont pas de n° de concession), tandis que le nom et le numéro de concession s'appliqueront aux tombes (qui n'expriment pas la filiation et n'ont donc pas le prénom du père).

L'avantage, c'est qu'on peut tout faire, tout chercher en une fois, obtenir une vraie liste chronologique des documents d'une personne ou d'une famille

L'inconvénient, c'est que la grille de saisie des critères fait peur : des centaines de zones, lesquelles remplir, lesquelles s'applique à quel document ? Pour faciliter, on peut faire comme sur l'image ci-contre, regrouper les critères par type (critères communs, critères de filiation, critères sur le conjoint et sa famille etc.), mais cela n'enlève que peu de la difficulté. genIndex, par exemple, comporte donc deux recherches : une de la première famille, considérée comme d'accès facile, et une de cette troisième famille, considérée comme la recherche avancée

Approche 4 : critères sur demande

2. Critères sur demande

Des critères sur demande

Enfin, la quatrième approche, présentée sur l'image de gauche (une copie d'écran du futur genIndex), a été de proposer les critères sur demande. C'est globalement la même chose que la troisième, sauf qu'on masque les centaines de zones : on n'affiche qu'un minimum au départ (comme dans l'approche 2) et on propose (dans la zone en bas, les boutons bleus) de pouvoir ajouter des critères si besoin. Comme l'approche 3, on se débrouille ensuite pour les appliquer uniquement aux documents pertinents.

L'utilisateur peut alors bénéficier d'une première vision simple, claire, facile à comprendre. Mais il n'est pas limité à cette simplicité insuffisante : il peut rajouter des critères, par exemple pour préciser quelle doit être la belle-mère (et ça ne s'appliquera pas aux baptêmes car on ne connaît pas la future belle-mère sur un baptême).

Pour faciliter au maximum la vie des généalogistes, cette recherche dans genIndex précise, pour chaque groupe de critère supplémentaires, à quels relevés ils peuvent s'appliquer. D'ailleurs, si le critère ne peut pas s'appliquer aux relevés que vous cherchez (vous avez coché uniquement des baptêmes : la belle-mère ou la tombe ne peuvent pas servir), les boutons sont grisés.

L'aide : à quel(s) document(s) s'applique le critère ?

Enfin, lorsqu'on quitte le site et qu'on y revient, on retrouve les zones dans le même état qu'on l'avait laissé : ceci évite d'avoir à re-cliquer sur des boutons quand on les utilise souvent.

Pour connaître les inconvénients, il faudra attendre les retours des futurs utilisateurs, mais à priori, les règles d'ergonomie montrent qu'ils devraient être moindre que dans toutes les approches précédentes.

Quel impact sur votre recherche ?

Vos recherches

L'impact pour un utilisateur n'est pas très grand : dans tous les cas, même en comprenant parfaitement comme ça marche, vous ne pourrez rien faire de plus que ce que vous propose le logiciel.

Evitez de vous casser la tête !

Le seul point positif que vous pouvez en retirer c'est d'optimiser vos recherches en fonction de la méthode qui vous est offerte.