A long time ago

| Aucun Commentaire | Aucun Trackback

Cela fait maintenant un bail que je n'ai plus publié de billets sur ce blog, mais cela ne signifie pas que Perl ne m'a pas été utile dans l'intervalle. En fait, ce serait même plutôt le contraire ! Pour le moment, il m'est surtout utile pour faire des prototypes me permettant de mieux comprendre certaines technologies.

Ainsi, dans le GNU/Linux Magazine France du mois de novembre 2009, il y a un article (Mettez un sphinx dans votre moteur de recherche !) sur un outil sur lequel j'avais déjà jetté un bref coup d'oeil : Sphinx. Je n'ai pas encore eu le temps de finir l'article (je suis en retard sur tout, je vous dis !), mais le principe est de fournir un point d'entrée à une base de données via une requête. Les résultats de cette requête est alors indexée par un logiciel extérieur (Sphinx en l'occurrence). Ensuite lorsque l'on veut effectuer une recherche en texte intégral sur cette base de données, on commence par interroger Sphinx pour obtenir les identifiants des données, on peut ensuite récupérer les données directement dans la base de données.

Je n'ai pas de bases de données suffisamment importantes sous la main que pour pouvoir vérifier si les promesses de performances sont au rendez-vous, mais d'après l'auteur de l'article, c'est le cas !

Je m'interroge donc sur la possibilité d'utiliser Sphinx pour créer des OPACs « nouvelle génération ». L'avantage étant que le simple fait d'ajouter Sphinx dans le jeu permet d'exploiter un langage de requête bien plus riche que les OPACs classiques.

J'ai déjà utilisé cette technique de l'indexation par un programme extérieur pour mettre à disposition une base de données Winisis via le protocole Z39.50. J'avais utilisé pour cela Perl, avec les modules suivants :

Bref, tout cela me donne envie de tenter de réaliser un équivalent de Sphinx, mais en Perl. En exploitant la versatilité de DBI, cela permettrait d'offrir ce service d'indexation à quantité de bases de données !

Aucun Trackback

URL de Trackback : http://blog.bjornoya.be/mt-tb.cgi/16

Laisser un commentaire

À propos de cette note

Cette page contient une unique note de manu publiée le 30 novembre 2009 10h23.

Un outil en plus : CPAN::Mini::Webserver est la note précédente de ce blog.

Un coup d'oeil sur les calendriers est la note suivante de ce blog.

Retrouvez le contenu récent sur l'index principal ou allez dans les archives pour retrouver tout le contenu.

Pages

Powered by Movable Type 4.261