Archives novembre 2009

A long time ago

| Aucun Commentaire | Aucun Trackback

Cela fait maintenant un bail que je n'ai plus publié de billets sur ce blog, mais cela ne signifie pas que Perl ne m'a pas été utile dans l'intervalle. En fait, ce serait même plutôt le contraire ! Pour le moment, il m'est surtout utile pour faire des prototypes me permettant de mieux comprendre certaines technologies.

Ainsi, dans le GNU/Linux Magazine France du mois de novembre 2009, il y a un article (Mettez un sphinx dans votre moteur de recherche !) sur un outil sur lequel j'avais déjà jetté un bref coup d'oeil : Sphinx. Je n'ai pas encore eu le temps de finir l'article (je suis en retard sur tout, je vous dis !), mais le principe est de fournir un point d'entrée à une base de données via une requête. Les résultats de cette requête est alors indexée par un logiciel extérieur (Sphinx en l'occurrence). Ensuite lorsque l'on veut effectuer une recherche en texte intégral sur cette base de données, on commence par interroger Sphinx pour obtenir les identifiants des données, on peut ensuite récupérer les données directement dans la base de données.

Je n'ai pas de bases de données suffisamment importantes sous la main que pour pouvoir vérifier si les promesses de performances sont au rendez-vous, mais d'après l'auteur de l'article, c'est le cas !

Je m'interroge donc sur la possibilité d'utiliser Sphinx pour créer des OPACs « nouvelle génération ». L'avantage étant que le simple fait d'ajouter Sphinx dans le jeu permet d'exploiter un langage de requête bien plus riche que les OPACs classiques.

J'ai déjà utilisé cette technique de l'indexation par un programme extérieur pour mettre à disposition une base de données Winisis via le protocole Z39.50. J'avais utilisé pour cela Perl, avec les modules suivants :

Bref, tout cela me donne envie de tenter de réaliser un équivalent de Sphinx, mais en Perl. En exploitant la versatilité de DBI, cela permettrait d'offrir ce service d'indexation à quantité de bases de données !

Perl est vraiment un outil que j'apprécie dans ma boîte à outils, et comme beaucoup d'autres programmeurs Perl, ce que j'apprécie particulièrement, c'est de pouvoir compter sur le travail de tant d'autres pour m'aider à résoudre mes problèmes quotidiens. Parfois, les services rendus ne sont pas de l'ordre du support pour terminer un travail, mais simplement de rendre une situation encore plus comfortable.

M'appuyant souvent sur le CPAN, j'en suis venu à me faire une copie sur mon disque dur que je garde synchronisé aussi régulièrement que possible. Ce travail est réalisé par l'excellent minicpan (CPAN::Mini). Me voici donc dans la situation agréable d'avoir toujours à porter de main une archive du CPAN, que je sois connecté à Internet ou non. Mais le CPAN ne se limite pas à cela, c'est également l'outil que je consulte pour lire la documentation (oui, je sais perldoc est là pour cela), mais que faire quand je suis sur la route ? C'est simple, utiliser minicpanwebserver (CPAN::Mini::Webserver). Ce dernier s'appuie sur le fichier de configuration de minicpan, et met à disposition le tout via un serveur web. Je peux maintenant faire des recherches, lire la documentation, les tests, et je peux même lancer l'installation à partir de cette interface. Bref, un CPAN survitaminé ! A essayer !

À propos de cette archive

Cette page est une archive des notes de novembre 2009 listées de la plus récente à la plus ancienne.

octobre 2009 est l'archive précédente.

décembre 2009 est l'archive suivante.

Retrouvez le contenu récent sur l'index principal ou allez dans les archives pour retrouver tout le contenu.

Pages

Powered by Movable Type 4.261