#1 Le 06/01/2008, à 00:41
- Breizhpunisher
[Résolu] Moteur de recherche intranet open source
Quelqu'un connaitrait-il un moteur de recherche libre performant qui pourrait s'intégrer à un site intranet d'entreprise?
J'ai essayé une solution comme Flax (un dérivé de Lucene) mais si celui ci fonctionne niquel avec mes pdf, fichiers office ou mêmes images, l'angoisse c'est qu'il ne référence pas les pages php de mon site, et donc encore moins le contenu des articles de la base SQL... (alors que le moteur en php fourni par mon CMS ne référence QUE le contenu et pas les pièces jointes dont je viens de parler...)
L'intéret serait donc que les utilisateurs puissent accèder par une seule recherche au contenu des articles mais aussi de ces pièces jointes.
Après avoir passé des nuits blanches à essayer de bidouiller le code PHP et m'être essayé (sans succès j'avoue) à l'écriture en python, je jète l'éponge...
Quelqu'un a-t-il une idée?
Il existe bien des solutions commerciales (Google Mini et autres) mais le coût annoncé fait froid dans le dos (environs 1500£ /an)
Dernière modification par Breizhpunisher (Le 07/02/2008, à 00:46)
L'urgent est fait, l'impossible est en cours,
Pour les miracles, prévoir un délai ...
Hors ligne
#2 Le 06/01/2008, à 14:43
- Breizhpunisher
Re : [Résolu] Moteur de recherche intranet open source
up ?
L'urgent est fait, l'impossible est en cours,
Pour les miracles, prévoir un délai ...
Hors ligne
#3 Le 07/01/2008, à 23:50
- poupoul2
Re : [Résolu] Moteur de recherche intranet open source
Peut être OpenWebSpider ou Nutch. Je ne sais pas ce qu'ils valent ni si ils répondent à ton besoin. Mais ce sont des pistes
#4 Le 09/01/2008, à 10:44
- Breizhpunisher
Re : [Résolu] Moteur de recherche intranet open source
Merci poupoul2
Je m'étais déja penché sur Nutch mais il ne correspondait pas à mes besoins.
Je m'étais lancé sur le développement d'une application à partir de FlaX, mais je me heurte à un cruel dilemne dans son développement... Mon objectif est d'améliorer le moteur de recherche d'un site SPIP dont je suis l'administrateur.
J'ai bien pensé à mixer les deux codes PHP, celui originel du module de SPIP et celui de ma page de requête Lucene, mais ce dernier serveur (python) ne peut raisonnablement pas fonctionner sur le même port que mon serveur Apache... d'o๠mon soucis...
Comment puis-je lancer à partir d'un même bouton deux requêtes, l'une sur le port 80 et l'autre sur le 81 (par exemple) et plus fort encore afficher les résultats renvoyés par les deux serveurs dans le même classement... un peu Hard core pour un débutant en programmation comme moi
Il est dès lors sous entendu que je désire une seule interface, car la solution de facilité serait bien sûr de ne rien toucher dans SPIP et de créer un lien vers la page de mon moteur sous Lucene.
Mes usagers auraient alors le choix de lancer leur requête
1°_uniquement dans les pages et articles contenus dans ma base SQL d'un cà´té avec le moteur PHP de SPIP, OU (c'est ce ou qui m'ennuie, j'aimerais bien le transformer en ET)
2°_uniquement dans les pièces jointes de ces articles (fichiers PDF, Word, Excel, MP3, .avi, etc) le moteur Lucene me renvoyant un résultat vraiment spectaculaire et assurant l'indexation automatisée régulière des nouveaux fichiers (encore bravo aux développeurs, si j'arrive à ajouter une petite pierre il va sans dire qu'elle retournera à la communauté du libre).
Je vais donc tenter un essai avec Open Web Spider, mais c'est pas gagné vu que rien que l'installation sous Windows réclame déja que je prenne en mains MS Visual C++... encore des heures de prise de tête en perspective...
Merci pour cette nouvelle piste
Dernière modification par Breizhpunisher (Le 09/01/2008, à 10:45)
L'urgent est fait, l'impossible est en cours,
Pour les miracles, prévoir un délai ...
Hors ligne
#5 Le 07/02/2008, à 00:46
- Breizhpunisher
Re : [Résolu] Moteur de recherche intranet open source
Bon finalement j'ai réussi à trouver et bricoler 2 ou 3 trucs de Nutch et ça tourne impec
Je mets un [résolu] même si j'ai galéré à l'aveugle 1 mois et demi
Merci poupoul2
Dernière modification par Breizhpunisher (Le 07/02/2008, à 00:46)
L'urgent est fait, l'impossible est en cours,
Pour les miracles, prévoir un délai ...
Hors ligne