Le blog du garambrogne

Moteur de recherche

Fil des billets - Fil des commentaires

Looking for New York, the shingle way

wood shingleSearch engine works with words, but some noun is compound by multiple words. New York is a noun, not two words. With a list of noun, search engine can handle it well, and wikipedia can help.

Lire la suite...

Using Compass without dirtying its hands with java

GoniometerCompass is a nice project using Lucene to bring easy search to java project.

But sometimes, we don't need java in a project.

Lire la suite...

A lexicon approach for Lucene full text search engine.

A libraryLucene uses an index to find document from thier words. Storing more informations with each words, ie building a lexicon, can expands Lucene search and helps query refining.

Lire la suite...

Dissection d'un moteur de recherche (4) : la complétion et proposition d'orthographe

Google en proposant une complétion automatique pour son moteur a une fois de plus donné le ton. Cette fonction est maintenant intégré dans tous les navigateurs webs. On commence à taper ce que l'on recherche, et un menu propose une fin possible, diminuant au fur et à mesure que l'on tape.

Lire la suite...

Dissection d'un moteur de recherche (3): l'index inversé et les attributs

Quand on parle d'indexation, c'est qu'il y a un index. L'astuce de base de la recherche full text, et d'utiliser un index, le même que l'on trouve à la fin d'un livre de recettes de cuisines.

Lire la suite...

Dissection d'un moteur de recherche (2) : normalisation du contenu

Les textes à indexer peuvent provenir de sources différentes, dans des formats différents, et des langues différentes. Il faut commencer par tout homogénéiser avant d'attaquer l'analyse.

Lire la suite...

Dissection d'un moteur de recherche (1) : l'index

Les principes de fonctionnement d'une base de données relationnelle sont à peu près connus, par contre, ceux d'un moteur de recherches sont bien plus nébuleux, avec un côté magique. Pourtant, Google a démontré l'intérêt d'un moteur de recherche, une petite dissection s'impose pour voir ce qu'il y a dans le ventre de la recherche full text.

Lire la suite...

Moteur de recherche, bis

Faire de la recherche full text, n'est pas trés compliqué, mais il y différents à-cotés tout aussi intéressants. Les filtrages, les suggestions, les pages proches...

Lire la suite...

moteur de recherche

Empiler des tonnes d'informations, c'est bien, pouvoir les retrouver, c'est encore mieux. Le problèmes existe sur les serveurs, et maintenant sur les ordinateurs aux disques durs garagantuesques.

Lire la suite...

mnogosearch depuis PHP

Aprés la class PHP pour utiliser htdig , puis le decryptage du protocole de mnogosearchd et le client en Python , voici la class PHP pour utiliser mnogosearch, le moteur de recherche russe.

Lire la suite...

- page 1 de 2