Implémenter un moteur de recherche "scalable" avec SOlr
Programme
Fondamentaux de la Recherche d’Information (RI)
- Définitions
- RI Web vs RI Entreprise
- concepts de base
- Structure et construction de l’index
- Modèle booléenne de recherche d’information
- Recherche ordonnée
- Modèle vectoriel de recherche d’information
Indexation du Web: un état de l’art
- Historique de l’innovation des principaux moteurs de recherche
- Organisation des documents du Web
- Construction du dictionnaire des termes
- Stockage de l’index
- Répondre à une requête de l’utilisateur
- Mise à l’échelle du moteur de recherche
- Le cas Google Search Engine
Solutions open source Lucene/Solr
- présentation de la librairie Apache Lucene
- présentation du serveur Apache Solr
Indexation avec Solr
- Mise en place d’un projet Solr avec Apache Maven
- Structure du répertoire d’installation de Solr
- Comprendre le concept Solr Core
- Les fichiers de configuration
- Schéma des documents et analyse des textes
- Les modes de communication avec Solr
- Le framework Data Import Handler (DIH) de Solr
- Indexer les fichiers avec Solr Cell
Recherche avec Solr
- Les paramètres de recherche
- La syntaxe des requêtes
- Parseur de requête Lucene vs Parseur de requête Dismax
- Recherche Géospatiale
- Influencer la pertinence des résultats
- Recherche par facettes pour une meilleure expérience de l’utilisateur
- Les composants Highlight et MoreLikeThis
- Aller au delà de la recherche par mots clés
Mise à l’échelle de Solr
- Evaluer les performances de Solr avec SolrMeter
- Optimiser une instance unique de Solr
- Passer à plusieurs serveurs avec Solr Replication et/ou Solr Cloud