Définition - Que signifie le système d'indexation Web simple pour les humains (SWISH)?
Le système d'indexation Web simple pour les humains (SWISH) est un outil open source permettant d'indexer des pages Web ainsi que d'autres documents, notamment du texte, du HTML et du XML.
SWISH est utilisé lorsqu'il existe un grand nombre de documents, y compris des pages Web et d'autres documents, qui doivent être indexés. L'outil a la capacité d'indexer des e-mails, PDF, HTML, XML, Microsoft Word / Powerpoint / Excel, du texte simple et tout autre type de fichier pouvant être converti en texte XML ou HTML.
Definir Tech explique le système d'indexation Web simple pour les humains (SWISH)
Le système d'indexation Web simple pour les humains - amélioré (SWISH-e) est le descendant de SWISH. SWISH a été développé par Kevin Hughes en 1994 et a finalement été réédité sous licence publique générale sous le nom de SWISH-E en 1996.
Les caractéristiques de SWISH comprennent:
- Il peut être utilisé avec des bases de données relationnelles telles que MySQL pour une recherche rapide en texte intégral.
- Il est livré avec une araignée Web pour indexer les documents distants sur HTTP
- Il prend en charge la recherche floue, la recherche de phrases et la recherche par caractères génériques
- Il peut renvoyer des résumés de documents à chaque recherche
- Il a la capacité de limiter les recherches à une certaine partie du document ou à des éléments HTML et XML spécifiques
- Il peut vous informer de toute erreur structurelle dans vos documents XML et HTML
- Le fichier d'index peut être porté d'une plate-forme à une autre - il est indépendant de la plate-forme.