Htdig es "WWW Search Engine Software" es decir un motor de búsqueda de páginas web.
Vamos a ver la forma de poder tener un buscador de ficheros o páginas web, dentro de nuestro propio servidor web. Para ello usaremos htdig
El objetivo es poder poner un texto y busque en nuestra web (o otra web) aquellas páginas o ficheros que contengan dicho texto.
La página http://bulma.net/htdig/ usa este tipo de software para las busquedas.
Tener instalado el servidor apache.
Desde consola como usuario root:
apt-get install htdig
Desde consola como usuario root, editaremos el fichero: nano /etc/htdig/htdig.conf
Deberemos poner la dirección de nuestra web aquí:
start_url: http://aldarias.dyndns.org/paginas/
Para el fichero htdig.txt con las páginas q me interesan
find /var/www/paginas/ -type f -name \*.html -print | sed -e 's| /var/www/paginas | http://127.0.0.1/paginas |' >> htdig.txt
htdig -v -s htdig.txt
Abriremos el buscador así:
This document was generated using the LaTeX2HTML translator Version 2002-2-1 (1.70)
Copyright © 1993, 1994, 1995, 1996,
Nikos Drakos,
Computer Based Learning Unit, University of Leeds.
Copyright © 1997, 1998, 1999,
Ross Moore,
Mathematics Department, Macquarie University, Sydney.
The command line arguments were:
latex2html htdig -no_subdir -split 0 -local_icons 1 -show_section_numbers -no_auto_link -no_navigation
The translation was initiated by on 2004-04-13