Enlaces
Esta en:

documentos
Arriba
Bind-9
Bind-8
Ad+bind
Dhcp
Kdephp
Shell
Trucos
Php
Documentos
Cuestiones php
Fedora
Legal
W2000 xp
COMOS
Errores dns

Re: [PHP-ES] motor de búsqueda para páginas html

Write haof XML files: Rafael <rsalazar_at_innox.com.mx>
Fecha: Wed, 15 Feb 2006 10:09:33 -0600

        La verdad, no entendí este comentario, ¿es sarcasmo o es que te han
enviado los comentarios por privado?

        En fín, volviendo al tema del buscador... si bien entiendo que la idea
es un busador independiente de la base de datos, me parece que la
lectura repetida de cada HTML, y su "parseado" no es muy eficiente que
digamos y se notará cuando sean varias páginas las que deba leer.

        Por otro lado, si pretendes que sea fácil de utilizar para gente que no
conoce de PHP, te sugiero usar de archivo de configuración un INI, ya
que un error de sintaxis en éste puede provocar que el motor de búsqueda
"muera" también. Y en esta misma línea de la configuración, sería más
práctica poder definir los "caracteres especiales" de la forma como los
tratarías con strtr(), al que le puedes indicar dos cadenas, de las
cuales tomará caracter por caracter para definir los valores de búsqueda
y reemplazo (e.g. "áéíóúü" => 'aeiouu'), la sintaxis actual sería útil
para reemplazos de más (o menos) de un caracter.

        Sobre el código, aún no le he visto a detalle, pero creo que también
sería mejor poder definir una "etiqueta" para indicarle que no considera
el archivo actual para la búsqueda; por defecto considerar que se
buscaría en todo el BODY (¿y la cabecera?) a menos que se indique lo
contrario (con alguna etiqueta en alguna parte del inicio) para poder
integrar el buscador en sitios ya existentes; leer el archivo con
fgets() en lugar de get_file_contents() podría ser más óptimo; y por
último, continuando el comentario inicial, creo que sería bueno poder
definir un directorio donde pudieras almacenar los archivos
pre-procesados (resultados de la lectura de los HTML) e implementar un
"bot" que se "pasee" por todo el árbol de directorios (desde uno
indicado, por supuesto) y haga este pre-procesado de los archivos -sería
necesario también poder actualizar todo el directorio, o un archivo de
manera individual, para cuando hay cambios.
--perdón por el mega-párrafo.

        Creo que son todos mis comentarios por el momento, cuando pueda
analizar el código a más detalle probablemente añada más. Por cierto,
olvidé mencinar que en cuanto a flexibilidad, me parece bastante bien
pensado, salvo por la falta de integración simple con sitios ya existentes.

Camilo Kawerín wrote:
> Camilo Kawerín escribió:
>
>> http://27sur.com.ar/search/
>>
>> Serán apreciados comentarios y sugerencias.
>
> Che, gracias a todos por los comentarios...

-- 
Atentamente,
J. Rafael Salazar Magaña
Innox - Innovación Inteligente
Tel: +52 (33) 3615 5348 ext. 205 / 01 800 2-SOFTWARE
rsalazar_at_innox.com.mx
http://www.innox.com.mx
-- 
PHP Spanish Localization Talk Mailing List (http://www.php.net/)
To unsubscribe, visit: http://www.php.net/unsub.php
Nearby mié feb 15 2006 - 18:24:15 CET

Este archivo fue generado por hypermail 2.2.0 : mié nov 07 2007 - 20:55:35 CET


Página Principal
Google

Web
dns.bdat.net

Visita nuestro proveedor:
www.bdat.net

Publicidad:

Impresenteibols:Humor Jazz, música en vivo