Index


Droeppez Volltextsuche - Beschreibung

(c) 2002 Ulrich Kritzner
Homepage: www.droeppez.de

Die Droeppez - Suchmaschine durchsucht HTML-Dateien, die per meta-Angabe für die Suchmaschinensuche freigeschaltet wurden.
Die Suche erfolgt in dem Verzeichnis, in dem sich die Suchmaschine befindet sowie allen untergeordneten Verzeichnissen.
Übergeordnete Verzeichnisse werden nicht durchsucht.

Getestet wurde diese Suchmaschine an Apache-Servern mit PHP4-Modul unter Linux (SuSE).
Momentan (25.09.2002) ist sie auf meiner Homepage und meinem JavaScript-Tutorial im Einsatz.

Die drei Dateien
search.php
searchinc.php
searchserver.php
unterstehen der GNU GENERAL PUBLIC LICENSE.

Die Datei searchinc.php enthält die Suchfunktionen und wird von search.php sowie searchserver.php eingebunden.



Suchmaschine für den direkten Einsatz auf Homepages:

Die Datei search.php bietet eine HTML-Oberfläche an:
search.php (Suche nach dem Suchausdruck "Ulrich Kritzner" im aktuellen Verzeichnis) ansehen
Diese Suchmaschine läßt sich einfach und direkt in die Struktur von Netzpräsenzen einbinden und verlinkt die Suchergebnisse direkt. Die Ergebnisse werden nach Häufigkeit in absteigender Reihenfolge sortiert.

Parameter:
searchstring - Suchausdruck

Als Methode werden sowohl POST als auch GET akzeptiert.



Suchmaschine für die Weiterverwertung durch ein Suchportal:

Die Datei searchserver.php bietet eine Text-Ausgabe an:
searchserver.php (sortierte Suche nach dem Suchausdruck "Ulrich Kritzner" im aktuellen Verzeichnis) ansehen
Diese Suchmaschinen ist für die normale Einbindung in Netzpräsenzen ungeeignet.
Die Ausgabe dieses PHP-Scripts muß in einem anderen PHP-Script oder einem CGI-Programm weiterverarbeitet werden, um eine sinnvolle und hübsche HTML-Ausgabe zu erhalten.
Auf diese Weise lassen sich Suchmaschinen-Verbünde schaffen, die Suchergebnisse von verschiedenen Servern anfordern und lediglich die von dort angelieferten Ergebnisse anzeigen.

Parameter:
searchstring - Suchausdruck
sort - ob nach Funden sortiert werden soll, ja: yes, search oder true, sonst nein

Als Methode werden sowohl POST als auch GET akzeptiert.

Ausgabeformat:
#fil files
#keys keywords: #key1 #key2 ... #keyn
sorted: #sort
Hernach folgt die Auflistung aller Dateien, in denen der Ausdruck oder ein Teil dessen gefunden wurde.
Eine Zeile hat die Form:
#fa_#fb_#fc_-_#f1_#f2_..._#fn #filename #title #description

Erklärung:

#fil: Anzahl der gefundenen Dateien
#keys: Anzahl der Wörter des Suchausdrucks (in wie viele Worte läßt sich der Suchausdruck zerlegen)
#key1 #key2 ... #keyn: Auflistung der einzelnen Worte (einzelne Komponenten des Suchausdrucks)
#sort: true wenn sortiert, sonst false
#fa: Anzahl der Funde des Gesamtausdruckes (des gesamten unveränderten Suchausdrucks)
#fb: Anzahl der unterschiedlichen Worte, die gefunden wurden (wie viele verschiedene Worte befinden sich im Text)
#fb: Gesamtzahl aller Worte, die gefunden wurden (wie viele Worte wurden insgesamt gefunden)
#f1_#f2_..._#fn: Auflistung der Häufigkeit der einzelnen Worte
#filename: Dateiname einschließlich Pfad, Pfadangabe relativ zum Suchskript #title: Titel der HTML-Datei #filename: Description (aus dem meta-tag)