Krüger-Brand, Heike E.

Medizinische Suchwerkzeuge im World Wide Web: Schnelle Fundsache

Deutsches Ärzteblatt 97, Heft 18 vom 05.05.00, Seite 20 [SUPPLEMENT: Praxis Computer]

Neben den Gesundheitsrubriken so prominenter Suchsysteme wie Web.de, Yahoo!, Lycos oder Excite, die sich eher an den medizinisch interessierten Laien wenden, bietet das Internet auch spezielle Recherchequellen für den medizinischen Bereich.
Suchsysteme sind unentbehrliche Dienste für die Orientierung in dem riesigen Datenbestand des World Wide Web. Unterschieden werden rubriken- und abfragebasierte Systeme, die je nach vorherrschendem Recherchebedarf ihre Vor- und Nachteile haben. Erstere sind letztlich nichts anderes als redaktionell aufbereitete Link-Listen oder Kataloge, während Letzere Volltextsuchsysteme (= Suchmaschinen, siehe Tabelle) bezeichnen, die sich entweder auf das „gesamte“ Web oder aber auf die Kataloge erstrecken.

 

Kataloge/Verzeichisse
Rubrikenbasierte Suchsysteme, so genannte Kataloge oder Verzeichnisse, strukturieren Informationen in einer hierarchisch gegliederten Struktur aus Begriffen und Unterbegriffen. Die Einträge in einem Katalog enthalten in der Regel neben dem Titel eine kurze Beschreibung und einen Link auf das entsprechende Angebot.
Das Suchverfahren in diesen manuell erstellten Katalogen beruht auf der Navigation in den hierarchisch aufgebauten Sachgebieten: Eine bestimmte Information wird durch die Wahl eines „Pfades“ in der Begriffshierarchie eines Sachgebietes gefunden. Meist gibt es auch die Möglichkeit der Stichwortsuche innerhalb der Katalogeinträge, die mit verschiedenen Suchmodi (zum Beispiel Boolesche Operatoren wie „und“, „oder“ etc.) kombinierbar ist. Diese Indexsuche ist jedoch auf die Link-Texte der erfassten und kategorisierten Dokumente und deren Kurzbeschreibungen beschränkt. Kataloge eignen sich daher vor allem, wenn man zu einem bestimmten Thema oder Sachgebiet einen allgemeinen Einstieg finden will, und weniger für die Suche nach einer spezifischen Information.
Aufgrund der manuellen Pflege haben thematische Verzeichnisse nur eine geringe Reichweite innerhalb des World Wide Web, das heißt, nur ein kleiner Teil der verfügbaren Daten im Internet ist darüber recherchierbar. Redaktionell betreute Kataloge zu den Themen Medizin und Gesundheit für den Laien bieten zum Beispiel große Suchdienste wie Excite (www.excite.de/gesundheit) oder Yahoo (www.yahoo.de/gesundheit).

 

Suchmaschinen
Bei einem abfragebasierten Suchsystem („Suchmaschine“) werden Informationen durch Einordnung der Wörter in eine Verweisdatenbank (Index) strukturiert. Die gesuchte Information wird dabei durch den Eintrag eines Suchbegriffes in ein Abfrageformular gefunden. Die Suchmaschine listet dann die Informationen, auf die der Suchbegriff im Index verweist.
Häufig können mit Booleschen Operatoren mehrere Suchbegriffe miteinander verknüpft werden. Das Suchergebnis wird in der Regel in Form einer nach Relevanzgrad sortierten Trefferliste („Ranking“, meist nach statistischen Verfahren wie Worthäufigkeit, Wortreihenfolge und Ähnliches) ausgegeben, oft ergänzt durch automatisch generierte Abstracts und andere Zusatzinformationen wie zum Beispiel das Erstelldatum.
Suchmaschinen verfolgen das Ziel, eine Volltextsuche über die im Internet verfügbaren Dokumente zu ermöglichen – Schätzungen zufolge lässt sich rund ein Drittel aller im World Wide Web verfügbaren Daten zurzeit mithilfe dieser leistungsstarken Werkzeuge recherchieren. Möglich wird dies durch automatisierte Formen der Dokumentenbeschaffung, die mit inhaltserschließenden Methoden des klassischen „Information Retrieval“ kombiniert werden. Dazu greifen die Suchmaschinen auf „Robots“ zurück, das sind automatisch ablaufende Programme, die das Web selbstständig nach verschiedenen, vorab definierten Kriterien durchsuchen und Informationen sammeln. Sie indizieren den Inhalt von Web-Dokumenten und erstellen auf diese Weise eine Datenbank.
Suchmaschinen haben gegenüber Verzeichnissen den Vorteil einer großen Reichweite und ermöglichen die gezielte Suche nach Namen wie zum Beispiel Produkten, Personen, Fachbegriffen. Ein Nachteil ist die schlechte Relevanz der Treffermenge, die häufig viele unbrauchbare Einträge aufweist.


Suchstrategien
Wer nach Eingabe eines oder mehrerer Stichwörter Hunderte von Treffern erzielt, muss die Sucheingabe verfeinern, zum Beispiel durch Synonymeingabe, Boolesche Funktionen, Phrasen, Datumsangabe („nicht älter als . . .“) und Ähnliches. Das Ergebnis einer Suche fällt häufig sehr unterschiedlich aus, denn die Suchmaschinen unterscheiden sich beispielsweise im Hinblick auf die Anzahl registrierter Web-Seiten, die verwendeten Suchalgorithmen, die zugrundeliegenden Indizierungsverfahren und die Aktualisierungsfrequentierung – all dies wirkt sich auf Anzahl und Brauchbarkeit der Treffer aus.
Einige Suchdienste bieten verschiedene Suchmodi an (siehe Kasten), die bei der Suche helfen. Bevor man eine Suchmaschine zu Recherchezwecken nutzt, sollte man sich daher die Zeit nehmen und die Anleitung oder Hilfe des jeweiligen Suchwerkzeuges durchlesen. Darüber hinaus gibt es weitere Möglichkeiten, die Effizienz einer Recherche zu verbessern. Entscheidend ist die Auswahl der richtigen Suchbegriffe. Vorab ist beispielsweise zu überlegen: Sollen nur deutschsprachige Dokumente berücksichtigt werden? Will man sich in ein neues Themengebiet einarbeiten, oder sucht man nach einer speziellen Information? Während es sinnvoll ist, in Katalogen zunächst mit eher allgemeinen Suchbegriffen zu beginnen, führt bei großen Suchmaschinen oder speziellen Katalogen die Eingabe spezieller Suchbegriffe schneller zum Erfolg.

 

Deutschsprachige medizinische Suchsysteme
N Dr. Antonius (www.dr-antonius. de): Der Webrobot dieser Suchmaschine durchsucht das Web systematisch nach deutschsprachigen medizinischen Ressourcen. Basis ist der Frankfurter Index, eine am Zentrum der Medizinischen Informatik des Klinikums der Johann Wolfgang Goethe-Universität erstellte Sammlung von analysierten URLs: Erst wenn die Bedingungen „deutschsprachig“ und „medizinisch“ erfüllt sind, wird eine Seite verschlagwortet und archiviert. Alle Hyperlinks einer Seite werden gespeichert und zu einem späteren Zeitpunkt weiterverfolgt. Die Identifizierung einer medizinischen Seite beruht auf einer Wortliste mit rund 15 000 medizinischen Begriffen. Neben der einfachen Schlagwortsuche und der erweiterten Suche mit Booleschen und positionellen Operatoren gibt es eine thesaurusunterstützte Suche, bei der eingegebene Suchbegriffe entsprechend der semantischen Beziehung des ICD-10-Diagnosenthesaurus und des am Informatikzentrum entwickelten Xmed-Thesaurus erweitert werden. Mit Sortierung der Suchergebnisse (Ranking).
N Medivista (www.medivista.de): Die medizinische Suchmaschine des Deutschen Medizin Forums (Start: 1997) ist ein Robot, der automatisiert und in regelmäßigen Abständen Internet-Seiten besucht und daraus einen Index für die Stichwortsuche erstellt. Einbezogen werden deutschsprachige und internationale Internet-Rechner mit medizinischen Dokumenten und Artikeln. Die Zieladressen sind redaktionell ausgewählt. Im September 1998 hatte Medivista mehr als 120 000 medizinische Server besucht und aus den Inhalten eine Datenbank von mehr als 800 000 abfragbaren Stichwörtern erzeugt. Wöchentlich werden rund 7 000 Dokumente neu indiziert. Dabei werden auch Archive medizinischer Fachzeitschriften und renommierte Datenbanken wie das CancerNet mit einbezogen.
Beispiele für kostenfreie englischsprachige Suchwerkzeuge
N Medical World Search (www.mwsearch.com): Intelligente Suchmaschine, die auf eine Wissenbasis von mehr als 500 000 medizinischen Begriffen einschließlich Synonyme und Definitionen zurückgreift und den von der National Library of Medicine (NLM) entwickelten Medizin-Thesaurus verwendet. Boolesche Suchanfragen sind möglich.
N CliniWeb International (www.ohsu.edu/cliniweb/search.html): Intelligente Suchmaschine der Oregon Health Science University (OHSU), bearbeitet Suchanfragen in Englisch, Spanisch, Deutsch, Portugiesisch und Russisch; Französisch ist angekündigt: mit Links von den MeSH-Begriffen zu PubMed, dem Medline-Suchservice der National Library of Medicine (NLM); erweiterte Suchmöglichkeiten sind integriert.
N Medhunt (www.hon.ch/MedHunt): Die medizinische Volltext-Suchmaschine der Health On the Net Foundation (HON, siehe auch Abbildung auf Seite 20) greift bei der Suche auf zwei separate Datenbanken zurück: zum einen auf den mit einem Robot („Marvin“) erstellten, glossarbasierten Medizin-Index, zum andern auf einen redaktionell erstellten Katalog, der ausschließlich Web-Seiten aufnimmt, die den Kriterien des HON-Codes entsprechen. Neben der einfachen Suche mit Booleschen Operatoren, Trefferbegrenzung und weiteren Spezifikationen gibt es auch eine Advanced Search mit Wortausschluss, Wild Card und Verknüfungsmöglichkeiten von einfachen Suchen. Französischsprachige Suchanfragen sind ebenfalls möglich.
Heike E. Krüger-Brand