|
Krüger-Brand, Heike E.
Medizinische Suchwerkzeuge im World Wide Web: Schnelle Fundsache
Deutsches Ärzteblatt 97, Heft 18 vom 05.05.00, Seite 20 [SUPPLEMENT:
Praxis Computer]
Neben den Gesundheitsrubriken so prominenter Suchsysteme wie
Web.de, Yahoo!,
Lycos oder Excite, die sich eher an den medizinisch interessierten Laien wenden,
bietet das Internet auch spezielle Recherchequellen für den medizinischen
Bereich.
Suchsysteme sind unentbehrliche Dienste für die Orientierung in dem riesigen
Datenbestand des World Wide Web. Unterschieden werden rubriken- und abfragebasierte
Systeme, die je nach vorherrschendem Recherchebedarf ihre Vor- und Nachteile
haben. Erstere sind letztlich nichts anderes als redaktionell aufbereitete Link-Listen
oder Kataloge, während Letzere Volltextsuchsysteme (= Suchmaschinen, siehe
Tabelle) bezeichnen, die sich entweder auf das „gesamte“ Web oder aber auf die
Kataloge erstrecken.
Kataloge/Verzeichisse
Rubrikenbasierte Suchsysteme, so genannte Kataloge oder Verzeichnisse, strukturieren
Informationen in einer hierarchisch gegliederten Struktur aus Begriffen und
Unterbegriffen. Die Einträge in einem Katalog enthalten in der Regel neben
dem Titel eine kurze Beschreibung und einen Link auf das entsprechende Angebot.
Das Suchverfahren in diesen manuell erstellten Katalogen beruht auf der Navigation
in den hierarchisch aufgebauten Sachgebieten: Eine bestimmte Information wird
durch die Wahl eines „Pfades“ in der Begriffshierarchie eines Sachgebietes gefunden.
Meist gibt es auch die Möglichkeit der Stichwortsuche innerhalb der Katalogeinträge,
die mit verschiedenen Suchmodi (zum Beispiel Boolesche Operatoren wie „und“,
„oder“ etc.) kombinierbar ist. Diese Indexsuche ist jedoch auf die Link-Texte
der erfassten und kategorisierten Dokumente und deren Kurzbeschreibungen beschränkt.
Kataloge eignen sich daher vor allem, wenn man zu einem bestimmten Thema oder
Sachgebiet einen allgemeinen Einstieg finden will, und weniger für die
Suche nach einer spezifischen Information.
Aufgrund der manuellen Pflege haben thematische Verzeichnisse nur eine geringe
Reichweite innerhalb des World Wide Web, das heißt, nur ein kleiner Teil
der verfügbaren Daten im Internet ist darüber recherchierbar. Redaktionell
betreute Kataloge zu den Themen Medizin und Gesundheit für den Laien bieten
zum Beispiel große Suchdienste wie Excite (www.excite.de/gesundheit)
oder Yahoo (www.yahoo.de/gesundheit).
Suchmaschinen
Bei einem abfragebasierten Suchsystem („Suchmaschine“) werden Informationen
durch Einordnung der Wörter in eine Verweisdatenbank (Index) strukturiert.
Die gesuchte Information wird dabei durch den Eintrag eines Suchbegriffes in
ein Abfrageformular gefunden. Die Suchmaschine listet dann die Informationen,
auf die der Suchbegriff im Index verweist.
Häufig können mit Booleschen Operatoren mehrere Suchbegriffe miteinander
verknüpft werden. Das Suchergebnis wird in der Regel in Form einer nach
Relevanzgrad sortierten Trefferliste („Ranking“, meist nach statistischen Verfahren
wie Worthäufigkeit, Wortreihenfolge und Ähnliches) ausgegeben, oft
ergänzt durch automatisch generierte Abstracts und andere Zusatzinformationen
wie zum Beispiel das Erstelldatum.
Suchmaschinen verfolgen das Ziel, eine Volltextsuche über die im Internet
verfügbaren Dokumente zu ermöglichen – Schätzungen zufolge lässt
sich rund ein Drittel aller im World Wide Web verfügbaren Daten zurzeit
mithilfe dieser leistungsstarken Werkzeuge recherchieren. Möglich wird
dies durch automatisierte Formen der Dokumentenbeschaffung, die mit inhaltserschließenden
Methoden des klassischen „Information Retrieval“ kombiniert werden. Dazu greifen
die Suchmaschinen auf „Robots“ zurück, das sind automatisch ablaufende
Programme, die das Web selbstständig nach verschiedenen, vorab definierten
Kriterien durchsuchen und Informationen sammeln. Sie indizieren den Inhalt von
Web-Dokumenten und erstellen auf diese Weise eine Datenbank.
Suchmaschinen haben gegenüber Verzeichnissen den Vorteil einer großen
Reichweite und ermöglichen die gezielte Suche nach Namen wie zum Beispiel
Produkten, Personen, Fachbegriffen. Ein Nachteil ist die schlechte Relevanz
der Treffermenge, die häufig viele unbrauchbare Einträge aufweist.
Suchstrategien
Wer nach Eingabe eines oder mehrerer Stichwörter Hunderte von Treffern
erzielt, muss die Sucheingabe verfeinern, zum Beispiel durch Synonymeingabe,
Boolesche Funktionen, Phrasen, Datumsangabe („nicht älter als . . .“) und
Ähnliches. Das Ergebnis einer Suche fällt häufig sehr unterschiedlich
aus, denn die Suchmaschinen unterscheiden sich beispielsweise im Hinblick auf
die Anzahl registrierter Web-Seiten, die verwendeten Suchalgorithmen, die zugrundeliegenden
Indizierungsverfahren und die Aktualisierungsfrequentierung – all dies wirkt
sich auf Anzahl und Brauchbarkeit der Treffer aus.
Einige Suchdienste bieten verschiedene Suchmodi an (siehe Kasten), die bei der
Suche helfen. Bevor man eine Suchmaschine zu Recherchezwecken nutzt, sollte
man sich daher die Zeit nehmen und die Anleitung oder Hilfe des jeweiligen Suchwerkzeuges
durchlesen. Darüber hinaus gibt es weitere Möglichkeiten, die Effizienz
einer Recherche zu verbessern. Entscheidend ist die Auswahl der richtigen Suchbegriffe.
Vorab ist beispielsweise zu überlegen: Sollen nur deutschsprachige Dokumente
berücksichtigt werden? Will man sich in ein neues Themengebiet einarbeiten,
oder sucht man nach einer speziellen Information? Während es sinnvoll ist,
in Katalogen zunächst mit eher allgemeinen Suchbegriffen zu beginnen, führt
bei großen Suchmaschinen oder speziellen Katalogen die Eingabe spezieller
Suchbegriffe schneller zum Erfolg.
Deutschsprachige medizinische Suchsysteme
N Dr. Antonius (www.dr-antonius. de): Der Webrobot dieser Suchmaschine durchsucht
das Web systematisch nach deutschsprachigen medizinischen Ressourcen. Basis
ist der Frankfurter Index, eine am Zentrum der Medizinischen Informatik des
Klinikums der Johann Wolfgang Goethe-Universität erstellte Sammlung von
analysierten URLs: Erst wenn die Bedingungen „deutschsprachig“ und „medizinisch“
erfüllt sind, wird eine Seite verschlagwortet und archiviert. Alle Hyperlinks
einer Seite werden gespeichert und zu einem späteren Zeitpunkt weiterverfolgt.
Die Identifizierung einer medizinischen Seite beruht auf einer Wortliste mit
rund 15 000 medizinischen Begriffen. Neben der einfachen Schlagwortsuche und
der erweiterten Suche mit Booleschen und positionellen Operatoren gibt es eine
thesaurusunterstützte Suche, bei der eingegebene Suchbegriffe entsprechend
der semantischen Beziehung des ICD-10-Diagnosenthesaurus und des am Informatikzentrum
entwickelten Xmed-Thesaurus erweitert werden. Mit Sortierung der Suchergebnisse
(Ranking).
N Medivista (www.medivista.de): Die medizinische Suchmaschine des Deutschen
Medizin Forums (Start: 1997) ist ein Robot, der automatisiert und in regelmäßigen
Abständen Internet-Seiten besucht und daraus einen Index für die Stichwortsuche
erstellt. Einbezogen werden deutschsprachige und internationale Internet-Rechner
mit medizinischen Dokumenten und Artikeln. Die Zieladressen sind redaktionell
ausgewählt. Im September 1998 hatte Medivista mehr als 120 000 medizinische
Server besucht und aus den Inhalten eine Datenbank von mehr als 800 000 abfragbaren
Stichwörtern erzeugt. Wöchentlich werden rund 7 000 Dokumente neu
indiziert. Dabei werden auch Archive medizinischer Fachzeitschriften und renommierte
Datenbanken wie das CancerNet mit einbezogen.
Beispiele für kostenfreie englischsprachige Suchwerkzeuge
N Medical World Search (www.mwsearch.com): Intelligente Suchmaschine, die auf
eine Wissenbasis von mehr als 500 000 medizinischen Begriffen einschließlich
Synonyme und Definitionen zurückgreift und den von der National Library
of Medicine (NLM) entwickelten Medizin-Thesaurus verwendet. Boolesche Suchanfragen
sind möglich.
N CliniWeb International (www.ohsu.edu/cliniweb/search.html): Intelligente
Suchmaschine der Oregon Health Science University (OHSU), bearbeitet Suchanfragen
in Englisch, Spanisch, Deutsch, Portugiesisch und Russisch; Französisch
ist angekündigt: mit Links von den MeSH-Begriffen zu
PubMed, dem Medline-Suchservice
der National Library of Medicine (NLM); erweiterte Suchmöglichkeiten sind
integriert.
N Medhunt (www.hon.ch/MedHunt): Die medizinische Volltext-Suchmaschine der Health
On the Net Foundation (HON, siehe auch Abbildung auf Seite 20) greift bei der
Suche auf zwei separate Datenbanken zurück: zum einen auf den mit einem
Robot („Marvin“) erstellten, glossarbasierten Medizin-Index, zum andern auf
einen redaktionell erstellten Katalog, der ausschließlich Web-Seiten aufnimmt,
die den Kriterien des HON-Codes entsprechen. Neben der einfachen Suche mit Booleschen
Operatoren, Trefferbegrenzung und weiteren Spezifikationen gibt es auch eine
Advanced Search mit Wortausschluss, Wild Card und Verknüfungsmöglichkeiten
von einfachen Suchen. Französischsprachige Suchanfragen sind ebenfalls
möglich.
Heike E. Krüger-Brand
|