Suchen mit Google & Co

Bild: Stéfan, Lizenz: CC BY-NC-SA

Die vier Grundregeln des Recherchierens

Recherchieren klingt sehr anspruchsvoll. Letztlich aber machen wir es täglich: Wir wollen etwas wissen und erkundigen uns. Wir fragen jemanden, schauen in einem Buch oder im Internet nach. Den Schritt vom „Wissenwollen“ zum „Recherchieren“ machen wir dann, wenn wir Informationen für ein Referat, eine wissenschaftliche Arbeit oder für einen Zeitungsartikel benötigen. Ob kurze Internetabfrage oder aufwendige Recherche: Im Grunde passiert immer dasselbe. Und auch die Regeln sind dieselben.

 

Informationsquelle einschätzen

Wir glauben nur Informationen, deren Quelle wir als zuverlässig einschätzen. Wenn die Eltern eines Schülers bislang immer eine richtige Antwort auf seine Fragen wussten, dann wird der Schüler auch weiterhin seine Eltern befragen und die Antworten für wahr halten. Wenn wir öfter die Schlagzeile einer großen Boulervardzeitung als übertrieben und wenig glaubhaft eingestuft haben, dann werden wir der Zeitung auch in Zukunft wenig glauben. Was wir oft intuitiv richtig machen, das kann man bewusst fragen: Wie glaubwürdig ist eine Quelle?

 

Unterschiedliche Quellen nutzen

Für Journalisten gilt die Grundregel: Immer mindestens zwei Quellen befragen. Das allerdings macht Arbeit und kostet Zeit. Die meisten Menschen sind froh, wenn sie eine Antwort auf ihre Fragen bekommen. Je nach Gegenstand ist es aber ratsam, eine weitere Quelle zu befragen. Hinter bestimmten Informationen kann es massive Interessen geben. Es kann daher nichts schaden, Informationen von Berufs- und Standesverbänden, von Vereinen, von Regierung oder Parteien und von Firmen mit neutralen Informationen zu vergleichen. Heute bietet das Internet dazu schnelle und umfassende Möglichkeiten – man muss sie nur nutzen. Informationen stehen aber auch in Büchern oder Zeitschriften. Auch das persönliche Gespräch mit einem sachkundigen Menschen ist eine legitime Art, sich zu informieren.

 

Originalquellen befragen

Vieles von dem, was wir lesen (in Zeitungen oder im Internet) kommt tatsächlich aus zweiter Hand. Das heißt, der Autor hat es nicht selbst gesehen oder erlebt, sondern irgendwo anders abgeschrieben. Zum Beispiel aus einer Pressemeldung, einer anderen Zeitung, aus einem Buch oder aus dem Internet. Studien haben ergeben, dass rund 75 Prozent aller Informationen, die User im Netz verbreiten, letztlich aus den „traditionellen“ Medien Zeitung, Fernsehen und Radio (also aus zweiter oder dritter Hand) stammen. Am verlässlichsten ist eine Information aber immer dann, wenn man sie direkt von demjenigen bekommt, der die Dinge selbst gesehen oder erlebt hat. Zur Not hilft ein Griff zum Telefon.

Google & Co – Was man über Suchmaschinen wissen sollte

Suchmaschinen – dass das Wort im Plural steht, müsste eigentlich erstaunen. Denn faktisch wird nur eine einzige Suchmaschine in Deutschland genutzt: Google. Weit über 90 Prozent aller Suchanfragen laufen über den Internetgiganten. Was zunächst so alltäglich erscheint, das lohnt einen tieferen Blick. Denn wer weiß schon, wer Google wirklich ist, wie Google arbeitet, welche anderen Typen von Suchmaschinen es gibt, wie man professionell sucht und wo die Fallstricke liegen?

 

Wer ist Google?

Die Suchmaschine Google wurde 1998 gegründet. Sie leitet ihren Namen vom mathematischen Ausdruck „googol“ = 10 hoch 100 ab. Neu an Google war damals, dass die Suche (mit einem inzwischen patentierten) algorithmischen Verfahren, dem PageRank, die Relevanz zwischen dem Suchbegriff und den Suchergebnissen ermittelt, und zwar in erster Linie anhand der Links von anderen Seiten. Grundgedanke dieses Ansatzes ist, dass auf Webseiten mit qualitativ guten Inhalten bedeutend mehr Links verweisen als auf Webseiten mit minderwertigen Inhalten. Eine Webseite wird also umso höher bewertet, je mehr andere Seiten auf sie verweisen. Nicht nur die Relevanz der Suchergebnisse war eine Neuerung von Google, sondern auch die schlichte Benutzeroberfläche und die Geschwindigkeit. Das Unternehmen wuchs schnell und macht heute mit 32.000 Mitarbeiterinnen und Mitarbeitern einen Jahresumsatz von knapp 40 Mrd. Dollar, der Börsenwert des Unternehmens beträgt 120 Mrd. Euro (zum Vergleich: Daimler-Benz hat über 270.000 Mitarbeiterinnen und Mitarbeiter, macht rund 100 Mrd. Euro Umsatz und hat einen Börsenwert von 40 Mrd. Euro). Die Marke „Google“ gehört neben Apple, Coca-Cola, IBM und Microsoft zu den wertvollsten Marken der Welt. Google schaltet über seine Tochterfirma DoubleClick auch Internet-Werbung.

 

Wie arbeitet Google?

Eine Suchmaschine durchsucht nicht das komplette Internet, sondern nur einen Teil davon, das World Wide Web. Andere Dienste im Internet wie z.B. E-Mail, Datenübertragung (FTP), Chats oder Internettelefonie werden nicht durchsucht. Die Durchführung einer Suche im WWW ist technisch komplizierter als sie auf den ersten Blick erscheint. Im Hintergrund laufen drei Vorgänge ab, um eine Suchanfrage beantworten zu können:

 

1. Erfassung
Suchmaschinen erfassen laufend neue und veränderte Informationen im World Wide Web und speichern sie ab. Dies geschieht durch sogenannte Crawler (auch Spider oder Suchroboter genannt). Ein Crawler ist ein System aus Soft- und Hardware, das systematisch und kontinuierlich das Internet durchsucht, die auf den Internetseiten vorhandene Informationen einsammelt und diese dann auf den Servern der Suchmaschine abspeichert.


2. Informationsaufbereitung und Indizierung
Diese Sammlung von Daten wird nun so aufbereitet, dass effizient ein Index erstellt werden kann. Der Index ist der Kern jeder Websuchmaschine. Er ist vergleichbar mit dem Stichwortregister eines Buches. Der Suchmaschinenindex enthält einerseits Indexbegriffe, andererseits die Informationen darüber, auf welchen Internetseiten die Begriffe vorkommen. Der Suchindex ist also ein virtuelles Verzeichnis, das Milliarden von Verweisen auf Webseiten umfasst.


3. Informationsbereitstellung
Gibt ein Nutzer eine Suchanfrage ein, dann wird nicht das Internet durchsucht, sondern nur noch der Index der Suchmaschine; er kann sehr viel schneller und effizienter durchsucht werden. Abschließend werden die relevantesten Ergebnisse in einer Liste dargestellt. Ein wichtiger Trick, um den Suchablauf zu beschleunigen, besteht darin, Ergebnisse häufiger Suchanfragen zwischenzuspeichern, d.h. nicht jedes Mal aufs Neue den Index zu durchsuchen, sondern auf bereits „fertige“ Suchergebnisse zurückzugreifen.

 

Eine Suchmaschine durchsucht zwar fast das gesamte WWW – aber eben nur fast. Es gibt Seiten, die eine Suchmaschine nicht auflisten kann. So sind prinzipiell nur jene Webseiten für Suchmaschinen auffindbar, die öffentlich zugänglich sind. Seiten, die (durch einen bestimmten Befehl) eine Suche nicht zulassen, kann die Suchmaschine nicht finden. Auch sehr neue Seiten sind (noch) nicht im Suchindex aufgeführt. Einige wenige Seiten werden auch manuell entfernt, z.B. wenn sie gegen Gesetze oder Jugendschutzbestimmungen verstoßen oder aufgrund gerichtlicher Anordnung. Auch Spamseiten oder Seiten, die versuchen, den Algorithmus zu manipulieren, werden mitunter gesperrt.

 

Andere Suchmaschinen

Generell lassen sich Suchmaschinen in drei verschiedene Typen einteilen: indexbasierte Suchmaschinen, Katalogsuchmaschinen und Metasuchmaschinen. Der am weitesten verbreitete Typ bietet eine indexbasierte Suche. Die bekanntesten Beispiele für indexbasierte Suchmaschinen sind Google, Bing, Yahoo und Ask. Bing wurde 1998 von Microsoft (damals unter dem Namen MSN) gestartet. Anfang 2010 vermeldete Yahoo, dass zukünftig auf den Algorithmus von Bing zurückgegriffen werde. Im Grunde gibt es also nur noch zwei weltweit relevante Suchindexe: den von Google und den von Bing (Microsoft). Der Vorteil von indexbasierten Suchmaschine sind die Schnelligkeit, mit der die jeweiligen Suchergebnislisten angezeigt werden, sowie der Umfang des Indexes.

 

Eine katalogbasierte Suchmaschine bietet Suchergebnisse, die von Menschen vorher zusammengetragen und geordnet und ggf. auch manuell gewichtet wurden. Im Normalfall steckt hinter einem Katalog eine alphabetische oder nach thematischen Kriterien geordnete Liste. Beispiele sind Open Directories (wie dmoz.org oder dmoz.de) und Kindersuchseiten (wie fragfinn.de oder blindekuh.de).

Eine Metasuchmaschine erstellt keinen eigenen Suchindex, sondern greift auf den Datenbestand indexbasierter Suchmaschinen zurück. Beispiele sind metager.de oder ixquick.de. Der Vorteil einer Metasuchmaschine liegt in dem theoretisch größeren Datenbestand, der aus der Verknüpfung der Einzelbestände resultiert. Ein weiterer Vorteil besteht darin, dass Metasuchmaschinen in vielen Fällen keine persönlichen Daten speichern. Metasuchmaschinen werden im Vergleich zu den indexbasierten Suchmaschinen nur noch wenig genutzt.

Wie kommt das Ranking zustande?

Um die erfassten Seiten darstellen zu können, muss die Suchmaschine die Ergebnisse in eine Reihenfolge bringen. Dieses Ranking ist neben der Geschwindigkeit ein wichtiges Kriterium dafür, wie nützlich eine Suchmaschine für den Nutzer ist. Es wird von einer Vielzahl von Faktoren bestimmt, die im Einzelnen das Betriebsgeheimnis der Suchmaschinenbetreiber sind. Die wesentlichen Faktoren zur Bestimmung des Rankings werden in der Wissenschaft in vier Bereiche unterteilt:

 

1. Keywords im Text. Mit Hilfe textspezifischer Faktoren wird ermittelt, welche relevanten Wörter in den zu durchsuchenden Dokumenten vorkommen und deswegen in die Suchergebnisliste mit aufgenommen werden sollen. Ein solcher textspezifischer Faktor kann beispielsweise die Gewichtung von Worttypen sein; ein Wort wie „in“ ist weniger relevant als ein spezifisches Wort wie „Fußballweltmeisterschaft“. Höher gewichtet werden auch Wörter, die an besonders bedeutenden Stellen stehen bzw. ausgezeichnet sind, wie zum Beispiel in der Überschrift oder Fettschrift im Text.

 

2. Vorhandene Verlinkungen. Die „Wichtigkeit“ einer Seite anhand der Links von anderen Seiten wird algorithmisch gemessen, beispielsweise durch das PageRank-Verfahren.

 

3. Aktualität. Abhängig von der Art der Suchanfrage gilt es, entweder besonders aktuelle Dokumente oder aber ältere Dokumente anzuzeigen, die besonders häufig abgerufen werden. Da Dokumente, die vor längerer Zeit ins Netz gestellt wurden, in der Tendenz bereits häufiger verlinkt wurden als Dokumente, die weniger lange im Netz standen, berücksichtigen Suchmaschinen heute die Aktualität von Dokumenten als Ausgleichsfaktor und lassen diese in das Ranking einfließen.

 

4. Lokalität. Lokalität bezieht sich auf den Standort des Nutzers. Beispielsweise werden deutsche Dokumente bevorzugt, wenn der Nutzer durch die Suchmaschine in Deutschland lokalisiert wurde.

 

Jeder Nutzer möchte gerne, dass die für ihn relevanten Ergebnisse möglichst weit oben in der Liste stehen. Deshalb versuchen Suchmaschinen, die Ergebnisse zu personalisieren, zum Beispiel über die erwähnte Lokalität. Doch auch das Nutzerverhalten bzw. die Klickhäufigkeit der Nutzer kann eine Rolle spielen. Wird ein bestimmtes Suchergebnis häufig angeklickt, so kann dies ein Indiz für die Suchmaschine sein, dass die Inhalte der Seite offenbar für viele Suchende relevant sind. Klickt ein Nutzer häufig Anzeigen im Sportbereich an, so kann die Suchmaschine diesem Nutzer vermehrt Sportanzeigen zur Verfügung stellen.

Tipp: Wann wurde eine Seite von der Suchmaschine indiziert?
Wann eine Seite zuletzt indiziert wurde, lässt sich zum Beispiel bei Google herausfinden, in dem man auf den Link „Im Cache“ geht, der über den Doppelpfeil >> rechts neben dem Suchbegriff erreichbar ist.

Praxis: Richtig Suchen

Um das Wichtigste vorweg zu sagen: Bei den gebräuchlichen Suchmaschinen reicht die simple Eingabe eines Wortes oder einer Wortgruppe aus, um die gesuchten Webseiten zu finden. Es gibt jedoch ein paar einfache Möglichkeiten, die Suche erheblich zu verbessern.

 

Anmerkung: Bei den nachfolgenden Such-Beispielen werden eckige Klammern [ ] zum Kennzeichnen von Suchanfragen verwendet. Beispiel: [Schwarzweiß] kennzeichnet somit eine einzelne Suchanfrage, während [Schwarz] und [Weiß] für zwei unterschiedliche Suchanfragen stehen.

 

Jedes Wort ist von Bedeutung: Bei der Auswertung einer Suchanfrage werden in der Regel alle eingegebenen Wörter berücksichtigt. Der Operator UND wird dabei standardmäßig hinzugefügt und ist daher nicht notwendig.

 

Beispiel: [Berlin Kneipe] führt zum selben Ergebnis wie die Eingabe von „[Berlin] UND [Kneipe]“

 

Bei der Suche spielt die Groß-/Kleinschreibung keine Rolle.

 

Beispiel: Eine Suche nach [new york times] ruft dieselben Suchergebnisse hervor wie [New York Times].

 

Wörter, die sehr häufig verwendet werden, wie „der“, „die“, „das“,  „ein“, „eine“, „einer“, „für“ usw., werden in der Regel von Suchmaschinen ignoriert. Dasselbe gilt für Satzzeichen. Für beide Gruppen gibt es jedoch einige Ausnahmen: Die Suchanfrage [die Ärzte] bezieht sich wahrscheinlich auf die Musikgruppe Die Ärzte, während [Ärzte] sich wahrscheinlich auf den Berufsstand der Mediziner bezieht. In diesem Fall wird der Artikel „die“ in der Anfrage [die Ärzte] ausnahmsweise nicht ignoriert.

 

Satzzeichen in bekannten Begriffen, die eine bestimmte Bedeutung haben, wie etwa [C++] oder [C#] (beides sind Namen von Programmiersprachen), werden ebenfalls nicht ignoriert. Das Euro-Zeichen (€) weist in der Regel auf Preisangaben hin. [nikon 400] und [nikon € 400] ergeben folglich unterschiedliche Ergebnisse. Auch hier wird also das Sonderzeichen ausnahmsweise nicht ignoriert.

 

Suche nach Wortgruppen mit („“): Gibt man mehrere Wörter an, dann werten die meisten Suchmaschinen die Reihenfolge als klares Signal. Anführungszeichen sind also in der Regel unnötig. Wenn man nun aber eine Wortgruppe in Anführungszeichen setzt, so berücksichtigt die Suchmaschine genau diese Worte in genau dieser Reihenfolge. Beachtet werden sollte jedoch immer: Wenn man auf die Suche nach einer Wortgruppe besteht, schließt man möglicherweise andere gute Ergebnisse aus.

 

Beispiel: Eine Suche nach [„Alexander Bell“] (mit Anführungszeichen) lässt möglicherweise die Seiten aus, in denen „Alexander G. Bell“ auftaucht.

 

Suchanfragen mit Leerstellen *: Das Sternchen oder Platzhalterzeichen * ist eine der weniger bekannten Funktionen, die jedoch sehr effektiv sein kann. Wenn man * in eine Anfrage einfügt, behandelt ein Großteil der Suchmaschinen das Sternchen als Platzhalter für unbekannte Begriffe und sucht nach den besten Übereinstimmungen.

 

Beispiel: Die Anfrage [Obama hat mit * über den Gesetzesvorschlag * abgestimmt] liefert Beiträge über verschiedene Abstimmungen zu verschiedenen Gesetzesvorschlägen.

 

Der Operator * funktioniert nur für ganze Wörter, nicht für Teile von Wörtern.

 

Ausschluss von Begriffen mit -: Fügt man ein Minuszeichen direkt vor ein Wort ein, schließt man Seiten, die dieses Wort enthalten, von den Suchergebnissen aus. Das Minuszeichen muss sich unmittelbar vor dem betreffenden Wort befinden und vor dem Minuszeichen muss ein Leerzeichen stehen.

 

Beispiel: In der Anfrage [Anti-Viren-Software] fungiert das Minuszeichen als Bindestrich und wird nicht als Ausschlusssymbol gewertet. Bei der Anfrage [Anti-Viren -Software] wird nach den Worten „Anti-Viren“ gesucht, Seiten, die den Begriff „Software“ enthalten, werden hingegen ausgeschlossen.

 

Man kann beliebig viele Wörter ausschließen, indem man jedem von ihnen ein Minuszeichen (-) voranstellt.

 

Beispiel: [Jaguar -Autos -Fußball -Betriebssystem] sucht nach dem Tier Jaguar. Alle Seiten, die die Begriffe Auto oder Fußball oder Betriebsystem enthalten, werden ausgeschlossen.

Tipp: Sonderfunktionen bei Google
Bei Google kann man im Suchfeld noch einige andere Funktionen abrufen als nur die reine Suche. So lassen sich zum Beispiel mathematische Operationen erledigen.

 

Beispiel: Die Eingabe von [3*125] zeigt das Ergebnis „375“ an.


Auch wenn man eine Währungs, Maß- oder Temperatureinheit umrechnen möchte, kann man einfach die gewünschte Umrechnung in das Google-Suchfeld eingeben. Die Antwort erscheint direkt auf der Suchergebnisseite.


Beispiel: Die Eingabe von [100 CHF in Euro] zeigt 82,02 Euro“ an.

Kritik an Suchmaschinen

Die Kritik an Suchmaschinen entzündet sich an zwei Punkten: Datenschutz und Filter. Die Kritik zum Stichwort Datenschutz sagt vereinfacht, dass Suchmaschinen ziemlich viele Daten über uns sammeln – und wer weiß, was sie damit machen. Es lohnt sich, diese Kritik einmal in einem erweiterten Zusammenhang zu betrachten.

 

Das Produkt einer Suchmaschine ist einerseits die Suchfunktion, andererseits die Schaltung von Werbung. Unter dem Stichwort „personalisierte Suche“ versuchen Suchmaschinen nun die Relevanz der Suchergebnisse für den einzelnen Nutzer zu verbessern. Außerdem kann Werbung zielgerichteter geschaltet werden.

 

Suchmaschinen sammeln Daten also ebenso wie viele andere Wirtschaftssubjekte, um ihr Produkt zu verbessern und ihren Umsatz zu steigern. Und ebenso wie bei (fast) allen anderen Wirtschaftsteilnehmer ist es für uns Nutzerinnen und Nutzer zunächst nicht ersichtlich, was genau Suchmaschinen mit „unseren“ Daten machen (ebenso wenig wie wir es von Banken, Handelsunternehmen oder Krankenhäuser wissen). Was wir aber wissen: Wer einen Account bei einer Suchmaschine bzw. deren Tochterfirmen anlegt, gibt freiwillig zusätzliche Informationen preis, z. B. den Namen, die E-Mail-Adresse, das Geburtsdatum, das Geschlecht oder die Postleitzahl des Wohnortes. Das zumindest haben wir selbst in der Hand.


Ein weiterer Kritikpunkt bezieht sich auf die Filterfunktion von Suchmaschinen. Der amerikanische Netz-Aktivist Eli Pariser spricht hier von einer „Filter Bubble“ (in seinem Buch The filter bubble: What the Internet is hiding from you, erschienen 2011, zu deutsch: Filter Bubble – Wie wir im Internet entmündigt werden). Werden Suchergebnisse immer präziser auf den Nutzer zugeschnitten, so erhält er immer weniger Informationen, die außerhalb seines „Horizontes“ liegen. Er lebt praktisch in einer „Filterblase“ und sieht im Netz nur noch das, was ihn ohnehin interessiert bzw. das, was ein Algorithmus als sein Interesse errechnet hat. Hier kann es helfen, verschiedene Suchmaschinen zu nutzen oder Katalog- bzw. Metasuchmaschinen einzusetzen. Auch Internetseiten direkt anzusteuern oder Links nachzugehen kann helfen, aus der „Filterblase“ auszubrechen.

Material für den Unterricht

Klicksafe-Modul: Wie finde ich, was ich suche? Suchmaschinen kompetent nutzen

Links

Die Politik des Suchens

Ausführliches Dossier der Bundeszentrale für politische Bildung (BpB) mit vielen Artikeln zum Thema Suchmaschinen.

 

Handbuch zur Recherche (2006, PDF)

Das Handbuch enthält Tipps und Tricks zur Informationssuche in konventionellen Informationsmitteln und im Internet (Kooperationsprojekt der Käthe-Kollwitz-Schule und der Fachhochschule Hannover).

 

Suchen + finden was gut ist! – Recherchieren lernen mit dem Internet (PDF)

Für Grundschüler zeigt die Broschüre, welche Seiten als Lexika geeignet sind, auf welchen man gut suchen kann und wie man Suchmaschinen bedient.

Pädagogische Praxis

Unterrichtsidee: Lesetexte für erste Klassen erstellen

Deutsch, Klasse 4, GS: Viertklässler/-innen unterstützen in dieser Unterrichtseinheit Erstklässler/-innen mit selbst illustrierten, einfachen Texten für den ersten Leseunterricht.weiterlesen

Unterrichtsmodul: Kinder hier und anderswo

Sachunterricht, Klasse 2–4, GS: Durch gelenkte Internet-Recherche lernen Schülerinnen und Schüler, ohne sich im virtuellen Raum zu verlieren, gezielt Informationen aus dem Netz zu entnehmen. Als „Länderdetektive“ wählen sie z.B. zwischen Frankreich und England.weiterlesen

Unterrichtsmodul: Mein Haustier

Sachunterricht, Klasse 2, GS: Ziel der Unterrichtseinheit ist, dass sich die Schülerinnen und Schüler gezielt mit ihrem (Wunsch-)Haustier auseinandersetzen, in dem sie passende Informationen sammeln, auswählen und präsentieren.weiterlesen

Weitere Anregungen für die pädagogische Praxis