Microdaten, Google und IMDb

Angefangen hat alles bei den Google Webmaster Tools. Diese Tools helfen mir Fehler auf meiner Internetseite zu erkennen, die ein Einlesen durch Google erschwert. Außerdem gibt es zahlreiche Tipps um die Darstellung in den Suchergebnissen zu „verbessern“.

Hierzu zählt auch die Formatierung des HTML-Quelltextes mit speziellen „Microformatierungen“. Damit kann Google dann z.B. sofort erkennen dass der Text „1/4“ nicht einfach nur „1/4 einer Pizza“ meint, sondern das Rezept einer Pizza mit gerade mal 1 vom 4 möglichen Punkten bewertet wurde.

Nun empfahl mir Google also solche Formatierungen anzuwenden:
https://support.google.com/webmasters/answer/99170

Bei Snippets handelt es sich um die wenigen Zeilen Text, die unter jedem Suchergebnis erscheinen. Sie sollen Nutzern eine Vorstellung davon vermitteln, was die Seite enthält und warum sie für ihre Suchanfrage relevant ist.

Ich soll Google also gezielt sagen wenn „Michael Mayer“ auf meiner Seite steht, dass das ein Name ist und wenn der Nutzer schreibt, dass er bei der „MÜLLER-LÜDENSCHEID“ arbeitet, dann möchte Google wissen, dass zwischen dem Nutzer und der Firma ein direkter Zusammenhang besteht. Google gibt sogar ein Beispiel. Das wäre mein HTML-Quelltext:

<div> 
  Mein Name ist Michael Mayer, aber die meisten Leute nennen mich Mike. Hier ist meine Website:
  <a href="http://www.example.com">www.example.com</a>
  Ich lebe in München in Bayern und arbeite als Ingenieur bei der Firma MÜLLER-LÜDENSCHEID.
</div>

Und daraus soll ich nun das machen:

<div itemscope itemtype="http://data-vocabulary.org/Person"> 
  Mein Name ist <span itemprop="name">Michael Mayer</span>, 
  aber die meisten Leute nennen mich <span itemprop="nickname">Mike</span>. 
  Hier ist meine Website:
  <a href="http://www.example.com" itemprop="url">www.example.com</a>
  Ich lebe in München in Bayern und arbeite als <span itemprop="title">Ingenieur</span>
  bei der Firma <span itemprop="affiliation">MÜLLER-LÜDENSCHEID</span>.
</div>

Vorab: Natürlich mache ich das nicht, denn Google geht es rein gar nichts an welche Daten personenbezogen sind oder eben allgemein gültig. Ich sehe mich in der Pflicht den Nutzer vor sich selbst zu schützen und trotz der Veröffentlichung nicht noch Google dabei zu helfen einen Kontext aufzubauen, so dass der Arbeitgeber bei „MÜLLER-LÜDENSCHEID“ gleich mal schauen kann wo seine Bediensteten was schreiben.

Aber es entsteht noch eine ganz andere Situation. Sagen wir mal jemand bietet im Marktplatz etwas an. Ich markiere nun den Produktnamen, den Preis, das Bild, usw. Google kann nun perfekt erkennen, dass hier ein Angebot eingestellt wurde. Und was macht Google nun mit dieser Information? Ich würde sagen sie packen sie in „Google Shopping“ und schmeißen sie dafür aus den Google Suchergebnissen raus. Die Unterscheidung erfolgt dann nur noch nach Preis, egal wie bekannt unser Marktplatz ist und wie beliebt er bei den Nutzern ist. Schlussendlich entschied ich mich gegen die Nutzung der Microdatenformatierung.

Microdaten sind böse

Trotzdem wollte ich wissen was eigentlich dieses RDF- und Microformat genau ist, wovon Google spricht. Ich kam dadurch auf die selbe Frage bei Stackoverflow, wo ich gleich mal eine „Warnung“ aussprach diese Formatierung nicht zu nutzen und ein Beispiel zu IMDb’s Daten lieferte:
http://stackoverflow.com/questions/14307792/what-is-the-relationship-between-rdf-rdfa-microformats-and-microdata

I suggest to ignore the semantic web at all. The search engines won’t sent you more visitors because of that. Instead they will use the perfectly organized data to provide the answer without sending you visitors at all.

Today you can see the problem with the following „movie box“ example:https://www.google.com/search?q=The+Godfather

The IMDb and Rotten Tomatoes ratings are displayed. A snippet of Wikipedia as well. Nice for the users, bad for those websites. Or how often did you visit IMDb in the past and today?

And don’t forget. The displayed data is not from IMDb or Rotten Tomatoes alone. Dates, director, awards, music, images etc. have been collected from other sites. For example a search engine can easily search in its database for „The Godfather“ + „Director“ and if 99 of 100 websites include the name „Francis Ford Coppola“ its easy to verify the answer without any manual interaction.

Finally search engines are able to build there own content without paying or mentioning the authors. And with semantic classification you will make it easier for them.

In Kürze übersetzt: Sucht man in Google nach „The Godfather“ (Der Pate), dann erscheint eine sehr informative Box mit Informationen, die aber nicht von Google stammen, sondern von IMDb, Wikipedia, Rotten Tomatoes, usw. zusammengebaut wurden. D.h. Google findet z.B. auf allen drei Seiten die Information, dass der Schauspieler „Al Pacino“ mitspielt, also muss das stimmen und packt es in die Box. Werden falsche Informationen dargestellt, kann man über den Link „Feedback“ sogar Fehler direkt in Google korrigieren:

2015-03-12 12_55_04-The Godfather - Google-Suche

Der Nutzer freut sich, weil seine Frage nach den Schauspielern damit beantwortet wurde und er konnte sogar dazu beitragen die Informationen zu verbessern. Doch was hat IMDb davon? Die Besucher bleiben aus, die Editoren bleiben aus, d.h. keine Werbeeinnahmen, kein neuer und/oder korrigierter Inhalt. Google freut sich dagegen über den Nutzer, der auf der Seite verbleibt (und da dann irgendwann Werbeeinnahmen auslöst).

Ich habe also komplett davon abgeraten die Inhalte noch so zu markieren, dass Google nicht mal mehr aufwendige Filter schreiben muss, um die Inhalte zu klassifizieren. Google geht der Kontext einfach nichts an, denn genau dadurch entsteht die genannte Situation, dass Inhalte direkt in Google erscheinen und den Internetseiten die Besucher und damit Werbeeinnahmen und/oder Editoren ausbleiben.

Google will Deinen Inhalt

Das Google die Inhalte selbst zur Verfügung stellen möchte, haben sie bereits mehrfach unter Beweis gestellt (Wetterbericht, Aktienkurse, usw.). Der letzte große „Raub“ war die Google-Bildersuche. Sucht man dort nach „Wikipedia Logo“ erscheint das wie gehabt in den Ergebnissen. Klickt man es an, dann wird das Logo von der Seite geladen, wo Google es gefunden hat und stellt es selbst dar. Ein kleiner Button „Visit Page“ ist der einzige, der noch die entsprechende Seite hervorhebt und führte damit zu 50% Verlust von Besuchern:

2015-03-12 12_31_45-wikipedia logo - Google Search

Allerdings muss ich fairerweise sagen, dass das nur auf „google.com“ umgesetzt wurde (Grund ist mir unbekannt). Allerdings macht Bing hier keinen Unterschied und „klaut“ sogar komplette Videos:

2015-03-12 12_43_49-charlie chaplin - Bing Videos

Genau damit ist eigentlich bereits belegt, dass die aktuellen Maßnahmen von der EU gegen Google eine absolute Berechtigung haben, wobei ich bezweifle, dass die bei der EU solche Einzelprobleme überhaupt erfasst haben. In meinen Augen müsste nämlich bereits der Wetterbericht, der Aktienkurs, usw. aus Google verschwinden, da es hier zu Wettbewerbsnachteilen kommt. Google geht z.B. mit weather.com einen Vertrag ein und stellt die Daten direkt dar, während wetter.com, wetter.de und wetteronline.de dabei in die Röhre schauen oder wie viel Prozent glaubt ihr klicken noch auf die Suchergebnisse?

2015-03-12 13_24_21-wetter bonn - Google-Suche

 

Zahlt Google für die Inhalte?

Dann zurück zu meiner „Warnung“ bei Stackoverflow. Der Nutzer „Zizo47“ konnte sich einfach nicht vorstellen, dass IMDb die Daten Google kostenlos zur Verfügung stellt:

You don’t think they’re redeemed in any way?

Ich sagte darauf hin, dass wir einfach IMDb fragen könnten:
https://getsatisfaction.com/imdb/topics/does-google-pay-for-using-imdb-data

The commerical usage of IMDb data is not allowed without having a license agreement:
http://www.imdb.com/licensing/

Does Google pay for the data they are displaying here in the right box or is it a give and take for both parties?
https://www.google.com/search?q=The+Godfather

IMDb hat lange für eine Antwort benötigt, aber nach einem halben Jahr kam die Antwort, dass sie da keine Kontrolle drüber hätten:

All our pages are indexed automatically by search engines. We don’t submit individual pages to Google or to any other search engine and have absolutely no control over how they appear or are ranked in their results.

Sie werden also nicht bezahlt und nachdem ich ergänzte, dass man hier doch sein eigenes Grab schaufelt, in dem man alle Daten kostenlos zur Verfügung stellt und die Besucher verloren gehen bzw. mit welcher Berechtigung IMDb von anderen noch Gebühren verlangen kann, hat IMDb die Frage geschlossen:
2015-03-12 12_50_49-Does Google pay for using IMDb data_ _ IMDb.com Customer Community

 

Fazit

„Geschlossen“ zeigt im Grunde auch die Situation. Die Seitenbetreiber verschließen die Augen und nehmen es einfach hin. Ich mit meiner Mini-Webseite werde da natürlich nichts ändern können. Dafür fehlen mir schlicht die finanziellen Mittel. Aber eine Seite wie IMDb sollte einer Suchmaschine klar die Grenzen aufzeigen. Aber dass das nur schwer funktioniert zeigt ja das Thema Leistungsschutzrecht, wo auch nichts passiert ist, weil einzelne Zeitungsverlage eben nichts gegen Google ausrichten können.

Ich hoffe die EU wird bald klare Regeln für Suchmaschinen aufstellen und mehr zu einer Trennung zwischen Suchergebnis und Inhalt beitragen.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

*