Der kürzlich erfolgte Kauf von Metaweb durch Google wurde in der deutschsprachigen Webszene zwar zur Kenntnis genommen, aber bisher leider nicht detailliert betrachtet. Das ist zwar schade, aber gibt mir die Möglichkeit etwas näher auf diesen Kauf einzugehen.
Metaweb
Metaweb ist ein Unternehmen, das eine webbasierte Ontologie geschaffen hat, die sogenannte Entitäten (wie zum Beispiel Personen, Orte oder Dinge jeglicher Art) auf der Bedeutungsebene zusammenbringen kann. Ein kleines Beispiel zur Verdeutlichung:
Johnny Depp hat schon viele Filme gedreht und vielleicht kennt Ihr ihn auch in der einen oder anderen Rolle, oder vielleicht ist er für Euch auch nur Capt. Jack Sparrow, Gilbert Grape, Willy Wonka oder Mad Hatter – in der Metaweb-Ontologie ist Johnny Depp jetzt einfach nur noch die Zahlenreihe Mx4rvzjP6JwpEbGdrcN5Y29ycA, ganz egal wie Ihr ihn nennt.
Dabei handelt es sich aber bei weitem nicht um eine freigewählte Zahl, sondern um einen zusammengesetzten Wert auf verschiedenen Merkmalen. Ein einfaches, fiktives Beispiel (s.o.) könnte wie folgt aussehen:
M = [Art, Geschlecht/Spezifikation] = Person, Männlich
X4 = [Land] = USA
zjP6 = [Geburtsdatum] = 09.06.1963
Jw = [Personenkategorie] = Schauspieler
pEbG = [Körpergröße] = 1,75m
usw…
Die Bibliothekare unter Euch erinnert dieses Vorgehen der Konstruktion sicher stark an Deweys Dezimalklassifikation, die auf Forschungsansätzen von G.W. Leibniz (1646-1716) beruht und Anfang des 20. Jahrhunderts von Melvil Dewey weiterentwickelt wurde. Ein System also, dass nun einfach in eine größere und wesentlich komplexere Welt übertragen wurde.
Derzeitiger Einsatz von Metaweb
Die Einsatzmöglichkeiten dieses Systems werden sehr schön auf der Plattform Freebase.com gezeigt, die ebenfalls von Metaweb betrieben wird. Dort werden allerlei Informationen aus verschiedenen Bereichen aggregiert und auch mit Daten aus Social Media angereichert. So entsteht eine bisher ungekannte Sammlung von Wissen (z.B. zu Johnny Depp), die auf einer eigenen Webontologie beruht.
Metaweb und Google
Neben den durchaus wichtigen Patenten hat sich Google ein System eingekauft, mit welchem ein weiterer Schritt in Richtung semantisches Internet gegangen werden kann. Auch wenn ich „das“ semantische Netz für eine Illusion halte, bietet eine solche Ontologie die Möglichkeit, Webseiten – bzw. deren Inhalte – und die dazugehörigen Suchanfragen in einen Kontext zu setzen und somit die Suche nachhaltig zu verbessern. Wie Google selbst bereits anmerkte kann das System auch dazu beitragen, Rich-Snippets und Antwortboxen noch zielgerichteter auszuspielen.
Für weitere Informationen empfehle ich die firmeneigenen Patente Query Optimization und Meta-Web anzusehen, noch mehr Patente hat Seobythesea gelistet. Wer immer noch Verständnisprobleme hat sollte sich dieses Video ansehen:
Verwandte Artikel:
- Google bringt neuen User-Agent für Google-News (Hallo Herr Burda!) Heute hat Google im offiziellen Webmasterblog den neuen Useragenten vorgestellt, mit dem zukünftig die Aufnahme bei Google-News verhindert werden kann,...
- Google – Unternehmensdaten, Zahlen und Fakten Auch die zweite Informationsgrafik zu Google möchte ich Euch keineswegs vorenthalten. Dieses Monstersheet - welches mit sehr interessanten Zahlen zu Google...
- Planet Google – Marktanteile und Unternehmensphilosophie In den letzten Wochen geisterten gleich mehrere Informationsgrafiken zu Google durch die Blogosphäre, welche ich Euch nicht vorenthalten möchte. Diese...
Über den Autor: Sebastian Cario
Diesen Artikel mit Freunden teilen:
Dieser Artikel ist mir etwas Wert:









{ 5 comments }
Stimmt natürlich, es ist schon sehr offtopic. Es war aber zu interessant um es nicht zu bloggen.
Es ist tatsächlich keine Dezimalklassifikation, aber es erinnerte mich vom Aufbau stark daran, auch wenn nicht nur Dezimalzahlen zum Einsatz kommen. Die Colon-Klassifikation ist mir aber in der Tat völlig neu, scheinbar habe ich da in der Vorlesung gefehlt. ;-)
Auch wenn es in einem SMO-Blog irgendwie offtopic wirkt. Es ist eine sehr schön Fleißarbeit! = 1 mit Sternchen.
Als jemand mit Deinem Hintergrund hätte ich aber mehr erwartet. Es ist ja keine Dezimalklassifikation, sondern eher eine Colon-Klassifikation, da unterschiedliche Aspekte (teilfacettierte Klassifikation) klassifiziert werden. Nur auf den Trenner wird verzichtet.
Dennoch schöner Artikel!
Guter Artikel Sebastian, ich denke an der Stelle sollte allerdings deutlicher dargestellt werden, dass es bei Freebase um strukturierte Informationen geht, die sich auch mittels API anfragen lassen, siehe http://www.freebase.com/app/queryeditor/about selbst wenn das dann etwas technischer ist…
Comments on this entry are closed.
{ 1 trackback }