Webkrauts Logo

Webkrauts Webkrauts Schriftzug

- für mehr Qualität im Web

Mikroformate

Wir haben noch nicht alle älteren Artikel nachbearbeitet. Das bezieht sich in der Regel nur auf die Codebeispiele, die noch nicht optimal dargestellt werden.

Mikroformate

HTML ist eine semantisch arme Sprache. Das W3C denkt seit langem über das "Semantische Web" nach. Doch ein semantischeres Web entsteht gerade "von unten", mit derzeit existierenden Methoden: Mikroformate helfen dabei. Michael Jendryschik führt in dieses interessante Konzept ein.

Als Tim Berners-Lee im Jahre 1990 an seiner Hypertext Markup Language arbeitete, entwarf er sie als eine einfache Hypertextsprache, die in der Lage sein sollte, Basismenüs für die Hypertextnavigation und einfache Dokumente wie Hilfedateien, Protokolle oder technische Dokumentationen zusammenstellen. Die ersten Versionen verfügten über rund 50 Elementtypen zur Auszeichnung textueller Inhalte. Das heute aktuelle HTML 4.01 und seine »große Schwester« XHTML 1.0 kennen zwar mittlerweile rund 90 Elementtypen zur semantischen Annotation von Inhalten, aber leider sind dies noch immer viel zu wenige, um semantisch vollständig zu sein. Anhand des Elementtyps address lässt sich die Forderung nach mehr Semantik anschaulich unterstreichen. Ein Dokument, das folgendes Element enthält, verrät Menschen und Maschinen unterschiedlich viel:

<address>
Michael Jendryschik
Dorstfelder Hellweg 36
44149 Dortmund
Telefon: +49 (0)231 2217811
E-Mail: michael@jendryschik.de
Web: http://jendryschik.de
</address>

Maschinenlesbar, das heißt für Browser und andere Benutzerprogramme erkennbar, ist die Information, dass das Dokument Kontaktinformationen über den Autor enthält, strukturiert durch einige Zeilenumbrüche, darunter eine E-Mail-Adresse und den Link zu einer Website. Wir Menschen, so wir der verwendeten, natürlichen Sprache mächtig sind, können weit mehr Informationen ausmachen: Wir erkennen darüber hinaus

  • einen Namen,
  • eine Adresse, bestehend aus Straße, Hausnummer, Postleitzahl und Ort sowie
  • eine Festnetz- und eine Mobiltelefonnummer.

Diese Informationen sind jedoch nicht maschinenlesbar und damit nicht oder nur beschränkt programmatisch wiederverwendbar. Genau dieses Problem versuchen Mikroformate zu lösen. Dabei handelt es sich um Formate zur »Feinstrukturierung« von Webseiten. Dokumente, vor allem (X)HTML-Dokumente, werden menschen- und maschinenlesbar durch zusätzliche Semantik ergänzt, ohne die Inhalte zu verändern. Zum Einsatz kommen dabei drei Attribute: class, rel und rev.

Die Attribute class, rel und rev

Das Attribut class weist einem Element einen Klassennamen oder einen Satz von Klassennamen zu. Derselbe Klassenname kann einer beliebige Anzahl von Elementen zugeordnet werden. Wie alle Attribute werden Klassen im Start-Tag des Elements notiert:

<em class="wichtig">

Wenn Elemente zu mehreren Klassen gehören, zum Beispiel zu der Klasse »wichtig« und zu der Klasse »extern«, dann werden die Klassennamen mit einem Leerzeichen getrennt aufgeführt:

<em class="wichtig extern">

Die Attribute rel und rev werden hauptsächlich an a-Elementen notiert und nehmen entgegengesetzte Rollen ein – das rel-Attribut spezifiziert eine Vorwärts-, das rev-Attribut eine Rückwärtsbeziehung. Das Attribut rel beschreibt die Beziehung des aktuellen Dokuments zu der durch das href-Attribut angegebenen Zielressource. Das Attribut rev dient dazu, einen Rückwärtslink von der durch das href-Attribut angegebenen Zielressource zum aktuellen Dokument zu beschreiben. Der Wert beider Attribute ist eine durch Leerzeichen getrennte Liste von Beschreibungen.

So sagt beispielsweise
<a href="glossar" rel="glossary">Glossar</a>
aus, dass die verlinkte Ressource ein Glossar für das aktuelle Dokument bereitstellt. Mit

<a href="foo" rev="contents">Foo</a>
wird angezeigt, dass das aktuelle Dokument ein Inhaltsverzeichnis (table of contents) für die verlinkte Ressource darstellt.

Mikroformate werden eingesetzt, indem Elementen eines oder mehrere der drei Attribute mit festgelegten Werten zugewiesen wird.

Verfügbare Formate

Mittlerweile gibt es zahlreiche Formate für ganz spezifische Formen von Auszeichnungen. Dabei unterscheidet man zwischen zwei Gruppen von Formaten: elementare und zusammengesetzte. Zusammengesetzte Formate wie hCard oder hReview basieren auf elementaren Formaten wie XFN oder rel-tag und alle letztendlich auf XHTML. Zu den bekanntesten Mikroformaten zählen die folgenden:

  • hCard ist ein Mikroformat zur Auszeichnung von Kontaktinformationen. Es überträgt den vCard-Standard (RFC 2426) in (X)HTML.
    Eine vCard ist eine elektronische Visitenkarte, die ein Benutzer direkt in ein Adressbuch importieren kann.
  • hCalendar ist ein mittlerweile sehr verbreitetes Mikroformat, das sich an vCalendar (RFC 2445) orientiert. Dabei handelt es sich um ein Format zur Auszeichnung von Kalender- und Veranstaltungsdaten.
  • Das Format XFN dient der Auszeichnung sozialer Beziehungen. So können sie angeben, ob Sie eine Person bereits persönlich getroffen haben oder ob sie ein Arbeitskollege, ein Freund oder ein Familienmitglied ist.
  • xFolk dient der Auszeichnung von Bookmarks.
  • Zur Auszeichnung von Weblog-Einträgen und News eignet sich hAtom.
  • Zu den in Zukunft sicherlich wichtigsten Mikroformaten gehört hReview, mit dem Bewertungen und Besprechungen von Serviceleistungen, Veranstaltungen, Filmen und – vor allem – Produkten angereichert werden können.

Mittlerweile gibt es eine große Anzahl weiterer Formatspezifikationen und -entwürfen, die im Microformats Wiki aufgeführt sind.

Beispiele: hCard und hCalendar

Es bietet sich an, die Anwendung von Mikroformaten anhand hCard zu demonstrieren, indem das oben aufgeführte Beispiel durch die entsprechenden Klassen und einige wenige, umschließende Elemente erweitert wird:

<address class="vcard">
<span class="adr">
<span class="fn">Michael Jendryschik</span>
<span class="street-address">Dorstfelder Hellweg 36</span>
<span class="postal-code">44149</span>
<span class="locality">Dortmund</span>
</span>
Telefon: <span class="tel">+49 (0)231 2217811</span>
E-Mail: <a href="mailto:michael@jendryschik.de" class="email">michael@jendryschik.de</a>
Web: <a href="http://jendryschik.de/" class="url">http://jendryschik.de</a>
</address>

Alle Informationen, die vorher nur für Menschen lesbar waren, können nun auch Maschinen verstehen.

Ein weiteres Beispiel ist die Anwendung des Mikroformats hCalendar. Es kommt unter anderem auf der Veranstaltungsübersicht von Einfach für alle, der Aktion-Mensch-Initiative für ein barrierefreies Web, zum Einsatz. Eine Veranstaltung, hier die Preisverleihung der BIENE 2006, wird beispielsweise wie folgt ausgezeichnet:

<div class="vevent">
<h3 class="summary"Preisverleihung:
<a href="/biene-2006/" class="url">BIENE 2006</a></h3>
<p class="description">Seit 2003 prämieren die Aktion Mensch und die Stiftung
Digitale Chancen die besten barrierefreien Angebote im Internet mit einer
BIENE. BIENE steht für »Barrierefreies Internet eröffnet neue Einsichten«,
aber auch für Kommunikation, gemeinsames Handeln und produktives
Miteinander.</p>
<p class="datum"><abbr class="dtstart" title="2006-12-08">08. Dezember</abbr>,
<span class="location">Berlin</span>, weitere Infos unter:
<a href="http://www.biene-award.de/" rel="external" class="url">
biene-award.de</a>.</p></div>

Mikroformate erstellen und verarbeiten

Die Annotation von Mikroformaten zu (X)HTML-Dokumenten ist zwar keineswegs schwierig und lässt sich leicht per Hand erledigen. Dennoch sind Sie nicht vollkommen auf sich allein gestellt: Es gibt mittlerweile einige Werkzeuge, die Autoren bei dieser Arbeit unterstützen. Bei der Erstellung einer hCard-Auszeichnung hilft der hCard Creator. Für hCalendar gibt es mit dem hCalendar Creator einen vergleichbaren Service, für hReview den hReview Creator. Abbildung 1 zeigt, wie einfach sich der hCard Creator bedienen lässt. Der erzeuge Code kann bearbeitet und direkt in das Zieldokument kopiert werden.

hCard Creator im Einsatz

Die Erstellung von Mikroformaten ist jedoch nur die eine Seite der Medaille, deren Auswertung und Verarbeitung die andere. Aber auch da gibt es mittlerweile einige nützliche Werkzeuge und Browsererweiterungen.

Technorati, eine Echtzeit-Suchmaschine speziell für Weblogs, bietet einen so genannten Contacts Feed Service an, der es ermöglicht, mittels hCard ausgezeichnete Kontaktinformationen im vCard-Format zu exportieren. Gibt man den URL einer Webseite, die das oben erweiterte address-Element enthält, liefert der Service eine VCF-Datei, die nun problemlos in gängige Adressbücher importiert werden – eine feine Sache.

Der Events Feed Service leistet dasselbe für Kalenderdaten. Es wird eine ICS-Datei exportiert, die direkt in Programme wie Mozilla Sunbird importiert werden kann.

Es gibt auch Browsererweiterungen, die Mikroformate auslesen und darstellen und weiterverarbeiten, etwa in ein entsprechenden Zielformat konvertieren und zum Export anbieten, für Firefox unter anderem die Tails Firefox Extension und Tails Export – letztere leider nur bis Version 1.5. Abbildung 2 zeigt Tails im Einsatz.

Die Firefox-Erweiterung Tails im Einsatz

Fazit

Mikroformate reichern Dokumente menschen- und maschinenlesbar mit semantischen Informationen an ohne ihren Content zu verändern. Dabei gilt festzuhalten: Maschinenlesbare Semantik ist wiederverwendbarer Content, das heißt, es ist möglich, mit Mikroformaten versehen Daten weiterzuverarbeiten. Informationen lassen sich aus einer Website auszulesen und anderen Programmen zugänglich machen. Dadurch ergibt sich ein großer Mehrwert für den Nutzer. Stellen Sie sich vor, die Veranstaltungsübersicht Ihres bevorzugten Konzerthauses oder ihrer Lieblingsdiskothek wäre mit Mikroformaten ausgezeichnet – welch praktischen Nutzen Sie doch davon hätten! Sie könnten die Daten aller oder ausgewählter Veranstaltungen mit wenigen Klicks aus den Webseiten extrahieren und ihrer Kalendersoftware verfügbar machen. Mikroformate sind ein Teil des Web 2.0: Sie kennzeichnen soziale Beziehungen, unterstützen Bookmarking und Tagging. Und stellen Sie sich vor, wie nützlich Mikroformate werden können, wenn Suchmaschinen sie für sich entdecken. Webseiten mit Buch- oder DVD-Rezensionen könnten so viel effizienter bewertet werden.

Der Veranstaltungskalender Upcoming.org, die Profilseiten von Xing, die Kontaktseite von ZKNet.co.uk, die Produktbewertungen von Yahoo! Tech und viele andere Beispiele zeigen, dass Mikroformate bereits heute sinnvoll eingesetzt werden können. Fangen auch Sie am besten schon heute damit an, die Inhalte Ihrer Websites mit Mikroformaten zu veredeln!

Weiterführende Links

Kommentare

Daniel
am 16.12.2006 - 01:32

Ein gut geschriebener und interessanter Artikel. Oft findet man zu viel allgemeines zu Mikroformaten und zu selten wird kurz und knackig präsentiert was es damit auf sich hat.
Das hast du sehr gut gelöst mit diesem Artikel.

Permanenter Link

Jeena Paradies
am 16.12.2006 - 02:41

Übrigens, weil es wohl irgendwie nicht so bekannt ist, es gibt auch ein Microformat von einem "Deutschstämmigen", ähm also mir ;-)

rel="pavatar"

beschreibt die Relation des Tags (meist wohl <link rel="pavatar">) mit einem Bild was einen selbst in der Virtuellen Welt darstellt.

Permanenter Link

Henning Bobzin
am 16.12.2006 - 10:32

Sehr interessante und vor allem verständliche Zusammenfassung. Danke. – Ich frage mich bloß, auch nach genauer "Untersuchung" der Verwendung auf Deiner eigenen Seite, wie das denn mit der E-Mail-Adresse und Spam-Problemen aussieht. Du schreibst die Adresse ja einfach uncodiert und nicht verborgen in den Quelltext – mit @-Zeichen und allem. Hast Du da keine Probleme mit Spammern? Oder könnte man diese auch codieren (vgl. Hivelogic-Enkoder) und trotzdem in einer hCard verwenden?

Permanenter Link

beza1e1
am 16.12.2006 - 11:06

Inwiefern ist 08. Dezember denn eine Abkürzung (abbr)?

Permanenter Link

Lukasz Z.
am 16.12.2006 - 15:14

Hallo,
wirklich ein sehr aufschlussreicher gut zu lesender Artikel.

Was mich etwas beunruhigt ist folgendes: Wenn sich dieser Standard durchsetzt, wird es sicherlich einige Firmen geben, die Bots in Auftrag geben, die die Aufgabe haben das Web zu durchforsten und möglichst viele Adressen und sonstige Konaktdaten zu sammeln. So könnte man in kürzester Zeit eine riesige Datenbank erstellen. Daran hätten sicher nicht wenige Firmen Interesse...
Zudem kommt noch die offene Schreibweise der E-Mail-Adresse. Da wird man doch nur noch mit Spam zugebombt. Derzeit stelle ich meine E-Mail z.B. im Impressum über ein Bild dar. Mir ist klar, dass dies nicht 100%ig sicher ist, aber es hilft wenigstens etwas.

Dennoch: Die Kernidee finde ich prima!

Permanenter Link

Elmar
am 17.12.2006 - 02:23

Die Mikroformate sind ein gutes Beispiel dafür, dass häufig erst später entdeckt wird, wie bereits existierende Möglichkeiten gewinnbringend genutzt werden können auf eine bis dahin unbekannte Weise.

So entdeckte ich gerade noch rechtzeitig die Tags, die mir ersparten, ein Stichwortverzeichnis zu erstellen (wobei die Tags anhand Verwandtschaftsbeziehungen noch weiteren Zusatznutzen bieten). Sie werden häufig und intiutiv genutzt (Ich bezeichne sie nicht als "Tags", da ich kein Blog habe, sondern einen Site, der Informationen zu einem Spezialgebiet vermittelt und der Leserkreis mit "Stichwörter" wahrscheinlich mehr anfangen kann).

@Lukasz Z. Es kann als sicher gelten, dass der Markt und die Spammer zunehmende Semantik ebenso gewinnbringend nutzen werden wie alle anderen Nutzer auch.

Permanenter Link
Michael Jendryschik

Michael Jendryschik (Autor)
am 17.12.2006 - 09:45

@Henning Bobzin: Ich habe nicht mehr und nicht weniger Probleme mit Spam als jeder andere, der seit mehreren Jahren mit seiner E-Mail-Adresse im Web und im Usenet unterwegs ist. Und ich glaube auch nicht, dass sich die Masse an Spam aufgrund des Einsatzes von Mikroformaten verändert. Weniger wird es sicher nicht werden, und mehr kann es schon fast nicht mehr werden. Da Spam sich heute aber nicht mehr vermeiden lässt, ist es weniger die Frage, wie man verhindert, dass Mailboxen zugespammt werden, als vielmehr, wie man es erreicht, dass Spam wirkungsvoll erkannt wird und erst gar nicht im Posteingang landet. Hier helfen server- und clientseitige Filter. Mit täglich rund einem Dutzend Spam-Mails, die tatsächlich durchkommen, kann ich gut leben.

Die Möglichkeit, dass Mikroformate die Spam-Problematik verschärfen könnten, will ich gar nicht abstreiten. Aber so ist es nunmal mit maschinenenlesbarer Information. Was die »gute« Maschine lesen kann, das kann auch die »böse« Maschine lesen.

Ich will es so formulieren. Gäbe es ein Mikroformat, mit dem man Kreditkarteninformationen auszeichnen könnte, dann würde ich es sehr wahrscheinlich nicht einsetzen. ;-)

MI

Permanenter Link
Michael Jendryschik

Michael Jendryschik (Autor)
am 17.12.2006 - 10:02

@beza1e1: Die Spezifikation des hCalendar-Formats empfiehlt, die Eigenschaften DTSTART, DTEND, DURATION, RDATE und RRULE an abbr zu verwenden. Natürlich kann man diskutieren, ob es sinnvoll ist,

Die Veranstaltung findet vom <abbr class="dtstart" title="2007-10-05">05.</abbr> bis zum <abbr class="dtend" title="2007-10-07">07. Oktober</abbr> statt.

in dieser Form auszuzeichnen. Ich denke, man kann es semantisch rechtfertigen. Hinzu kommt, dass einige Werkzeuge, so auch das Firefox-Plugin Tails, die Information nicht verarbeiten, wenn anstelle von abbr beispielsweise span verwendet wird.

Permanenter Link

Jens Grochtdreis
am 17.12.2006 - 14:04

Ich verstehe die Diskussion um Spam und Mikroformate nicht. Sie wird gerne herangezogen, um doch noch ein Haar in der Suppe zu finden. Möchte man jedoch Spam vermeiden, sollte man sich keine E-Mail-Adresse zulegen. Man kann zudem auch noch seine Adresse nur als Bild hinterlegen, ziemlich schwachsinnig aber gerne gemacht. Zudem könnte man auch noch dem Klau seiner Texte dadurch vorbeugen, indem man seine Texte generell nicht in HMTL, sondern als GIF oder JPG ablegt. Das hatten wir alles schonmal. Intelligent ist das nicht.

Mißbrauch käßt isch nie verhindern. Denn ein jeder, der bei Mirkoformaten gleich "SPAM!" ruft mache sich mal klar, daß Spam in der nicht-digitalen Welt eine Entsprechung hat: Werbezettel. Auch die werden nicht komplett durch entprechende Aufkleber an Briefkästen ferngehalen. Spätestens durch Tageszeitungen kommen sie wieder rein.

Und dann noch die allseites beliebten Telefonanrufe, durch die Versicherungen, Lottoscheine oder Telefontarife verkauft werden sollen.

Spam ist überall. Freiheit wird gerne ausgenutzt. Es ist nur die Frage, wie weit man sich selber in seiner eigenen Freiheitsausübung einschränkt, aus Angst, man könne belästigt werden.

Ich bevorzuge, das Positive in der Nutzung der Mikroformate zu sehen. Und ich nehme gelassen hin, daß es immer wieder Arschlöcher gibt, die ihre Freiheit zum Nachteil anderer ausnutzen. Das ist in allen Lebensbereichen so.

Permanenter Link

pierro
am 28.12.2006 - 09:25

der dezember geht seinem ende entgegen - auch schleisst der A- kalender hier seine pforten, deshlab bin ich noch einmal einige artikel lesend durchgegangen und "starndete" hier .
ein sehr gut und verstaendlich geschriebener text !
danke dafuer . . .
ich kann dem Daniel (erster comment) nur beipflichten .

Permanenter Link

Marcus
am 23.10.2007 - 03:42

Hoi, da hab ich ja was richtiges gefunden. Vielen Dank für die Anleitung, ich arbeite mich gerade in Xhmtl ein und da kommt mir diese Zusammenfassung grad richtig.

Permanenter Link

Patrick
am 15.08.2008 - 11:43

Schöne Sache. Habe es direkt mal ausprobiert. Tails exportiert zwar eine vCard, allerdings erkennt Outlook weder Telefon noch Fax. Alles andere funktioniert einwandfrei. Habe die hCard mit hCard Validator geprüft, keine Fehler. Naja M$ Software...

Ich bin mal gespannt, wann Google eine Adress-Suche anbietet.

Permanenter Link

Die Kommentare sind geschlossen.