Hauptseite | Deutsche Enzyklopädie

Hypertext Markup Language

Die Hypertext Markup Language (HTML) ist ein Dokumentenformat zur Auszeichnung von Hypertext im World Wide Web und wurde 1989 von Tim Berners-Lee am CERN in Genf festgelegt. Sie basiert dabei auf der Metasprache SGML, die zur Definition von Auszeichnungssprachen verwendet wird. HTML ist also eine Auszeichnungssprache zur Beschreibung von Informationen in Hypertexten. HTML wird vom World Wide Web Consortium (W3C) weiterentwickelt.

Mittlerweile wurde die letzte Version des HTML-Standards (HTML 4.01) in der Metasprache XML neu formuliert. Das daraus entstandene XHTML 1.0 genügt den im Vergleich zu SGML strengeren syntaktischen Regeln von XML, ist aber in seinen drei DTD-Varianten (Strict, Transitional und Frameset, siehe unten) semantisch mit der jeweils entsprechenden DTD-Variante von HTML 4.01 identisch. Aktuell liegt der XHTML-Standard in der Version 1.1 vor, der eine zusätzliche Modularisierung der Elemente einführt.

Inhaltsverzeichnis
1 Überblick
2 Versionen
3 HTML-Struktur
4 DTD-Varianten
5 Falsche Interpretation von Webdokumenten
6 Sprachtyp
7 Weiterentwicklungen
8 HTML lernen
9 Siehe auch
10 Literatur
11 Weblinks

Überblick

Namensgebend sind die Hypertext-Elemente, die zum Verweis auf andere Textstellen oder auf ein anderes Dokument dienen. Zur Adressierung anderer Dokumente im Internet werden innerhalb des Dokumentes Hyperlinks verwendet. Dies ist die Grundlage für das WWW. Die Programme, die die Struktur des Dokuments interpretieren und als formatierte Webseiten (eventuell mit Interaktionselementen wie Links oder Formularen) darstellen, werden Webbrowser genannt.

Dem Text wird durch Auszeichnung (engl. markup) von Textteilen mit in der Regel paarweisen (öffnenden und schließenden) Tags eine Struktur verliehen. Die jeweils zusammengehörenden Tags bilden zusammen mit dem dazwischenliegenden Text („Inhalt“) ein Element. Diese Elemente lassen sich nach Regeln, die in einer Dokumenttypdefinition (DTD) angegeben sind, verschachteln:

Ein Textabsatz, der ein betontes Wort enthält.

Neben Elementen mit Start- und End-Tag gibt es auch leere Elemente, wie etwa Zeilenumbrüche oder Bilder: Eine Textzeile,
die hier fortgesetzt wird.
E-Mail (In XHTML hingegen müssen leere Elemente nach den Regeln der Tag-Minimierung mit einem / am Ende notiert werden, z.B.
beziehungsweise


.)

Auch wenn sich HTML in früheren Versionen dafür verwenden ließ, geht es in HTML um sogenannte logische, nicht um physische Textauszeichnung. Das heißt, HTML-Tags sind keine Angaben zur Präsentation, die dem Webbrowser mitteilen, wie er den Text zwischen den Tags visuell zu formatieren habe. Vielmehr sind Tags eine strukturierende Auszeichnung, mit der sich Textbereiche Bedeutung zuordnen lässt (z. B. Überschrift). Wie diese die Bedeutung letztlich dem Benutzer vermittelt wird (im Falle eine Überschrift z.B. durch vergrößerte, fette Schrift), ist zunächst dem Webbrowser überlassen und hängt von der Ausgabe-Umgebung ab. Denn obwohl HTML-Dokumente in der Regel auf Computerbildschirmen dargestellt werden, können sie auch auf anderen Medien ausgeben werden, etwa auf Papier oder mittels Sprachausgabe.

Um auf die Präsentation eines HTML-Dokuments in verschiedenen Medien Einfluss zu nehmen, eignet sich CSS-Formatvorlagen vorzüglich. Daher gelten Elemente und Attribute zur Präsentation wie ..., ... und width heutzutage als veraltet und sollten nach allgemeiner Auffassung vermieden werden. Stattdessen seien solche Elemente zu verwenden, die tatsächlich der logischen Textauszeichnung dienen, wie etwa <h1>...</h1>,

...

und .... Die meisten der Elemente und Attribute zur Präsentation wurden in der HTML-4-Spezifikation als missbilligt (engl. deprecated) markiert.

Versionen

  • HTML (ohne Versionsnummer, 3. November 1992): Die Urversion, die sich nur an Text orientierte. Weblink
  • HTML (ohne Versionsnummer, 30. April 1993): Zu Text kommen neben Attributen wie fette oder kursive Darstellung auch die Bildintegration dazu.
  • HTML+ (November 1993) Geplante Erweiterungen, die in spätere Versionen einflossen, aber nie als HTML+ verabschiedet wurden. Weblink
  • HTML 2.0 (November 1995): Die mit RFC 1866 definierte Version führt u.a. Formulartechnik ein. Der Status dieses Standards ist „HISTORIC“. Auch die Vorgänger sind veraltet.
  • HTML 3.0: Die Version erscheint nicht, weil sie mit der Einführung des Netscape-Browserss in der Version 3 bereits vor der Veröffentlichung obsolet ist.
  • HTML 3.2 (14. Januar 1997): Neu in dieser Version sind zahlreiche Feature wie Tabellen, Textfluss um Bilder, Einbindung von Applets.
  • HTML 4.0 (18. Dezember 1997): Mit dieser Version werden auch Stylesheets, Skripte und Frames eingeführt. Auch eine Trennung in „strict”, „frameset” und „transitional” erfolgt. Am 24. April 1998 erscheint eine leicht korrigierte Version dieses Standards.
  • HTML 4.01 (24. Dezember 1999): Ersetzt HTML 4.0 mit vielen, kleineren Korrekturen. Es ist die letzte HTML-Version.
  • XHTML 1.0 (26. Januar 2000): Eine Neuformulierung von HTML 4.01 mit Hilfe von XML. Am 1. August 2002 erscheint eine überarbeitete Version.
  • XHTML 1.1 (31. Mai 2001): Nachdem XHTML in Module aufgeteilt wurde, wird mit XHTML 1.1 eine strikte Version definiert, bei der die mit HTML 4 eingeführten Varianten „frameset“ und „transitional“ entfallen.

HTML-Struktur

Allgemeine Struktur

Ein HTML-Dokument besteht aus drei Bereichen:

  1. der Doctype-Deklaration ganz am Anfang der Datei, die die verwendete DTD angibt, z. B. „HTML 4.01 Strict“,
  2. dem HTML-Kopf (HEAD), der hauptsächlich technische oder dokumentarische Informationen enthält, die nicht direkt im Browser sichtbar sind und
  3. dem HTML-Körper (BODY), der anzuzeigende Informationen enthält.

Somit sieht die Grundstruktur einer Webseite wie folgt aus:

 
 
     
       <strong>Titel der Webseite</strong>
       
     
     
        Inhalt der Webseite
     
 

HTML-Kopf

Im Kopf können sieben verschiedene Elemente angewandt werden:

  1. title bezeichnet den Titel der Seite, der im Browserfenster sowie oft in Suchmaschinen angezeigt wird.
  2. meta kann vielfältige Metadaten enthalten. Siehe Meta-Tags.
  3. base gibt entweder eine Basis-URI an oder einen Basisframe.
  4. link dient zur Angabe von logischen Beziehungen zu anderen Ressourcen. Am häufigsten zur Einbindung von Stylesheets benutzt.
  5. script bindet Code in einer bestimmten Skriptsprache ein, hauptsächlich JavaScript.
  6. style enthält Stylesheet-Code, hauptsächlich CSS-Regeln.
  7. object bindet eine externe Datei ein. Browser dürfen solche Objekte im Dokumentkopf nicht darstellen.

HTML-Körper

Eine Hauptüberschrift wird so ausgezeichnet:

 

Hauptüberschrift

h1 steht für Heading 1.

Diese Auszeichnung wird nun als Hauptüberschrift interpretiert. Weiter möglich sind h2 bis h6, Überschriften zweiter bis sechster Ordnung, mit denen sich die Gliederung einer Seite verdeutlichen lässt. Die Präsentation dieser Überschriften ist von ihrer strukturierenden Bedeutung unabhängig und kann mit CSS beeinflusst werden. Die Zweckentfremdung der Überschrift-Elemente zur Vergrößerung von Text wird allgemein als Missbrauch angesehen.

Hyperlinks:

 Gehe zu example.com

Hier wird auf die Ressource http://www.example.com/ verwiesen. Der Text Gehe zu example.com wird dabei als Link dargestellt.

Zur Logik stehen zum Beispiel die Elemente strong und em bereit, mit denen sich stark hervorgehobener oder betonter Text auszeichnen lässt. Gängigerweise werden strong-Elemente durch Fettschrift und em-Elemente durch kursive Schrift visuell kenntlich gemacht.

Die logische Beschreibung der Struktur des Textes, wie sie die obigen Beispielen veranschaulichen, vereinfacht es zum Beispiel, dass der Text auch einem Sehbehinderten vorgelesen oder als Braille ausgegeben werden kann, und ermöglicht Suchmaschinen, die Auswertung der Texte unter Berücksichtigung ihrer Bedeutung.

DTD-Varianten

Beim Entwurf der letzten HTML-Version 4 sollte der Tatsache, dass in viele HTML-Dokumenten noch Elemente und Attribute zur Präsentation eingesetzt werden, Rechnung getragen, aber auch eine stilistisch saubere DTD angeboten werden. Das Ergebnis waren schließlich drei Varianten:

Strict

Diese DTD-Variante umfasst den Kernbestand an Elementen und Attributen. Es fehlen die meisten Elemente und Attribute zur Beeinflussung der Präsentation, unter anderem die Elemente font, center und u sowie die Attribute bgcolor, width, height und target. Deren Rolle sollen in Strict-Dokument Stylesheets übernehmen. Text und nicht-blockbildende Elemente innerhalb der Elemente body, form, blockquote und noscript müssen sich grundsätzlich innerhalb eines Container-Elements befinden, zum Beispiel in einem p-Element.

Transitional

Die Variante, die noch ältere Elemente und Attribute enthält, die auch physische Textauszeichnung ermöglichen. Durch diese DTD soll auch Webautoren, die noch nicht logische Strukturierung und Präsentation voneinander trennen, die Möglichkeit gegeben werden, standardkonformes HTML zu schreiben. Gleichzeitig soll sie sicherstellen, dass bestehende nicht standardkonforme Webseiten weitherhin durch aktuelle Webbrowser angezeigt werden können.

Frameset

Diese Variante enthält zusätzlich zu allen Elementen der Transitional-Variante noch die Elemente für die Erzeugung von Framesets.

Falsche Interpretation von Webdokumenten

Einige stark verbreitete Browser folgen bei der Auswertung von HTML-Codes nicht ganz dem Standard, was für Webautoren Mehrarbeit bedeutet. Hierbei ist zwar zu beachten, dass eine Anpassung von HTML-Dokumenten an die Gegebenheiten auf der Leserseite durchaus von Vorteil und auch gewollt ist, aber häufig kommt es auch zu wirklichen Fehlinterpretationen. Durch die wohlüberlegte Verwendung von strukturierendem und logischem HTML kann gewährleistet werden, dass ein Webdokument unter allen Umständen zumindest grundlegend zugänglich und nutzbar ist.

Heutzutage ist die Unterstützung der CSS ausreichend gut, um damit eine anspruchsvolle Gestaltung zu realisieren. Der am weitesten verbreitete Webbrowser, der Internet Explorer, ist gutmütig und lässt so manchen Fehler durchgehen, hat jedoch in CSS-Belangen einige Defizite, welchen Rechnung zu tragen ist. Die Neuentwicklungen auf Basis der Gecko-Engine (Mozilla, Mozilla Firefox, Netscape Navigator, ...), der KHTML-Engine (Safari, Konqueror) sowie aus dem Hause Opera haben hier am wenigsten Probleme, tolerieren Codefehler jedoch weniger.

Sprachtyp

HTML ist keine Seitenbeschreibungssprache wie etwa Postscript, da keine Seiten beschrieben werden, sondern Text strukturell und logisch ausgezeichnet wird. HTML ist eine Auszeichnungssprache und wird als solche auch nicht programmiert – HTML wird schlicht geschrieben.

Ein ähnliches Konzept (logische Beschreibung) wie hinter HTML steht hinter dem Satzsystem TeX/LaTeX, das im Unterschied zu HTML jedoch auf die Ausgabe per Drucker auf Papier zielt.

Weiterentwicklungen

Im Laufe der Jahre ist HTML um Elemente erweitert worden, die sich (fast nur) mit der Gestaltung des Dokuments befassen, was der ursprünglichen Idee der Systemunabhängigkeit entgegen lief.

Dazu gehören die Möglichkeiten, Seiten dynamisch zu verändern, z. B. mittels JavaScript. Man spricht dann von DHTML (Dynamic HTML). Da diese Möglichkeiten von den Browser-Herstellern (allen voran Microsoft und Netscape) entwickelt wurden, gab es erhebliche Probleme mit der Interpretation der Elemente zwischen den verschiedenen Browsern. Mittlerweile interpretieren aber alle verbreiteten Browser (IE, Mozilla/Netscape, Opera, Konqueror/Safari) das W3C-DOM, weswegen es heutzutage problemlos möglich ist, in allen Browsern lauffähige Skripte zu schreiben. Ausnahmen bilden lediglich Textbrowser wie z. B. Lynx sowie Nischenprodukte wie Arachne. Es gibt jedoch noch immer Differenzen bei der Unterstützung der Standards wie CSS oder DOM und daher ist es nach wie vor sinnvoll, Webseiten trotz formeller Fehlerfreiheit mit Browsern verschiedener Anbieter zu testen.

Eine Rückbesinnung auf die Trennung von Inhalt (Struktur) und Layout wurde durch die Definition der Cascading Style Sheets (CSS) vorgenommen. So soll das Aussehen des Dokuments in einer separaten Datei (dem sog. Style Sheet) festgelegt werden. Dies ermöglicht es viel besser das Layout an das Ausgabegerät (oder spezielle Bedürfnisse, z.B. von Sehbehinderten) anzupassen. Diese Vorgabe wird allerdings nicht konsequent umgesetzt.

Als zukünftiges universelles Format wird zunehmend XML (eXtensible Markup Language), ein selbstbeschreibendes Datenmodell eingesetzt. Dieses arbeitet ebenfalls mit Tags, die jedoch per DTD (Document Type Definition) sehr restriktiv eingesetzt werden können. Zur Umwandlung von in XML gehaltenen Daten in die entsprechenden „Anzeigeformate“ kann XSL verwendet werden, eine Style-Sheet-Sprache zur Transformation z.B. nach XHTML.

HTML lernen

SELFHTML ist ein deutschsprachiges und sehr umfangreiches Projekt, das für viele Themen rund um HTML Referenzmaterial bietet.

Die Lektüre einer modernen linearen Einführung (siehe Weblinks) und die Handarbeit direkt in einem Texteditor ist empfehlenswert, um HTML richtig zu verstehen und voll auszunutzen.

Für schnelle Arbeiten mag die Arbeit in einem grafischen (so genannten) WYSIWYG-Editor zunächst genügen, allerdings produzieren diese Editoren häufig einen HTML-Code, der die optischen Vorstellungen widerspiegelt. Strukturelle und logische Informationen, die dem Text erst einen echten Mehrwert geben, lassen sich nur einsetzen, wenn man HTML hinreichend gut verstanden hat. Hinzu kommt, dass diese Editoren gelegentlich ungültiges HTML produzieren, was die Darstellung des Dokuments von der Fehlertoleranz des Webbrowsers abhängig macht. Professionelle Webgestalter verwenden visuelle HTML-Editoren daher häufig nur, um das Grundgerüst von Webseiten zu erstellen und optimieren den Code danach manuell.

Siehe auch

Literatur

  • Stefan Mintert (Hrsg.): XHTML, CSS & Co. Die W3C-Spezifikationen für das Web-Publishing. Addison-Wesley, München, ISBN 3827318726

Weblinks

Dieser Artikel ist Teil des WikiReader Internet. Dies bedeutet, dass der Artikel regelmäßig überprüft und zusammen mit anderen Artikeln in ein PDF eingearbeitet wird. Es existiert auch eine gedruckte Ausgabe.



Limit search to: Body and Title Deutsche Seiten Path

Websites for Hypertext
Showing page 1 (1 - 10 of 492 hits) Next »
Answers to questions frequently asked in alt.hypertext and references to other online resources about hypertext and hypermedia. Answers to questions frequently asked in alt.hypertext and references to other online resources about hypertext and hypermedia.
Hypertext as an object of philosophical reflection. The three main research topics are From Encyclopaedia to Hypertext, Hypertext and Text Theory, and The Image Atlas of Aby Warburg. Hypertext as an object of philosophical reflection. The three main research topics are From Encyclopaedia to Hypertext, Hypertext and Text Theory, and The Image ...
Greco has published hypertext fictions and theory, and has worked as a hypertext editor at Eastgate. Her weblog comments hypertext and related fields and has links to her other work. Greco has published hypertext fictions and theory, and has worked as a hypertext editor at Eastgate. Her weblog comments hypertext ...
... if the WWWeb matters". Includes a timeline of hypertext evolution and a concise taxonomy of varieties of hypertext, with examples and links. "Hypertext theory as if the WWWeb matters". Includes a timeline of hypertext evolution and a concise taxonomy of varieties of hypertext, with examples and links.
... PhD thesis, which develops critical approaches to reading hypertext through close readings of several hypertext fictions. Raine Koskimaa's PhD thesis, which develops critical approaches to reading hypertext through close readings of several hypertext fictions.
... systems and key events in the evolution of hypertext. This site is about the people, systems and key events in the evolution of hypertext.
Developer, theorist and hypertext fiction author whose research is in the fields of annotation, spatial hypertext and e-books. Several publications available here. Developer, theorist and hypertext fiction author whose research is in the fields of annotation, spatial hypertext and e-books. Several publications available here.
Hypertext theorist and author of spatial hypertext poems. Links to both theory and artistic work, and a bibliography of offline work. Hypertext theorist and author of spatial hypertext poems. Links to both theory and artistic work ...
... list for discussing technologies for linking and pointing, hypertext-oriented transformations, and interactions between XML and Web ... list for discussing technologies for linking and pointing, hypertext-oriented transformations, and interactions between XML and Web ...
Tools for creating hypertext documents, including PaperKiller and Hyper Publish Pro. Free trial versions available. Tools for creating hypertext documents, including PaperKiller and Hyper Publish Pro. Free ...

Next »

Help build the largest human-edited directory on the web.
Free thumbnail preview by Thumbshots.org

Search for products at amazon.com:
Search:
Keywords:
amazon.com books on 'Hypertext Markup Language':
Search at Google.com:
Google
WebCalSky.com Enzyklopädie

Im Artikel erwähnte Literatur