Daniel's
Web-Site
Home
-
Gott, Tee und die Welt
Informationen zu XML

das wichtigste:

- XML ist keine "fertige" Auszeichnungssprache wie HTML, sondern eine Metasprache.
Die Dateistruktur mit Tags wird per DTD oder per XML-Schema festgelegt
- Daten liegen in Klartext vor, Dokumente sind klar strukturiert
- XML ist nicht proprietär, sondern frei verfügbar: keine Lizenzprobleme
- XML ist ein universelles Datenaustauschformat
- Es gibt bereits mehr als 450 Standards für XML
- Aus XML werden XML-Dialekte abgeleitet, z.B. XHTML(HTML-Nachfolger), SwiftML (internat.Zahlungsverkehr),
ebXML (E-Business), MathML (Mathematik)
- Parsen: Lesen von XML-Dokumenten v.a. zum Generieren von HTML, WML, TXT, PDF mit Hilfe von XSL

Wer definiert XML? Das W3C und die Web-Standards

Die XML-Standards werden vom W3C-Consortium ( = World Wide Web Consortium),
einem internationalen Gremium, in Form von Recommendations erstellt.

Die Standards werden von den Mitgliedern des W3C, d.h. deren Beauftragten, in einem genau festgelegten Procedere vorgeschlagen, diskutiert, bewertet und festgelegt.

W3C recommendation track 1. Working Draft
- vom W3C zugelassene Arbeitsposition einer Arbeitsgruppe

2. Last Call Working Draft
- ein Working Draft, das die relevanten Anforderungen
der Arbeitsgruppe erfüllt
- öffentl. technischer Report, zur öffentl. Besprechung

3. Candidate Recommendation
- Aufruf an Öffentlichkeit, Erfahrungen bei der
Implementierung zu machen und mitzuteilen

4. Proposed Recommendation
- ein technischer Report, vom Direktor an das
Advisory Comitee zur Besprechung

5. W3C Recommendation
- W3C stimmt einer Verbreitung zu
(Grafik des W3C)
Das W3C ist u.a. für folgende Standards verantwortlich:
HTML, XML, XHTML, CSS, XSL, XSLT, XSL-FO, XPath, XPointer, XLink, XMLSchema, XForms, VoiceXML, XQuery, RDF, SVG, SMIL, MathML, XMLEncryption, XMLDigital Signature

Weitere Standardisierungs-Organisationen:
- ISO (International Organisation for Standardization)
- OASIS (Organization for the Advancement of Structured Information Standards) für ebXML (mit UN/CEFACT)

wichtige Links:

der Standard: Extensible Markup Language (XML) 1.0 (Fifth Edition)
die deutsche Übersetzung: Extensible Markup Language (XML) 1.0 (Zweite Auflage)
Die Standards des W3C (World Wide Web Consortiums) werden als "Recommendations" (Empfehlungen) bezeichnet. Sie entstehen in einem festgelegten Prozeß.

Parsing-Methoden: serverseitig / clientseitig

	1. clientseitiges Parsen im Browser 
		Vorteile: 	Parser allgemein verfügbar, geringe Serverbelastung 
		Nachteile: 	hohe Netzlast (viele Daten zu übertragen) 
			Abweichungen vom W3C-Standard, begrenzte technische Fähigkeiten 
			kein zeitnaher Zugriff auf Datenbanken möglich
			unterschiedliche Parser bei unterschiedlichen Browsern

	2. serverseitiges Parsen bei Seitenaufruf – dynamisches Generieren von HTML oder PDF
		Vorteile: 	zeitnaher Zugriff auf Datenbanken möglich 
			geringe Netzlast (wenig Daten zu übertragen)
 			einfache Browser auf der Clientseite genügen 
		Nachteile: 	hohe Serverbelastung, langsam bis sehr langsam (Kostenfaktor Arbeitszeit!) 
	
	3. Bereitstellung schon geparster Seiten in Text- oder HTML-Format oder als PDF 
		Vorteile: 	sehr schnell v.a. bei HTML oder Text
			geringe Netzlast (wenig Daten zu übertragen), niedrige Serverbelastung 
		 	einfache Installation, einfache Browser auf der Clientseite genügen 
		Nachteile: 	kein zeitnaher Zugriff auf Datenbanken möglich 
			nicht alle Möglichkeiten von XML sind einsetzbar 

Parser: in welcher Programmiersprache?

	Java-Parser
		Vorteile: 	Umsetzung vieler XML-Techniken
			offene Quellen erlauben eigene Entwicklungen
			sehr unabhängig vom Betriebssystem
		Nachteile:	eingeschränkte Geschwindigkeit
			eigene Entwicklungen komplexer als bei Scriptsprachen

	Parser mit Perl, PHP, Python, C
		Vorteile: 	sehr schnell 
			offene Quellen erlauben eigene Entwicklungen
		Nachteile:	weniger XML-Techniken als bei Java-Parsern umgesetzt
			eigene Entwicklungen einfacher als bei Java-Parsern

	Parser als ausführbare Datei (xt.exe)
		Vorteile: 	sehr schnell, einfach zu installieren
		Nachteile:	nicht alle XML-Standards funktionieren, z.B. CDATA
			nur für Windows-Rechner geeignet
			keine eigene Entwicklungen möglich, unflexibel

Mainframes und XML

Im Standard XML 1.0 fehlt der Zeilenumbruch für Mainframes.
Will man XML-Dokumente auf einem Mainframe-System mit Zeilenumbrüchen im Code darstellen, muss man den Code um Zeichen erweitern, die nicht dem Standard XML 1.0 entsprechen. Exportiert man diese Dokumente für Nicht-Mainframes, muss man diese Zeichen entfernen.