Mit Xerces parsen - Teil 1
Xerces ist ein verbreiteter XML-Parser, den man ohne grosse
Schwierigkeiten in seine eigenen Java-Projekte einbinden kann. In diesem ersten Teil sehen wir uns die Installation
an. Im zweiten Teil sehen wir uns den Java-Code an, über
den Xerces genutzt wird. Wir werden eine kleine Applikation
erstellen, über die wir jede XML-Datei parsen können. Fehler in
der XML-Datei werden natürlich angezeigt.
Wozu ist ein Parser nötig? Der Parser wird benutzt,
um die Syntax der XML-Datei zu prüfen. Sollte ein Fehler vorliegen,
wird dieser angezeigt. Xerces ist ein Open-Source-Parser, der von Apache
entwickelt wird. Apache arbeitet ja auch an dem XSLT-Prozessor Xalan, zu
dem es hier in Newsletter auch schon eine mehrteilige Reihe gab.
Die aktuelle Version von Xerces ist 2.4.0 (Ende Juli 2003). Dies ist
die zentrale Xerces-Seite bei Apache:
http://xml.apache.org/xerces2-j/index.html
Der Parser selbst besteht aus zwei jar-Dateien. Diese
können Sie sich über diesen Link herunterladen:
http://gump.covalent.net/jars/latest/xml-xerces2/
Laden Sie sich die beiden jar-Dateien xercesImpl.jar
und xmlParserAPIs.jar herunter - Sie werden beide benötigt. Im nächsten
Schritt muss der Parser installiert werden. Je nach Betriebssystem ist dies
unterschiedlich. Voraussetzung ist narürlich, das eine Java-Version
vorhandenist (ideal ist Java 2 Standard Edition 1.2 oder 1.3). Konkret muss
der Pfad zu den beiden obigen jar-Dateien in der Umgebungsvariablen CLASSPATH
angegeben werden.
Xerces unter Windows 95/98
Hier ist nur ein bisschen Handarbeit an der
autoexec.bat-Datei nötig. In der Zeile SET CLASSPATH muss nun noch
der Pfad zu den beiden jar-Dateien hinzugefügt werden:
SET CLASSPATH=H:\jdk13\src.zip;H:\work;H:\parser\xerces201\xercesImpl.jar;H:\xerces201\xmlParserAPIs.jar;
Xerces unter Windows ME
Unter ME muss dies über ein Programm erfolgen. Dies geschieht über
Programme/ Zubehör / Systemprogramme/
Systeminformationen. Betätigen Sie Softwareumgebung und dann
Umgebungsvariablen. Klicken
Sie das Menü Extras / Systemkonfigurationsprogramm an.
In dem Dialog wäheln Sie Umgebung an. Jetzt hängen Sie den
Pfad zu den beiden jar-Dateien an den Eintrag CLASSPATH an (getrennt durch
Semikolon).
Xerces unter Windows
NT/2000
Unter diesen beiden Betreibssystemen
muss CLASSPATH ähnlich wie bei ME in den Systeminformationen gesetzt
werden. Dies geschieht über Programme/Einstellungen/Systemsteuerung
. Klicken Sie auf System, dann auf Erweitert und dann auf
Umgebungsvariablen. Dort müsste sich der Eintrag CLASSPATH
befidnen, hier fügen Sie den Pfad zu den beiden jar-Dateien wie bei
Windows ME hinzu.
Xerces unter Windows
XP
Unter XP gehen Sie fast genauso vor, wie unter NT/2000. Klicken Sie jedoch
auf Ihrem Desktop auf Arbeitsplatz, dann auf Eigenschaften,
anschließend auf Erweitert und dann auf Umgebungsvariablen.
Das weitere Vorgehen
ist mit NT/2000 identisch.
Xerces unter LINUX
Unter LINUX muss
als root die Datei profile im Verzeichnis /etc/ geändert
werden. Dort gibt es einen CLASSPATH-Eintrag, der um die Pfade zu den beiden
jar-Dateien erweitert werden muss (schön getrennt durch einen Doppelpunkt),
z.B.:
CLASSPATH=/usr/lib/jdk1.3/src.zip:/usr/lib/parser/xercesImpl.jar:/usr/lib/parser/xerces/xmlParserAPIs.jar:
/home/seebi/java/work:
Damit sind wir am Ende des ersten Teils angelangt. Im zweiten Teil werden
wir konkret einen Java-Code kennen lernen, über den jede XML-Datei geparst
werden kann. Fehler in einer XML-Datei werden dann angezeigt.
Tutorials / Mit Xerces parsen Teil 1 | Teil 2 | Teil 3 | Teil 4 | Teil 5 | Teil 6 | Teil 7
|