© aller Texte: msw 1999-2008
Tutorials / Mit Xerces parsen Teil 1 | Teil 2 | Teil 3 | Teil 4 | Teil 5 | Teil 6 | Teil 7

Mit Xerces parsen - Teil 1

Xerces ist ein verbreiteter XML-Parser, den man ohne grosse Schwierigkeiten in seine eigenen Java-Projekte einbinden kann. In diesem ersten Teil sehen wir uns die Installation an. Im zweiten Teil sehen wir uns den Java-Code an, über den Xerces genutzt wird.    Wir werden eine kleine Applikation erstellen, über die wir jede XML-Datei parsen können. Fehler in der XML-Datei werden natürlich angezeigt.

Wozu ist ein Parser nötig? Der Parser wird benutzt, um die Syntax der XML-Datei zu prüfen. Sollte ein Fehler vorliegen, wird dieser angezeigt. Xerces ist ein Open-Source-Parser, der von Apache entwickelt wird. Apache arbeitet ja auch an dem XSLT-Prozessor Xalan, zu dem es hier in Newsletter auch schon eine mehrteilige Reihe gab.

Die aktuelle Version von Xerces ist 2.4.0 (Ende Juli 2003). Dies ist die zentrale Xerces-Seite bei Apache:
http://xml.apache.org/xerces2-j/index.html
Der Parser selbst besteht aus zwei jar-Dateien. Diese können Sie sich über diesen Link herunterladen:
http://gump.covalent.net/jars/latest/xml-xerces2/
Laden Sie sich die beiden jar-Dateien xercesImpl.jar und xmlParserAPIs.jar herunter - Sie werden beide benötigt. Im nächsten Schritt muss der Parser installiert werden. Je nach Betriebssystem ist dies unterschiedlich. Voraussetzung ist narürlich, das eine Java-Version vorhandenist (ideal ist Java 2 Standard Edition 1.2 oder 1.3). Konkret muss der Pfad zu den beiden obigen jar-Dateien in der Umgebungsvariablen CLASSPATH angegeben werden.

Xerces unter Windows 95/98
Hier ist nur ein bisschen Handarbeit an der autoexec.bat-Datei nötig. In der Zeile SET CLASSPATH muss nun noch der Pfad zu den  beiden jar-Dateien hinzugefügt werden:

SET CLASSPATH=H:\jdk13\src.zip;H:\work;H:\parser\xerces201\xercesImpl.jar;H:\xerces201\xmlParserAPIs.jar;

Xerces unter Windows ME

Unter ME muss dies über ein Programm erfolgen. Dies geschieht über  Programme/ Zubehör / Systemprogramme/ Systeminformationen. Betätigen Sie Softwareumgebung und dann Umgebungsvariablen. Klicken Sie das Menü Extras / Systemkonfigurationsprogramm an.  In dem Dialog wäheln Sie Umgebung an. Jetzt hängen Sie den Pfad zu den beiden jar-Dateien an den Eintrag CLASSPATH an (getrennt durch Semikolon).

Xerces unter Windows NT/2000
Unter diesen beiden Betreibssystemen muss CLASSPATH ähnlich wie bei ME in den Systeminformationen gesetzt werden. Dies geschieht über Programme/Einstellungen/Systemsteuerung . Klicken Sie auf System, dann auf Erweitert und dann auf Umgebungsvariablen.  Dort müsste sich der Eintrag CLASSPATH befidnen, hier fügen Sie den Pfad zu den beiden jar-Dateien wie bei Windows ME hinzu.

Xerces unter Windows XP

Unter XP gehen Sie fast genauso vor, wie unter NT/2000. Klicken Sie jedoch auf Ihrem Desktop auf Arbeitsplatz, dann auf Eigenschaften, anschließend auf Erweitert und dann auf Umgebungsvariablen. Das weitere Vorgehen ist mit NT/2000 identisch.

Xerces unter LINUX
Unter LINUX muss als root die Datei profile im Verzeichnis  /etc/ geändert werden. Dort gibt es einen CLASSPATH-Eintrag, der um die Pfade zu den beiden jar-Dateien erweitert werden muss (schön getrennt durch einen Doppelpunkt), z.B.:

CLASSPATH=/usr/lib/jdk1.3/src.zip:/usr/lib/parser/xercesImpl.jar:/usr/lib/parser/xerces/xmlParserAPIs.jar:
/home/seebi/java/work:



Damit sind wir am Ende des ersten Teils angelangt. Im zweiten Teil werden wir konkret einen Java-Code kennen lernen, über den jede XML-Datei geparst werden kann. Fehler in einer XML-Datei werden dann angezeigt.




Tutorials / Mit Xerces parsen Teil 1 | Teil 2 | Teil 3 | Teil 4 | Teil 5 | Teil 6 | Teil 7