Home · Blog · Planet Digital Humanities

David Maus M. A.

Digital Humanities Publishing

Rückblick XML Prague 2018

David Maus, 12.02.2018 · Twitter · Comment · Permalink

XML Prague stand dieses Jahr für mich im Zeichen der Qualitätssicherung. Am unconference day hat Matthieu Ricaud-Dussarget eine Sammlung von Schematron-Regeln vorgestellt, mit dem in seinem Team XSLT-Stylesheets auf problematische Konstruktionen und die Einhaltung von Konventionen geprüft werden. Im Anschluss trafen sich bestehende und prospektive Nutzer von XSpec, einem Testframework für XSLT, XQuery und Schematron. Ich habe im letzten Jahr damit begonnen, einige Transformationen und Schemata mit XSpec abzusichern und kann es nur weiterempfehlen.

Der Vortrag Using Maven with XML Projects von Christophe Marchand and Matthieu Ricaud-Dussarget am Folgetag hat mich (wieder einmal) daran erinnert, mich näher mit continuous integration zu beschäftigen. Kommt mir zwar vor wie overkill, aber hey: Vielleicht ist das Aufsetzen eines CI-Systems einfacher, als ich denke?!

Letztlich am Samstag der XSLT-Checker der data2type GmbH. Ein System, mit dem sich Transformationsregeln ermitteln lassen, die in einem XSLT-Stylesheet nicht mehr verwendet werden. Auch hier ein im Grunde recht einfaches Prinzip: Das betreffende Stylesheet wird so modifiziert, dass es für jede Regeln eine Nachricht ausgibt, wenn sie greift. Dann wird eine repräsentatitve Menge von Quelldateien transformiert und am Ende geschaut, welche Regeln keine Nachricht produziert haben.

Darüber hinaus war allein der Vortrag von Hans-Juergen Rennau den Besuch wert. Der Codename SHAX steht für die Idee einer XML und RDF übergreifenden Modellierungssprache, mit der sich Beschränkungen zulässiger Eigenschaften von Informationsobjekten ausdrücken lassen. Ein in SHAX beschriebenes Modell lässt sich in Regeln für ein XML Schema, ein JSON Schema oder eine RDF Shape Expression (SHACL) übersetzen. Informationen können dann in den korrespondierenden Formaten (XML, JSON oder RDF) produziert, konsumiert und vor allem validiert werden.

Am Ende des Projektes Emblematica Online sind wir genau auf diesen Punkt gestoßen: Wir publizieren unsere Embleme als "kanonisches" RDF/XML, dass wir mit einem Schema beschreiben. In der (noch fälligen) Dokumentation der publizierten Metadaten würden wir genau die selben Angaben machen. Zwar ist das Projekt vorbei, doch wenn ich RDF Shape Expressions formulieren wollen würde, dann müsste ich die selben Angaben erneut wiederholen. SHAX to the rescue?

Letztlich bot der letzte Konferenztag natürlich auch die Gelegenheit, den 20. Geburtstag der XML-Spezifikation zu feiern. Stilecht mit einer kurzen Aufführung des XML-Tanzes.

Oh, und save the date: Markup UK am 9. und 10. Juni 2018 in London.