Aktuelles

Analyse des Datenmanagements des Behindertenverband Leipzig e.V.

veröffentlicht am

Dieser Beitrag ist Teil einer Blogpostreihe mit den folgenden Blogposts:

  1. Ankündigung der Zusammenarbeit mit BVL
  2. Über Erstellung der CSV-Datei mit Gebäudeinformationen und Barrierefreiheit
  3. Analyse des Datenmanagements des Behindertenverband Leipzig e.V.
  4. Treffen mit Interessenvertretern zur Vorstellung des Gebäude-Navigators (Open Data Show-Case)

Wir möchten mit diesem Beitrag das Ergebnis unserer Analyse der Methoden und Prozesse bei der Datenerfassung und -verwendung des Behindertenverband Leipzig e.V. (BVL) vorstellen. Der BVL eröffnet uns im Rahmen unserer Zusammenarbeit einen tieferen Einblick in seine Arbeitsweise während der Pflege und Erweiterung des Online Stadtführers. Mit seinen Informationen zur Barrierefreiheit von Gebäuden und Einrichtungen ist er eine wichtige Anlaufstelle und unterstützt nicht nur Menschen mit Behinderung mit wertvollen Informationen.

Hohes informatives Interesse

Besonders Menschen mit Behinderung haben ein hohes informatives Interesse, da sie mehr Aufwand haben, ihren Alltag zu planen und zu gestalten. Da es in Deutschland bisher noch keine flächendeckende Umsetzung der Standards zum Barrierefreien Bauen gibt, müssen Menschen mit Behinderung sich bereits vorab über örtliche Gegebenheiten informieren. Man möchte damit beispielsweise vermeiden erst vor Ort festzustellen, dass es doch keine behindertengerechte Toilette gibt. Webseiten und gedrucktes Informationsmaterial von Einrichtungen sind daher für eine Informationsanfrage relevant. Werden die Menschen dort nicht fündig, kommen andere Informationsquellen, wie domänenspezifische Vereine, in Frage. Sie stellen oft ein spezielles, jedoch zugleich auch fundiertes Informationsangebot bereit.

Der BVL als ein solcher Verein besitzt mit dem Online-Stadtführer eine vielen Personen zugängliche Informationsquelle. Er ist auch ein oft gewählter persönlicher Ansprechpartner für Menschen mit Behinderung und deren Angehörige. Mit der Aufgabe der Beratung behinderter Menschen in ihren speziellen Bedürfnissen geht eine hohe Verantwortung einher. Der BVL kann als unabhängiger Dritter, welcher keinen unmittelbaren Vorteil aus der Datenerfassung zieht, einen objektiven Standpunkt bei Datenerfassung und -publikation einnehmen.

Ein kommerzieller Betreiber einer Einrichtung (der nicht gemeinnützig arbeiten kann) muss aus marktwirtschaftlicher Notwendigkeit heraus ein überzeugendes Bild seiner Einrichtung schaffen, auch wenn dies nicht allen objektiven Kriterien einer behindertenfreundlichen Umgebung entsprechen mag.

Prozesse des Datenmanagements im Überblick

Um einen solchen objektiven und wertvollen Datenschatz zu pflegen, benötigt es eine Reihe von Werkzeugen und Techniken. Dem BVL gelingt dies seit über 20 Jahren und wir möchten mit der folgenden Analyse herausfinden und darlegen, wie er das bewerkstelligt. Dafür schauen wir uns die Prozessschritte bei der Datenerfassung, -übertragung und deren Publikation an. Weiterhin interessieren wir uns für die späteren Verwendungsmöglichkeiten der erzeugten Daten. Es folgt eine kurze Übersicht der einzelnen Prozesse:

  1. Erfassung der Daten - BVL-Mitarbeiter stellen Kontakt zu verantwortlichen Mitarbeitern vor Ort her und fragen, ob Interesse an einer Datenerfassung besteht. Zum vereinbarten Vor-Ort-Termin werden Daten über Gebäude erhoben, zudem findet eine händische Vermessung der Gegebenheiten vor Ort statt (z.B. Abstände im Behinderten-WC). Im persönlichem Gespräch wird für die Belange der Barrierefreiheit sensibilisiert. Die Auswertung der Daten wird vor der Veröffentlichung zur Freigabe an die Einrichtung gesandt.
  2. Händische Übertragung der Daten - Ausgefüllte Papier-Formulare werden in eine Microsoft Access-Datenbank für Langzeitspeicherung übertragen.
  3. Publikation und Weiterverwendung der Daten - Neben Speicherung in der Access-Datenbank, werden die Daten händisch in die Homepage (Link) eingepflegt. Die folgende Illustration stellt diese Prozesse und die einzelnen Ergebnisses jedes Abschnitts dar.

Illustration von Prozess-Datenmanagement

1. Erfassung der Daten - Vom ersten Gespräch bis zum ausgefüllten Papier-Formular

Vor der Erfassung der Daten erfolgt die Kontaktaufnahme mit einem Ansprechpartner eines Gebäudes oder einer Einrichtung. Zum vereinbarten Vor-Ort-Termin werden sowohl Fragen über die Einrichtung und deren Angebot gestellt, als auch Abmessungen vor Ort händisch durchgeführt.

Die gewonnenen Informationen werden dabei in ein Papier-Formular eingetragen. Neben allgemeinen Informationen enthält das Formular auch die Ergebnisse der Messungen, z.B. die Abstände innerhalb des Behinderten-WCs oder die Breite der schmalsten Tür im Gebäude. Das Formular wird nach Abschluss der örtlichen Besichtigung in eine spezielle Eingabemaske in der Datenbank von Microsoft Access eingepflegt.

Die Papier-Formulare für Datenerfassung vor Ort

Mitarbeiter des BVL nutzen ausgedruckte Formulare, um vor Ort Informationen über eine Einrichtung zu erfassen. Weiterhin bieten die Formulare einen Gesprächsleitfaden und eine Reihenfolge der Informationserfassung. Die fertig ausgefüllten Formulare werden später von Mitarbeitern in die Datenbank übertragen.

Zur Veranschaulichung nachfolgend ein Formular-Ausschnitt:

Formularausschnitt

Jedes Formular ist strukturell aus verschiedenen Bereichen aufgebaut und enthält Informationsgruppen. Auf diese Weise kann man inhaltlich zusammengehörige Informationen einfach abklären und springt thematisch nicht hin und her. Es gibt Informationsgruppen, die untereinander inhaltliche Abhängigkeiten besitzen. Damit sind Angaben gemeint, welche sich gegenseitig ausschließen können oder bei denen eine Angabe, eine andere bedingt. Händisch erfolgte Messungen werden im Formular präzisiert erfasst, zum Beispiel durch die entsprechenden Maßeinheiten (Höhe in cm)

Über die Entstehung der Formulare

Zu Beginn des Projektes des Stadtführers für Leipzig wurde von den beteiligten BVL-Mitarbeitern eine Analyse der bereits bundesweit erschienenen Stadtführer durchgeführt. Es existierte zu diesem Zeitpunkt bereits ein System namens DÜMAB, das einen ca. 10-seitigen Fragebogen sowie eine dazugehörige Software bereitstellte. Die genutzten Piktogramme waren sehr spezifisch und es gab davon 36 Stück. Der Fragebogen des BVL umfasst im Vergleich dazu nur 4 Seiten. Die vom BVL später erstellten Papier-Formulare orientierten sich an denen von DÜMAB. Weiterhin flossen in die Formularerstellung auch diverse DIN-Normen ein, konkret die DIN 18024 und 18040. Nähere Informationen zu diesen können z.B. unter 18024 und 18040 nachgelesen werden. Der BVL legte von Anfang an Wert darauf, dass die Formulare praktikabel sind, verständlich und nur klar erfassbare bzw. messbare Gegebenheiten erfassen. Alle Angaben sind entweder metrischer Natur (z.B. Zahlenangaben in cm) oder auf einer definierten Skala disjunkt einzuordnen (z.B. Türlauf links, rechts oder beidseitig). All diese Informationen mögen vielleicht für sich genommen trivial erscheinen, bilden aber in der Gesamtsumme eine Auflistung relevanter Hilfen für betroffene Menschen.

Vor- und Nachteile

In diesem Abschnitt werden die konstatierten Vor- und Nachteile des Prozesses zur Datenerfassungen zusammengefasst aufgelistet:

Vorteile

  • V-E-1: Die Informationsabfrage vor Ort bei den Verantwortlichen gewährleistet weitgehende Richtigkeit abgefragter Fakten (Mehraugenprinzip, Einbindung von relevanten Personen vor Ort).
  • V-E-2: Die Händische Messung von Gegebenheiten vor Ort durch BVL-Mitarbeiter gewährleistet valide metrische Angaben (Schönungen durch Betreiber werden weitgehend unterbunden).
  • V-E-3: Die Verwendung von einheitlichen Formularen für eine Informationsabfrage liefert ein einheitliches Schema für die Datenerfassung und Fragen an den Betreiber.
  • V-E-4: Die hohe Verlässlichkeit der Daten wird durch eine Prüfung der unabhängigen BVL-Mitarbeiter gewährleistet.
  • V-E-5: Die Sensibilisierung der Personen vor Ort führt i.d.R. dazu, dass ein besseres Verständnis für die Belange von Menschen mit Behinderung entsteht. Das Wissen über Barrierefreiheit ist noch zu gering, deshalb kann nicht vorausgesetzt werden, dass die Betreiber der Einrichtung selbst die Erhebung durchführen.

Nachteile

  • N-E-1: Der Prozess der ersten Kontaktaufnahme bis zum Veröffentlichen der ausgewerteten Daten ist zeitaufwendig, ebenso die Sensibilisierung für das Thema Barrierefreiheit bei Verantwortlichen der Einrichtung. Dies gilt auch bei Nachprüfungen von Änderungen in der Einrichtung.

2. Händische Übertragung der Informationen - Vom Formular in die Datenbank

Nach der Erfassung übernehmen die BVL-Mitarbeiter die Daten aus den Papier-Formularen händisch in eine Microsoft Access-Datenbank. Dafür verwenden sie spezielle Eingabeformulare in Access selbst, welche auf den Papier-Formularen basieren. Der Zweck dieser Datenspeicherung ist laut BVL auch für die spätere Suche im Datenbestand gedacht.

Anforderungen an die Verwaltungssoftware

Man besitzt mit Access seit mehr als 20 Jahren eine verlässliche Software, welche folgende Punkte im Umgang mit den Daten erfüllt:

  • A-VS-1: Einfache Erfassung der Informationen über Texteingabe
  • A-VS-2: Ablegen der Daten in strukturierter Form anhand einer vordefinierten Struktur
  • A-VS-3: Einfache Suchmaske für späteres Auffinden von Einträgen
  • A-VS-4: Verwendung der Software auf vorhandenen PCs (Betriebssystem Windows) und geringer Aufwand bei Einrichtung und Wartung der Software
  • A-VS-5: Daten müssen in lokaler bzw. geschützter Umgebung liegen, da nicht alle Gebäude-Einträge von den Betreibern für eine Veröffentlichung (z.B. im Internet) freigegeben wurden.

Wir fassen diese Punkte als Anforderungen auf, welche an die zugrundeliegende Software vonseiten des BVL gestellt werden. Hier sollte noch erwähnt werden, dass die verantwortlichen BVL-Mitarbeiter keine technische Ausbildung im Bereich des Daten-Managements erfahren haben. Aus diesem Grund ist Verwendung von Access zusammen mit benutzerdefinierten Formularen nachvollziehbar. Der Internetauftritt des Stadtführers wurde zunächst von der Firma proArt Leipzig erarbeitet und begleitet.

Analyse der Access-Datenbank

Die Access-Datenbank befindet sich lokal auf einem Arbeitsplatz-Rechner im BVL-Gebäude und enthält Informationen über ca. 2600 veröffentlichte Einrichtungen und Orte. Die Daten der Access-Datenbank liegen in Form einer .mdb-Datei vor und werden über Microsoft Access 2003 verwaltet. Innerhalb der .mdb-Datei existieren Eingabemasken für Datenverwaltung und -suche. Es gibt eine Tabelle, welche alle Gebäudeinformationen enthält. Diese weist jedoch einige problematische Gegebenheiten auf:

  • N-ACC-1: Es sind mehrzeilige Zellen vorhanden, die bei einer CSV-Verarbeitung zu Problemen führen können. Zum Beispiel sind die mehrzeilige Zellen über Betriebssystem-spezifische Zeilenumbrüche realisiert, welche unterschiedlich interpretiert werden können.
  • N-ACC-2: Die Zellen enthalten teilweise HTML-Tags wie <br> oder <a>. Die Verarbeitung von HTML erfordert ein spezielles Programm.
  • N-ACC-3: Die Adress-Bestandteile sind nicht einzeln aufgeschlüsselt, sondern zusammengefasst. Eine Adresszerlegung in Straße, Hausnummer etc. ist zeitaufwendig und fehleranfällig.
  • N-ACC-4: Die Adressen sind teilweise durch weitere Hinweise ergänzt (z.B. Hinterhaus, OG 1), welche zwar für Betrachter hilfreich sind, jedoch für spätere maschinelle Verarbeitung hinderlich. Ergänzungen führen faktisch dazu, dass Adressen nicht vollständig oder gar nicht mehr maschinell ausgelesen werden können.
  • N-ACC-5: Die Spalten im Tabellenkopf enthalten keine textuellen Bezeichnungen, sondern Abkürzungen (z.B. B20), welche auf entsprechende Formularfelder hinweisen. Dies ist für das Lesen durch Menschen ohne tiefergehende Kenntnis der Abkürzungen nicht sehr informativ und hilfreich.
  • N-ACC-6: Es erfolgt die Verwendung von 0 und 1 als Zellen-Werte (für ja + nein bzw. Anzahl). Zusammen mit den nicht textuellen Bezeichnungen entstehen unklare Daten auf dem Bildschirm, welche von Nichteingeweihten der Datenbank kaum bis gar nicht interpretiert werden können. Für Maschinen ist diese binäre Ausdrucksweise jedoch gut zu verarbeiten.
  • N-ACC-7: Hinweisfelder enthalten Angaben, wie Telefonnummern oder E-Mail-Adressen, welche nicht gesondert ausgezeichnet sind. Ein späteres maschinelles Auslesen dieser Informationen wird daher schwierig.
  • N-ACC-8: Die Verwendung von Sonderzeichen in Zellen (z.B. ") kann für ein späteres Auslesen und Interpretieren der Inhalte hinderlich sein, wenn Informationen bzw. in diesem Falle Sonderzeichen in bestimmten Kontexten unsauber ausgewiesen werden.

Einpflegen von Änderungen

Mit der Zeit verändern sich die Gegebenheiten vor Ort und neue Informationen müssen in den Datenbestand zurückfließen. Sei es von interessierten Bürgern und Touristen oder aber den Betreibern/Mitarbeitern der einzelnen Orte und Gebäude mitgeteilt: der BVL erhält auf verschiedenen Kanälen Benachrichtigungen zu Änderungen vor Ort.

Sobald der BVL über etwaige Änderungen informiert wurde, prüft er diese selbst nach. Dazu wird wieder ein Vorort-Termin vereinbart und die neuen Gegebenheiten nachgeprüft. Bei solch einem Treffen fallen mitunter weitere Gegebenheiten auf, welche die (erneute) Klassifikation der Barrierefreiheit beeinflussen und verändern können.

Das Nachprüfen jeder Änderung ist sehr zeitaufwendig und bindet Ressourcen, sowohl personeller als auch technischer Natur. Jedoch kann nur auf diese Weise die hohe Datenqualität gewährleistet werden. Bei Änderungen werden ebenfalls die oben genannten drei Abschnitte beim Datenmanagement durchlaufen.

Vor- und Nachteile

In diesem Abschnitt sind alle Vor- und Nachteile der erwähnten Methoden bei der händischen Übertragung der Informationen aufgelistet:

Vorteile

  • V-HUE-1: Die Verwendung einer verbreiteten Standardsoftware für Datenerfassung und -pflege ist möglich.
  • V-HUE-2: Die Einschränkung des Datenzugriffs bedingt sich durch die physische Speicherung auf einem lokalen System. Ergänzt wird dieser Zugriffsschutz dadurch, dass ein valides Benutzerkonto für den Computerzugriff nötig ist.

Nachteile

  • N-HUE-1: Die manuelle Übertragung der Informationen aus den Formularen in die Access-Datenbank ist zeitaufwendig. Weiterhin kann dieser Prozess schlecht parallelisiert, also von mehreren Personen, durchgeführt werden.
  • N-HUE-2: Die manuelle Übertragung der Informationen ist fehleranfällig und kann damit zu verfälschten Daten führen.

3. Publikation und Weiterverwendung der Daten

Bei der Veröffentlichung der Daten muss zuerst beachtet werden, dass nicht alle Betreiber von Einrichtungen der Veröffentlichung ihrer Daten zustimmen. Die BVL-Mitarbeiter überführen somit nur die freigegebenen Gebäude und zugehörige Informationen händisch in eine Homepage. Die Pflege und Erweiterung der Homepage in HTML findet manuell mit Editoren statt. Neben der Verwendung auf der Homepage, werden die Daten auch zur Auskunft am Telefon verwendet und wurden bis zum Jahr 1995 in gedruckter Form veröffentlicht.

Daten hauptsächlich für eine Informationsauskunft

Der BVL nutzt die Daten des Online-Stadtführers hauptsächlich zum Zweck der Auskunft. Über die Homepage können Interessierte selbstständig Informationen abrufen. Ergänzend dazu kann man den BVL auch telefonisch oder per Mail kontaktieren, um über nicht veröffentlichte Gebäude Auskunft zu erhalten.

Über die Datenausgabe auf der Homepage

Die Online-Datenquelle ist eine händisch gepflegte Kopie der Access-Datenbank und enthält ca. 1800 öffentliche Einrichtungen in HTML. Diese Inhalte sind als Fließtext aufgebaut und werden streckenweise durch Aufzählungen und Verlinkungen ergänzt. Eine Auszeichnung der Inhalte findet dabei nicht statt. Eine Auszeichnung ist ein technisches Mittel, um auf einer Webseite Textteile entsprechend einem Zweck zu markieren, sodass sie später durch entsprechende Programme interpretiert werden können. Auf der Webseite des Online-Stadtführers gibt es keinerlei inhaltlichen Auszeichnungen. So findet sich z.B. keine Markierung darüber, welche Textteile zur Adresse gehören oder welcher Textbereich die Telefonnummer betrifft.

Neben textueller Beschreibung werden auch Piktogramme genutzt, um konkrete Nutzungsmöglichkeiten auszuweisen. Sie orientieren sich an einer klaren Spezifikation, d.h. dass die Nutzung eines Piktogramms auf konkrete Gegebenheiten vor Ort hinweist (z.B. Vorhandensein entsprechender Behindertenparkplätze). Eine Liste der Piktogramme kann man hier finden.

Die Aufbereitung des HTML-basierten Textes in der jetzigen Form ist einfach gehalten und ästhetisch eingeschränkt. Es sorgt jedoch dafür, dass Lesegeräte von Menschen mit Sehbehinderung die Inhalte gut erfassen und wiedergeben können (z.B. Audioausgabe). Daneben können aufgrund der Wahl klarer Kontraste auch Menschen mit einer Sehschwäche die Texte gut erfassen.

Vor- und Nachteile

Die folgende Auflistung enthält eine Zusammenfassung von Vor- und Nachteilen bzgl. der Datenausgabe auf der Homepage:

Vorteile:

  • V-HTML-1: Es erfolgt eine Verwendung inhaltlich klarer Piktogramme zur Ausweisung örtlicher Gegebenheiten, wie zum Beispiel das Vorhandensein eines Behinderten-WC. Damit ist maschinelle Ermittlung der Gegebenheiten vereinfacht.
  • V-HTML-2: Die Aufbereitung des HTML-Textes in jetziger Form sorgt dafür, dass Lesegeräte von Menschen mit Sehbehinderung die Inhalte gut erfassen und wiedergeben können (z.B. Audioausgabe).

Nachteile:

  • N-HTML-1: Es erfolgt keine Auszeichnung von Inhalten innerhalb von HTML, sondern eine Auflistung der Fakten als Fließtext. Eine maschinelle Weiterarbeitung kann ohne Auszeichnung von Inhalten schwieriger sein, da aufwendigere Methoden zur Textanalyse genutzt werden müssen (z.B. NLP).
  • N-HTML-2: Die händische Pflege der HTML-Webseite ist zeitaufwendig, zumal somit lediglich eine Kopie der Access-Datenbank angefertigt wird. Damit können auch inhaltliche Unterschiede zwischen Quelle und Ziel entstehen.
  • N-HTML-3: Die Datenausgabe auf der Homepage wird aktuell noch nicht durch eine übergreifende Suchfunktion ergänzt, was das Auffinden von Einträgen erschweren kann.

Verwendete Methoden und Programme für die Analyse

Die Analyse wurde von Konrad Abicht (Universität Leipzig) in Zusammenarbeit mit den BVL-Mitarbeitern Gabriele Naumann, André Winkler und Gunther Jähnig durchgeführt. Sie stützte sich auf persönliche Gespräche, E-Mail-Korrespondenz, sowie die Analyse der Homepage und der bereitgestellten Access-Datenbank.

Die Homepage wurde auf Quellcode-Ebene analysiert und ihre Maschinenlesbarkeit neben allgemeinen Kriterien auch im Rahmen der Erstellung der CSV-Datei evaluiert. Die bereitgestellte Access-Datenbank wurde über das Programm GNOME MDB Viewer betrachtet. Es bietet neben der Tabellenansicht auch eingeschränkte Informationen über z.B. Eingabeformulare und Reports.

Die persönlichen Gespräche waren charakterisiert durch einen Gedanken- und Erfahrungsaustausch in offener und freundlicher Atmosphäre. Im Vorfeld wurde darauf Wert gelegt, dem BVL die Vorteile semantischer Technologien, Offener Daten und der Maschinenlesbarkeit näher zu bringen. Danach wurden in mehreren Treffen die Fragen des Datenmanagements erörtert, welche schlussendlich zu der vorgestellten Analyse führten.

Fazit

Es verbleibt noch das Niederschreiben eines Fazits. Wir waren sehr überrascht, wie mit einfachsten Mitteln eine hohe Datenqualität erreicht werden kann. Als Informatiker tendiert man eher dazu, sich mehr auf die Technik zu konzentrieren, wohingegen der BVL den Schwerpunkt auf die Methoden und die Arbeit vor Ort legt. Es bestand beim BVL nur ein rudimentäres Wissen zum Datenmanagement, als er mit dem Online-Stadtführer angefangen hat. Mit der Zeit haben sich die Prozesse jedoch verbessert, Fehler wurden behoben und die Werkzeuge weiterentwickelt. Aus informationeller Sicht ist das verwendete Toolset immer noch völlig unzureichend, jedoch hat uns die Analyse in der Hinsicht eines Besseren belehrt, dass es nicht so sehr auf die Tools ankommt, inhaltlich gute Daten zu erzeugen. Die verwendeten Methoden und das Nachprüfen der Gegebenheiten vor Ort spielen inhaltlich eine viel größere Rolle.

Uns hat bei den ganzen Betrachtungen besonders interessiert, wie die Daten erhoben wurden, welche Schritte man dafür gehen muss und wie man mit Sonderfällen umgeht. Die Prozesse des BVL führen zwar schlussendlich inhaltlich zu guten Daten, jedoch gibt es in der technischen Speicherung und Weiterverarbeitung einige Schwächen. Sie erschweren bzw. verhindern teilweise eine maschinelle Verarbeitung. Man muss hier kritisch den Informatiker bzw. Anwendungsentwickler fragen: Welche Mittel benötigt der BVL wirklich, um die angesprochenen Probleme zu beheben?

Der BVL ist für uns ein typischer Stellvertreter für Gruppen, welche semi-professionell Informationen über das Zusammenleben in der Gesellschaft ermitteln. Der Begriff semi-professionell ist hier keinesfalls abwertend gemeint, sondern soll nur konstatieren, dass bei den Mitarbeitern nicht immer eine Ausbildung bezüglich der Datenerfassung, -verarbeitung und -verwendung vorhanden ist. Wir charakterisieren diese Gruppen dadurch, dass ein Interesse an für die Gesellschaft relevanten Themen besteht und man dazu Erhebungen und Ausarbeitungen durchführt, um sie einer (breiten) Öffentlichkeit zur Verfügung zu stellen. Dafür orientiert man sich oft an Existierendem, wie DIN-Normen. Diese Gruppe stellt der Allgemeinheit wahre Schätze bereit und oftmals weiß man gar nicht, dass es sie überhaupt gibt. Wir würden uns wünschen, dass solche Datenschätze öfter gehoben werden, damit alle Menschen davon profitieren können!

Hauptansprechpartner

asp-f, bvl, datenmanagement, datenqualität