VIVO-Handbuch/Aufbereitung der Quellen/Daten strukturieren/Beispiel: Excel-Tabellen

Aus Handbuch.io

Stand: 28.04.2015

Beispiel: Excel-Dateien

Der Vorteil der Strukturierung mit Excel liegt in der Tabellenform, wodurch sich einzelne Eigenschaften und Ausprägungen der Items genau trennen lassen. Außerdem sind die vorhandenen Informationen meist schon tabellarisch strukturiert.


Abb. 1: Mögliche Ausprägungen bei Mitarbeitern

Zur besseren Übersicht bietet es sich an, die Excel-Dateien oder einzelnen Tabellen nach ihrem zugehörigen Item zu benennen. Die erste Zeile einer Tabelle zählt alle Attribute/Werte auf, welche ein Item haben kann. Jedes Attribut wird dabei einzeln in eine Spalte eingetragen (vgl. Abb.1). Die folgenden Zeilen werden dann mit den vorhandenen Daten gefüllt, entweder über Copy&Paste oder manuelles Eintragen.



Abb. 2: Formatierungsfehler


Beim Kopieren von Daten aus anderen Tabellen kann es passieren, dass Formatierungen mit übernommen werden und somit sich die Dateien verschieben. Es kann helfen, die kopierten Tabellen zunächst in Word zu importieren und dort so zu bearbeiten, dass die Felder sich in der Excel-Datei nicht mehr verschieben. So kann es von Nöten sein, zusätzliche Spalten in Word hinzuzufügen oder Umbrüche aus der Datei zu entfernen. Bei fehlenden Spalten müssten ansonsten alle Einträge nachträglich in Excel verschoben werden (vor allem bei unterschiedlich erfasstem, vorliegendem Datenmaterial aus verschiedenen Quellen). Umbrüche werden gerne als neue Zeile angesehen, wodurch in Excel sich Zeilen miteinander verbinden. Zur besseren Verarbeitung sollte jedoch eine Expression nur in einer Zeile vorhanden sein, somit werden entweder vorher die Umbrüche entfernt oder nachträglich die verbundenen Zeilen getrennt, alle Werte in die oberste der zugehörigen Zeilen übertragen und die folgenden leeren Zeilen gelöscht (vgl. Abb.2).


Wichtig ist, dass die einzelnen Excel-Dateien, welche überschneidende Werte haben, immer mit den gleichen Beschreibungen arbeiten, damit diese später miteinander vernetzt werden können. Dies erfordert eine genaue Absprache und möglicherweise auch die Entwicklung neuer Attributwerte, welche zuvor noch nicht definiert wurden. Meistens tritt dieses Problem bei der Organisationsstruktur auf, sowohl wenn diese noch nicht gut definiert wurde, als auch wenn die Struktur sich in der Zwischenzeit verändert hat und somit alte und neue Werte in den Quellen vorhanden sind. Dann wird es gegebenenfalls nötig, den aktuellsten Stand der Struktur herauszufinden.