In diesen Fällen, wird die NavaTec GmbH beauftragt, um einen GoBD-konformen Datenexport zu erstellen, der die erwähnten Mängel beseitigt und eine ordnungsmäßige Betriebsprüfung gewärleistet.
Wie bereits erwähnt, besitzen ERP-Systeme Funktionen zum Datenzugriff und auch speziell zur Erstellung eines Exports nach GoBD-Vorgabe für eine Datenträgerüberlassung (Z3). Viele Systeme erlauben auch einen Export der als IDEA-Format gekennzeichnet ist. Vergleicht man den durch diese Systeme erstellten Export, mit der von NavaTec GmbH aufzuarbeitenden Liste, dann wird deutlich, dass zum einen viele essentielle Grund- und Zeilentabellen fehlen und zum anderen die Anzahl an exportierten Stammdaten-Tabellen (Abhängigkeiten) unzureichend ist.
Beispiele für fehlende Grund- und Zeilentabellen:
Beispiele für fehlende Stammdaten (Abhängigkeiten):
Beim Datenexport werden vom ERP-System alle in der Datenbank vorhandenen Spalten exportiert, auch wenn diese für die Datenträgerüberlassung vollkommen irrelevant sind. Dies beeinträchtigt die Übersichtlichkeit der Daten, was eine Auswertung erschwert.
Das IDEA-Format erlaubt es Verknüpfungen zwischen Tabellen explizit zu definieren, anhand derer eine Auswertungssoftware die Tabellen-Beziehungen automatisch erkennen und entsprechend kenntlich machen kann. Oft fehlen jedoch jegliche Definitionen von Tabellenverknüpfungen, weswegen etwaige Beziehungen nur manuell und formlos anhand von Tabellen- und Spaltennamen ermittelt werden können.
Integrierte Export-Funktionen bieten oft keine Möglichkeit den Zeitraum für den Datenexport zu definieren. Es werden daher immer alle im System vorhandenen Datensätze der jeweiligen Tabellen exportiert, was den Steuerpflichtigen stark benachteiligen kann.
Dieser Abschnitt beschreibt mögliche Schritte nach denen die Datenaufarbeitung für einen Datenzugriff durch die Finanzverwaltung aussehen kann und erhebt keinen Anspruch auf Vollständigkeit!
ERP-Systeme verwenden zur Datenhaltung relationale Datenbanken, welche als Grundlage zur Erstellung des Datenexports hergenommen wird. Die Datenbank enthält meistens eine sehr große Anzahl an Tabellen, von denen nur ein Bruchteil für den Datenzugriff relevant ist. Zudem besitzen viele der relevanten Tabellen eine unüberschaubar große Anzahl an Spalten – einige über 100 und manche sogar über 200 Spalten – von denen ebenfalls nur ein Teil relevant ist. Eine der Hauptaufgaben bei der technischen Aufarbeitung, ist es deshalb zu bestimmen, welche Tabellen und welche Spalten für den Datenzugriff relevant sind.
Für die Bestimmung der relevanten Tabellen wird nach dem folgenden Schema verfahren: Zuerst werden die Grundtabellen identifiziert, welche unmittelbar Daten über steuerlich relevante Vorgänge enthalten, z.B. die Tabelle „Auftragsrechnung“. Diese Grundtabellen werden dann anhand des Prüfungszeitraums gefiltert, z.B. Rechnungen nach dem Rechnungsdatum. Für einige dieser Grundtabellen existieren zudem verknüpfte Zeilentabellen, z.B. die Tabelle „Auftragsposten“, welche die einzelnen Positionen von Aufträgen und Rechnungen enthalten. Es wird für jede einzelne Tabelle in der Datenbank geprüft, ob diese eine Grundtabelle oder Zeilentabelle ist, welche steuerlich relevante Daten enthält. Alle auf diese Weise gefundenen Tabellen bilden die Basis des Datenexports.
Zusätzlich besitzen die zuvor ermittelten Tabellen Abhängigkeiten zu vielen weiteren Tabellen (häufig Stammdaten), welche ebenfalls exportiert werden müssen. Alle relevanten abhängigen Tabellen werden über Fremdschlüsselverbindungen bestimmt, wobei auch alle transitiv abhängigen Tabellen (verschachtelte Abhängigkeiten) berücksichtigt werden. Es werden alle gefundenen relevanten Abhängigkeitstabellen in den Export mitaufgenommen.
Für die zu Datenzugriff muss zuerst bestimmt werden, welche Spalten steuerrelevante Daten enthalten und daher exportiert werden müssen. Dabei wird nach dem Ausschlussverfahren vorgegangen, indem eine Spalte dann vom Export ausgeschlossen wird, wenn sie einer der folgenden Merkmale aufweist:
Alle verbleibenden Spalten gelten als relevant und sind Teil des Exports. Wenn eine Spalte nicht eindeutig als relevant oder irrelevant bestimmt werden kann, dann wird sie im Zweifelsfall in den Export mitaufgenommen.
Im ersten Schritt wird eine Excel-Arbeitsmappe erstellt, in die alle für den Export relevanten Tabellen und Spalten manuell eingetragen werden. In derselben Datei werden außerdem alle Verknüpfungen der Tabellen zueinander erfasst. Die Arbeitsmappe ist dabei so formatiert, dass sie maschinell ausgelesen werden kann und ist die Grundlage dafür, um in einem nächsten Schritt den Export mithilfe eines Programms zu generieren.
Für die Generierung des Exports wird das NavaTec-Export-Programm verwendet, welches die Definitionen aus der zuvor erstellten Excel-Arbeitsmappe einließt und anhand dessen die benötigten Daten aus der Datenbank des Warenwirtschaftssystems abruft. Die Daten werden dann vom Programm in das IDEA-Format umgewandelt und entsprechend in Dateien abgespeichert.
Beim Umwandeln in das IDEA-Format werden folgende Datentransformationen vorgenommen, die rein technischer Natur sind und die Authentizität der Daten nicht beeinflussen:
Folgende Zeichen werden aus allen Texten entfernt:
Fremdschlüsselfelder mit dem Wert „“ (leere Zeichenkette), „0“ oder „-1“ werden geleert. Diese Werte sind Platzhalter und symbolisieren das Nichtvorhandensein einer optionalen Abhängigkeit.
Ergänzung von Tabellen, die in der Datenbank nicht über den Primärschlüssel verbunden sind, sondern z.B. über einen Text-Code. Im IDEA-Format ist diese Art der Verknüpfung nicht erlaubt, da Verknüpfungen nur über den Primärschlüssel erfolgen können. In solchen Fällen wird ein weiteres Feld in die jeweilige Tabelle hinzugefügt, welches auf den Primärschlüssel der Abhängigkeitstabelle verweist.
Das Resultat eines Exportprozesses kann aus den nachfolgenden Dateien bestehen.
Die Datei enthält gemäß der Spezifikation Beschreibungsdaten der Datenträgerüberlassung, d.h. alle Tabellen mit allen Spalten sowie den Tabellen-Verknüpfungen.
Die Spezifikation verlangt, dass die DTD der Indexdatei im Verzeichnis der Indexdatei liegen muss.
CSV-Dateien mit Datensätzen
Für jede Tabelle wird eine CSV-Datei ohne Überschriften im Verzeichnis der Indexdatei erstellt.