Daten(quellen) finden und ins BI-Tool überführen

Um die Fragen, die Sie identifiziert haben, beantworten zu können, müssen die dazu passenden Daten gefunden werden. Diese können in unterschiedlichen Formaten vorliegen und aus verschiedenen Quellen stammen (welche Art von Daten und Datenquellen es gibt, haben wir  in einem anderen Beitrag behandelt).

Daten, die für BI genutzt werden, liegen häufig in internen Anwendungen (z.B. Buchhaltungsprogramm) und internen oder externen Datenbanken (z.B. Kundendatenbank) vor. Um für eine Analyse mittels BI nutzbar zu sein, müssen die Datenquellen an das BI Tool angebunden sein. Dafür gibt es zwei grundsätzliche Möglichkeiten: Den Datenimport und die direkte Abfrage. Beide Möglichkeiten stellen wir im folgenden vor.

Datenimport

Die erste Möglichkeit Daten in das BI-Tool zu überführen ist der Datenimport. Dabei werden die benötigten Daten zunächst aus der Datenquelle herauskopiert. Dies kann beispielsweise mittels einer Excel Tabelle passieren. Die kopierten Daten werden anschließend per Import- Funktion in das BI-Tool geladen.

Für den Datenimport stehen in den meisten wie BI-Tool eine große Menge Datenquellen zur Verfügung.

Beim Datenimport werden die Daten direkt in das BI-Tool geladen. In der Regel können die Daten per Knopfdruck aktualisiert werden, sobald sich in der Importdatei etwas ändert und diese weiterhin mit dem BI Tool verbunden ist. Die Originaldaten bleiben davon unberührt, da lediglich eine Kopie der Daten in das BI-Tool importiert wurde.

  • Performance

    Das Laden und die Datenverarbeitung sind i.d.R. schneller

  • Zahlreiche Verknüpfungen

    Die meisten BI-Tools bieten Verknüpfungsmöglichkeiten für eine Vielzahl an Datenquellen für den Import an.

  • Umfang

    Importe sind häufig auf einen spezifischen Umfang an Datenvolumen beschränkt.

direkte Abfrage (direct query)

Wenn die Daten nicht zunächst als Kopie aus den Originaldaten extrahiert werden sollen oder können, kann auch per Direktabfrage eine Verknüpfung zwischen dem BI Tool und der Originaldatenquelle (z.B. SAP Hana, Azure) erstellt werden. Ob eine direkte Abfrage möglich ist, hängt vor allem vom gewählten BI Tool ab. Während einige Tools eine größere Menge an Verknüpfungen zur Verfügung stellen, ist die Auswahl bei anderen Tools sehr eingeschränkt (zum Thema „Auswahl eines BI-Tools“ finden Sie in der Toolbox einen eigenen Beitrag).

Bei der direkten Abfrage wird eine direkte Verbindung zwischen dem Be Tool und der Originaldatenquelle erstellt. Die Daten werden dabei nicht in das BI-Tool geladen, sondern verbleiben im Original in der ursprünglichen Datenquelle.

  • Ort der Speicherung

    Die Daten werden nicht dupliziert und verbleiben am Ort der Entstehung.

  • Umfang

    In der direkten Abfrage können große Datenmengen („Big Data“) verarbeitet werden.

  • Performance

    Die Verarbeitungsgeschwindigkeit im BI-Tool ist bei direkter Abfrage häufig langsamer.

  • Vernüpfungen

    Viele BI-Tools bieten nur eine beschränkte Zahl an Schnittstellen für die direkte Abfrage.