Lösungen zum Analytics-Quiz aus der ZOE 3/19, Seite 34


Die Fragen zu den elf Antworten finden Sie in der ZOE 03/19 auf Seite 34.

Bereit für ein Gespräch über Analytics?

Hier finden Sie die Antworten zum Analytics-Quiz in der Ausgabe 03/19 der Zeitschrift für Organisationsentwicklung:

1. Es sind Daten über Datenbestände, zum Beispiel wann sie erfasst wurden, von wem, woher sie stammen, oder welches Format sie sind. Metadaten sind wichtig bei der Aggregierung von verschiedenen Datenbeständen und sie können die Interpretation und Gewichtung von Daten erleichtern.

2. Daten in eine für einen Computer analysierbare Form bringen. Bei Text könnte das beispielsweise heißen: zählen, welcher Begriff in einem Text am häufigsten vorkommt.

3. Z. B. durch Visualisierung der Datenbestände (Ausreisser liegen abseits). Man sollte verstehen, warum diese Datensätze anders als alle anderen sind und sie eventuell aus der Analyse ausschließen.

4. Das erste beschreibt die Vergangenheit, das zweite prognostiziert die Zukunft.

5. Die wichtigsten Zahlen bzw. Daten, die einen Überblick ermöglichen.

6. Das erste fokussiert auf quantitative Analyse-Verfahren und Gütekriterien zur Analyse von Phänomenen, das zweite kombiniert diese mit dafür notwendigen Datenbankinfrastrukturen und Aufbereitungs-Software (inkl. Visualisierung), u. a. für die (zeitnahe) Nutzung in Entscheidungs- oder Problemlösungsprozessen.

7. Beim supervised machine learning lernt ein Algorithmus, Trainingsdaten in eine vorgegebene Struktur zuzuordnen (z. B. Kunden in vorgegebene Kundensegmente einzuordnen). Beim unsupervised machine learning ist das Ziel, diese Struktur erst zu ermitteln (z. B. die Kundensegmente zu identifizieren).

8. Man bildet aus dem gleichen Datensatz immer wieder neue Samples (Zufallsauswahlen) und macht so verschiedene Tests, um ein Modell zu verbessern.

9. Für die Gruppierung von Dokumenten, Bildern, Kunden nach Ähnlichkeitskriterien. Die Gruppengrenzen sind nicht immer klar.

10. Das erste ist eine Kalkulation der Korrelation von Daten (man versucht eine beobachtete abhängige Variable durch eine oder mehrere unabhängige Variablen zu erklären), das zweite ein Verfahren, um Datensätze durch Reduktion auf wichtige Variablen zu vereinfachen und zu veranschaulichen (ähnlich der Faktorenanalyse).

Bonusfrage: Eine besonders leistungsfähige Analysemethode auf der Basis von Entscheidungsbäumen, die gerade auch für Klassifikationen oder Prognosen äußerst nützlich ist.


Top