EESYS-ADAML-M: Applied Data Analytics and Machine Learning in R

Modulverantwortlicher: Prof. Dr. Thorsten Staake

Inhalte:
Der Kurs vermittelt theoretische Grundlagen und praktische Fertigkeiten in den Bereichen Data
Analytics und maschinelles Lernen. Zudem erfolgt eine Einführung in die Statistik-Software GNU R.
Dabei helfen konkrete Beispiele und reale Datensätzen aus den Themenfeldern Energie, Umwelt und
Konsumentenverhalten, um die Kursteilnehmerinnen und Kursteilnehmer auf die Herausforderungen in
der Praxis und in der angewandten Forschung vorzubereiten.
Nach einer Zusammenfassung ausgewählter Statistik-Grundlagen umfasst der Kurs
• eine Einführung in die Statistik-Software GNU R,
• den Entwurf von Feldexperimenten und die Erhebung von Verhaltensdaten mit
Informationssystemen,
• Verfahren der linearen und logistischen Regressionen,
• Verfahren der Cluster-Analyse,
• Techniken aus dem Bereich des Maschinellen Lernens einschließlich KNN, Regressionen und
Support-Vektor-Maschinen und
• Aspekte der Ethik und des Datenschutzes bei fortgeschrittenen Datenerhebungs- und
analyseverfahren.

Lernziele/Kompetenzen:
Nach erfolgreichem Abschluss des Kurses können die Teilnehmerinnen und Teilnehmer
• neue Praxis- und Forschungsfragen, die sich mit empirischen Methoden ergründen lassen, in
Experimente übersetzen,
• entsprechende Experimente planen und durchführen,
• aus den in der Veranstaltung vorgestellten Methoden geeignete auswählen, um erhobene Daten
korrekt zu analysieren,
• ihre Methodenwahl begründen und die Analyseschritte erklären,
• Analysen in R korrekt und effizient umsetzen,
• die Methoden, sofern erforderlich, für spezifische Probleme theoretisch fundiert anpassen,
• die Ergebnisse eigener Analysen und Analysen Dritter interpretieren und deren Vorteile und Grenzen
benennen und
• Aspekte des Datenschutzes und der Ethik, die bei der Anwendung leistungsstarker Erhebungs- und
Analyseverfahren zu beachten sind, benennen und kritisch reflektieren.
 

Organisatorisches:

  • 6 ECTS / 180 h
  • Zulassungsvoraussetzung für die Belegung des Moduls: keine
  • Empfohlene Vorkenntnisse:  Grundlegende Statistik-Kenntnisse (z.B. aus dem Bachelor-Studium).
    Eine Wiederholung der Statistik-Grundlagen ist Teil des zur Verfügung gestellten Online-Materials sowie der ersten Übungen und sollte, wenn erforderlich, durch ein Selbststudium ergänzt werden.
    Grundlegende Kenntnisse einer Programmiersprache.
  • Angebotshäufigkeit: WS, jährlich
  • Lehrformen: Vorlesung und Übung - 4,00 SWS
  • Sprache: Englisch
  • Schriftliche Prüfung (Klausur) / Prüfungsdauer: 90 Minuten