Prof. Thiele
HTW Dresden/ Peter Sebb
Dr. Maik Thiele ist seit September Professor für Datenbanksysteme an der HTW Dresden
Erstellt von Pressestelle |

Wie sehen Datenbanksysteme der Zukunft aus?

Neuberufen: Dr. Maik Thiele ist seit September 2021 Professor für Datenbanksysteme an der HTW Dresden. Nach seinem Studium der Informatik an der Technischen Universität Dresden im Jahr 2005 wurde er 2010 promoviert.

In seiner Doktorarbeit entwickelte er Methoden zur Echtzeitaktualisierung von Data-Warehouse-Systemen. Im Anschluss war er Gruppenleiter an der Professur Datenbanken der TU Dresden und beschäftigte sich primär mit der Fragestellung, wie alternative Datenverwaltungs- und Datenbank-Ökosysteme der Zukunft aufgebaut sein müssen, um die Integration, Verarbeitung und Analyse der stetig wachsenden Datenaufkommen zu gewährleisten. Dabei arbeitete er insbesondere an der Schnittstelle zwischen Datenbanksystemen und den Methoden und Techniken des Information-Retrieval bzw. des Maschinellen Lernens, um zum Beispiel „In-Databases ML Systems“ zu ermöglichen. Diese Problematik war auch Teil seiner Arbeit als Mitglied im ScaDS.AI (Center for Scalable Data Analytics and Artificial Intelligence) Dresden/Leipzig, wo er u.a. die Themengebiete „Big Data Engineering“ und „Data Lifecycle Management“ verantwortet hat. In seiner Tätigkeit als Koordinator im Sonderforschungsbereich 912 „Highly Adaptive Energy-Efficient Computing“ (HAEC) hat sich Maik Thiele zudem mit der Entwicklung adaptiver und energie-effizienter In-Memory-Datenbanksysteme und Softwarearchitekturen beschäftigt.

Über die Hochschule hinaus war er als Gastwissenschaftler bei der GfK Gruppe in Nürnberg, der UBS AG in Zürich und HP Labs in Palo Alto (USA) tätig. Er hält Seminare zum Thema „Maschinelles Lernen“ für den Berufsverband Deutscher Markt- und Sozialforscher e.V. (BVM) und steht in enger Beziehung mit dem Entwicklungsteam der SAP HANA Cloud.

Welche Anforderungen müssen die Datenbanksysteme der Zukunft erfüllen?

In jedem Fall Skalierbarkeit. Als ich vor 16 Jahren angefangen habe, mich intensiver mit Datenbanksystemen (DBMS) zu beschäftigten, bestand die einzige Möglichkeit zur Realisierung größerer Datenbankinfrastrukturen darin, Server zu beschaffen, Datenbanksysteme zur lizenzieren, Personal einzustellen und die entsprechenden Lösungen aufwendig zu entwickeln. Diese waren meist überprovisioniert und teuer, da eine nachträgliche Skalierung nicht möglich war. Heute bieten serverlose DBMS wie Google BigQuery oder AWD Redshift Spectrum skalierbare Datenanalysen mit viel weniger Personal und zu viel geringeren Kosten.

Ein weiterer Trend sind sogenannte autonome oder auch „selbstfahrende“ DBMS, die im Idealfall einen reibungslosen Betrieb ohne menschliches Zutun ermöglichen. Ich gehe davon aus, dass in Zukunft autonome Datenbanksysteme in der Lage sein werden, sich selbst automatisch und ohne menschliches Eingreifen oder Anleitung zu konfigurieren, bereitzustellen und zu optimieren. Hier existieren bereits einige vielversprechende Ansätze, die maschinelles Lernen verwenden, um die wichtigsten Parameter zu identifizieren und basierend auf dem Workload optimale Werte zu ermitteln.

Auch die zunehmende Vielfalt von Daten stellt DBMS vor Herausforderungen. Um verschiedene Daten auf das relationale Modell abzubilden, können Multi-Modell-Datenbanken (MMDB), die mehrere Datenmodelle, z.B. Dokument-, Graph-, relationale und Key-Value-Daten sowie die passenden Anfragesprachen in ein System integrieren, die Antwort sein.

Was wollen Sie den Studierenden vermitteln?

Zunächst möchte ich den Studierenden ein solides Grundlagenwissen zu relationalen Datenbanksystemen (RDBMS) vermitteln. RDBMS wurde zwar schon vielfach totgesagt – etwa im Jahr 2000 als objektrelationale Systeme einen kurzen Hype erfahren hatten oder Ende der letzten Dekade mit dem Aufkommen der NoSQL-Bewegung – aber wie heißt es so schön „Totgesagte leben länger“ und im Fall von RDBMS denke ich nicht, dass wir noch in naher Zukunft eine Welt ohne relationale Systeme erleben werden. Aber auch aus Forschungssicht sind RDBMS nach wie vor interessant, denkt man z.B. nur an Themen wie Anfrageoptimierung und den Betrieb hochverteilter Systeme in der Cloud.

Darüber hinaus möchte ich den Studierenden neue Perspektiven eröffnen und ihnen zeigen, dass es einfach spannend sein kann, sich mit Daten zu beschäftigten und die Vielfalt der möglichen Betätigungsfelder über den klassischen Datenbankentwickler und -administrator hinaus vergegenwärtigen. Beispielhaft seien hier Berufe wie der des Data Scientist, Data Engineer, Data Analyst, BI Engineer, Data Architect oder Data Quality Engineer genannt, die sicherlich die Wenigsten zu Beginn ihr Studiums auf dem Radar haben, die aber sehr herausfordernde Aufgaben bieten und in vielen Branchen gut bezahlt werden.

Wer Interesse an diesen Themen hat, den lädt Prof. Thiele zur seiner Lehrveranstaltung „Erweiterte Datenbanktechnologien und Medienarchive“ ein. Auch zum nächsten Datenbankstammtisch am 20. Oktober um 17:00 Uhr wird er dazu berichten.

Erstellt von Pressestelle |