Willkommen bei Koenig Data Solutions

Expertise

Philosophie

Wissenschaftliche Präzision

Ich bringe einen wissenschaftlichen Blickwinkel in die Welt industrieller Daten. Ich liefere Modelle, die nicht nur auf dem Papier "gut abschneiden", sondern validiert, reproduzierbar und plausibel sind.

Professionelle Software

Zuverlässige Software braucht ein solides Fundament. Ich setze auf moderne Technologien, professionelle Design Patterns und produktionsreifes Packaging in Python und R.

Informierte Entscheidungen

Daten sind nur wertvoll, wenn sie zu besseren Entscheidungen führen. Ich baue die interaktiven Brücken – Dashboards, APIs und Tools – die komplexe Rohdaten in klare, umsetzbare Geschäftslogik übersetzen.

Fähigkeiten

$ ./list_skills.sh

Programmiersprachen:

[Python] [SQL] [R] [JavaScript] [Shell scripting]

Maschinelles Lernen & KI:

[Regression] [Klassifizierung] [Hyperparameter-Optimierung] [Modellbewertung] [KI-Agenten] [Anomalieerkennung] [XGBoost] [PyTorch] [scikit-learn] [caret]

Web & APIs:

[HTML] [CSS] [async/await] [FastAPI] [Flask] [Plotly Dash] [R Shiny]

Data Engineering:

[PostgreSQL] [MySQL] [DuckDB] [Neo4j] [pandas] [tidyverse] [PowerQuery] [Apache Airflow]

Visualisierung & Reporting:

[Plotly] [R Markdown] [Quarto] [ggplot2] [matplotlib]

Tooling & Infrastruktur:

[Linux] [Git] [Docker] [AWS] [On-premises hosting] [CI/CD] [Camunda] [Jira]

Ausbildung & Hintergrund

2008 – 2012

B.Sc.

HTW Dresden

Umweltmonitoring

2012 – 2014

M.Sc.

Universität Göttingen

Biodiversität, Ökologie & Evolution

2015 – 2019

Dr. rer. nat.

Universität Göttingen

Biodiversität, Ökologie & Evolution

2019 – 2021

Wissenschaftlicher Mitarbeiter

HU Berlin • Universität Potsdam

Forschung und Lehre

2021 – Heute

Freiberuflicher Entwickler

König Data Solutions

Data Science und Softwareentwicklung

Dienstleistungen

Maschinelles Lernen

Entwicklung von Vorhersagemodellen und Klassifikationssystemen
Design und Implementierung von räumlichen und Zeitreihen-Modellen
Modellevaluierung, Validierung und Monitoring

Generative KI

RAG-gestützte KI-Assistenten und NLP-Integration
Vektordatenbanken und semantische Suche
KI-Agenten und automatisierte Tool-Integration

Data Engineering

Architekturdesign für transaktions-basierte (OLTP) und analytische (OLAP) Systeme
Graph-basierte Modellierung und Knowledge Graphs
Entwicklung performanter ELT/ETL-Pipelines

Reporting & Analytics

Produktionsreife interaktive Webanwendungen
Benutzerzentrierte interne Tools zur Datenexploration
Reproduzierbares, automatisiertes Reporting und Dokumentgenerierung

Infrastruktur

Containerisierte Umgebungen mit Docker und Docker Compose
Automatisierte CI/CD-Pipelines für nahtlose App-Bereitstellung
Linux-Server-Konfiguration und sichere On-Prem-Setups

Wissenschaftliche Beratung

Implementierung von Standards für Performanz und Reproduzierbarkeit
Entwicklung interner R- und Python-Packages
Weiterentwicklung wissenschaftlicher Prototypen nach professionellen Standards

Portfolio

Dez 2025 – Heute

Umweltdaten-Plattform | LFB

Qualitätssicherung • Infrastruktur

Optimierung von Daten-Pipelines zur Verbesserung von Datenqualität und -verfügbarkeit. Implementierung von Algorithmen zur Anomalieerkennung. Datenvorhaltung- und -bereitstellung mit PostgreSQL und Supabase.

PostgreSQL • Python • R • Supabase • Anomalieerkennung • Datenvorverarbeitung

Mai 2024 – Heute

Datenexplorations-Plattform | KWS Saat

Biotechnologie • Full-Stack-Entwicklung

Aufbau einer Analyse- und Visualisierungsplattform für die Pflanzenzüchtung mit FastAPI, Neo4j und Plotly Dash. Interaktive Netzwerk-Visualisierungen mit Cytoscape. Integration generativer KI-Modelle zur datengetriebenen Unterstützung von wissenschaftlichen und kommerziellen Entscheidungsprozessen.

Python • FastAPI • Neo4j • Plotly Dash • Cytoscape • LangChain • AWS • Docker

Jun 2024 – Sep 2025

Technische Infrastruktur für Biodiversitätsforschung | iDiv

Forschung • Data Science

Aufbau einer integrierten Datenplattform für heterogene ökologische Datentypen. Gestaltung einer DuckDB-basierten Speicherarchitektur für effiziente räumliche Operationen und Entwicklung automatisierter R-Package-Pipelines für Datenaufnahme. Implementierung fortgeschrittener Multi-Species-Modellierung mit Deep Learning und Ensemble-Vorhersagen.

R • DuckDB • torch • caret • Ensemble-Modellierung • targets • Räumliche Daten

Jun 2023 – Okt 2024

Prozessautomatisierung | Offerista Group

Digital Marketing • Datenautomatisierung

Optimierung und Automatisierung lokalisierter Digital-Marketing-Workflows. Umstrukturierung komplexer MS Excel/PowerQuery-Datenarchitekturen zur Verbesserung der Wartbarkeit und Leistung. Implementierung automatisierter Datenvalidierung und -bereinigung mit direkter Integration externer Ressourcen über die Looker-API.

MS Excel • PowerQuery • Looker API • VBA

Aug 2022 – Feb 2024

Reporting Infrastruktur | Europäische Zentralbank

Finanzen • Enterprise-Systeme

Migration der technischen Infrastruktur des Finanzberichtssystems der EZB. Entwicklung eines benutzerdefinierten R-Package-Ökosystems und einer kollaborativen R-Shiny-Anwendung für automatische Berichtsgenerierung. Integration mit Oracle DB, Camunda-Workflows und Enterprise-Dokumentenmanagementsystemen in einer agilen Scrum-Umgebung.

R • R Shiny • Python • Camunda • OracleDB • GitLab API • Zeitreihendaten

Nov 2021 – Jul 2022

Interaktives Tool zur Datenstandardisierung | KIT

Forschung • Webanwendung

Entwicklung einer R-Shiny-Webanwendung für Forscher zum Standardisieren und Teilen von Vegetationsdaten. Implementierung robuster XML-Verarbeitungspipelines für Datenvalidierung und Schema-Konformität. Optimierung der Systemleistung und Verwaltung der Bereitstellung über Dockerisierte Server-Umgebungen.

R • R Shiny • XML • Docker • Wissenschaftliche Daten

Christian König