Data Science in der Praxis: Wie Softwareentwicklung und Data Science zusammenspielen

2. Dezember 2019 Initiativen/Trends

Durch die steigende Datenflut gewinnen maschinelle Lernverfahren nicht nur in der Forschung immer mehr an Beliebtheit, sondern werden auch zunehmend in der Wirtschaft und der Industrie eingesetzt. Kein Wunder, gestalten moderne Frameworks wie TensorFlow oder PyTorch den Einstieg in die Entwicklung von Machine-Learning-Modellen so einfach wie nie. Schnell lassen sich damit effiziente Algorithmen entwickeln, die im besten Fall ganze Regelwerke ablösen und selbstständig Entscheidungen treffen können. Die Entwicklung von ML-Modellen ist jedoch häufig noch vom experimentierfreudigen Data-Science-Ansatz geprägt: Hyperparameter werden sorglos manuell angepasst und getestet oder Features in den Daten werden unterschiedlich vorverarbeitet, bis das Modell eine vernünftige Qualität liefert. Diese Entwicklungsstrategie mag für kurzlebige Projekte funktionieren, verliert bei längeren Zeiträumen und in größeren Teams aber schnell an Übersicht. Auf der anderen Seite beachten etablierte Softwareentwicklungs-Strategien oftmals nicht den experimentellen Anteil in der Arbeit mit diesen Technologien. Das Ergebnis sind schwer nachvollziehbare Projektresultate und frustrierte Entwickler. Viele Projekte passen ihre Entwicklungsstrategien und -muster jedoch nicht auf die Besonderheiten dieser Technologien an. Details