EnTrust - Engineering Trustworthy Data-Intensive Systems
Laufzeit: 01.07.2019 - 31.12.2021
Partner: Patrick Delfmann, Jan Jürjens, Ralf Lämmel, Andreas Mauthe, Viorica Sofronie-Stokkermans, Steffen Staab, Matthias Thimm, Claudia Wagner
Förderung durch: Ministerium für Wissenschaft Rheinland-Pfalz
Kurzfassung
Data Science ist ein interdisziplinäres Gebiet, das wissenschaftliche Methoden, Prozesse, Algorithmen und Systeme verwendet, um Wissen aus und Einsichten in Daten zu gewinnen, die in unterschiedlichen Formaten vorliegen. Kennzeichnend für das Gebiet ist einerseits die hohe Signifikanz, die es aufweist. Aufgrund der gewonnenen Resultate werden zahlreiche wichtige Entscheidungen getroffen, die den einzelnen oder die Gesellschaft als Ganzes betreffen: Diagnosen, Therapien, Kreditentscheidungen,...Data Science ist ein interdisziplinäres Gebiet, das wissenschaftliche Methoden, Prozesse, Algorithmen und Systeme verwendet, um Wissen aus und Einsichten in Daten zu gewinnen, die in unterschiedlichen Formaten vorliegen. Kennzeichnend für das Gebiet ist einerseits die hohe Signifikanz, die es aufweist. Aufgrund der gewonnenen Resultate werden zahlreiche wichtige Entscheidungen getroffen, die den einzelnen oder die Gesellschaft als Ganzes betreffen: Diagnosen, Therapien, Kreditentscheidungen, Raumplanungen, etc. Andererseits ist Data Science charakterisiert durch die iterative und empirisch-heuristische Vorgehensweise, mittels derer Wissen extrahiert und Entscheidungen abgeleitet werden. Was typischerweise zu kurz kommt, ist eine systematische, ingenieurorientierte Vorgehensweise, die Aussagen über die Qualität der Datenanalyse erlaubt.
Die Korrektheit von Softwaresystemen wird heute durch methodisches Vorgehen und formale Werkzeuge unterstützt oder gar bewiesen. Für Data Science und daraus entstehende datenintensive Software fehlt aber ein entsprechendes Inventar an Methoden, Prozessen, Algorithmen und Systemen, die zur Korrektheit beitragen. Insbesondere lässt sich auch nicht ohne weiteres "korrektes Verhalten" eines datenintensiven Systems beschreiben, denn das Ergebnis ist nicht vorherbestimmt und soll erst durch den Datenanalyseprozess gewonnen werden.
Das Ziel des Forschungsschwerpunktes der Universität Koblenz-Landau (unter zentraler Beteiligung von 9 Arbeitsgruppen des FB Informatik) ist es, methodische Vorgehensweisen und formale Werkzeuge zu erforschen, die die ingenieurmäßigen Entwicklung korrekter - oder zumindest vertrauenswürdiger - datenintensiver Software unterstützen. » weiterlesen» einklappen
Veröffentlichungen
- Hasso, Hussein; Großer, Katharina; Aymaz, Iliass et al.
- Abbreviation-Expansion Pair Detection for Glossary Term Extraction
Projektteam
- Marco Konersmann
- Mitarbeiter/in
(Institut für Softwaretechnik)
- Jan Jürjens
- Mitarbeiter/in
(Institut für Softwaretechnik)