Aufgabenbereich 3: Infrastrukturen für Nachnutzung von Daten und Software

Zusammenfassung    

Die Diskussion über FAIR-Grundsätze konzentriert sich in der Regel auf Daten.  FAIR-Software und Datenanalysewerkzeuge zur sinnvollen Nutzung dieser Daten sind jedoch ebenfalls ein wichtiger Bestandteil des Ökosystems der Forschungsdaten. Dieser Bedarf ist besonders bedeutend angesichts der zunehmenden Komplexität der wissenschaftlichen Datenanalyse von Röntgen- und Neutronendaten. Aufgabenbereich 3 (TA3) befasst sich damit, wissenschaftliche Datenanalysewerkzeuge und Software zusammen mit den Daten selbst FAIR zu machen. Daphne erreicht dies durch die Zusammenarbeit mit ausgewählten Power-User-Gruppen - den wissenschaftlichen "Influencern" der Photonen- und Neutronen-Community – um die Datenanalyse reproduzierbar und die notwendigen Werkzeuge auffindbar zu machen. Weiterhin zielt TA3 darauf ab, hohe Standards in der Entwicklung offener Forschungssoftware zu fördern.  TA3 konzentriert sich auf bestimmte Anwendungsfälle, die für die Forschergemeinschaft von großem Nutzen sind.

Herausforderungen und Ziele von TA3

Derzeit gibt es kein zentrales Verzeichnis für Software, die von führenden Forschungsgruppen zur Datenauswertung von großen Röntgen- und Neutronendatensätzen entwickelt wurde. Dies gilt insbesondere für Software, die zur Telearbeit auf der Recheninfrastruktur von großen Forschungszentren geeignet ist. Dies hindert andere Forscher (als jene, die die Messungen vorgenommen bzw. das Experiment durchgeführt haben) daran, die Datenanalyseabläufe zu wiederholen und die Analysesoftware für ihrer eigene Forschung zu verwenden.
Die Ziele von TA3 konzentrieren sich daher auf

  • Stärkung und Bereitstellung gemeinsam genutzter Datenanalysesoftware
  • Verfügbarkeit von Nutzer-Analysesoftware auf der Recheninfrastruktur von großen Forschungszentren
  • Bereitstellung von Forschungsdaten für Datenanalyse basierend auf künstlicher Intelligenz.

Unser Ziel ist es, Analysesoftware zu erstellen, zu verbessern und zu katalogisieren damit sie auf "Cloud-ähnlichen" Diensten bereitgestellt werden kann. Ziel ist es, dass "normale" Nutzer von der Arbeit der Power-User profitieren können, und die Analyse von "Big Data" technisch einfach, reproduzierbar und nachhaltig zu machen. Dies schließt auch die Zugänglichkeit der Daten für Methoden des maschinellen Lernens mit ein. Wir sind uns darüber im Klaren, dass eine Softwarekuratierung auf professionellem Niveau unerlässlich ist, um die Langlebigkeit der Beiträge von DAPHNE zur NFDI über die Projektdauer hinaus zu gewährleisten.
Die Akzeptanz von Softwarelösungen in der Nutzergemeinschaft, die mit Unterstützung von DAPHNE entwickelt wurden, sowie die Anzahl der Beamlines, die DAPHNE-Spezifikationen und -Software verwenden, können zur Messung des Erfolgs von TA3 herangezogen werden.

Erfahrung und Fachwissen

TA3 stützt sich auf das Fachwissen der beteiligten Gruppen an den Partneruniversitäten und den Röntgen- und Neutronenforschungszenten, die die Softwareentwicklung innerhalb von DAPHNE leiten werden.
Auch die Erfahrungen aus europäischen Projekten wie ExPaNDS und PaNOSC (z.B. bezüglich Code-Peer-Review, kontinuierlicher Integration, sowie Release- und Testzyklen) werden im Rahmen von DAPHNE angewandt und übernommen.
Was die Softwareentwicklungsmethodik betrifft, so planen wir eine enge Zusammenarbeit in kleinen Teams aus Wissenschaftlern von Universitäten, Forschungseinrichtungen und Beamlines um Lösungen zu entwickeln, die den Arbeitsabläufen und Bedürfnissen entsprechen. 

Schwerpunktbereiche

Während der Vorbereitungsphase von DAPHNE wurden die folgenden Bereiche als potenzielle Aktionsfelder für TA3 ermittelt: 

  1. Tomographietechniken, einschließlich Ptychographie-, Fluoreszenz- und Full-Field-Tomographie
  2. EXAFS und verwandte Spektroskopieverfahren
  3. Klein- und Weitwinkelstreuung (SAXS/WAXS/SANS) einschließlich Geometrien mit streifendem Einfall
  4. Serielle Kristallographie
  5. Verknüpfung von Forschungsdaten mit Methoden des maschinellen Lernens und künstlicher Intelligenz
  6. Mehrdimensionale Datenverarbeitung für Neutronenstreuung

Beteiligung

DAPHNE TA3 stützt sich weitgehend auf die Arbeit von Power-Usern und ermutigt und unterstützt diese Nutzergruppe von Röntgen- und Neutronenforschungseinrichtungen, ihre Datenanalyse-Pipelines reproduzierbar, wiederverwendbar und für andere Nutzergruppen verfügbar zu machen. Daher haben wir ein großes Interesse daran, die betreffenden Nutzergruppen und verwendete Software zu identifizieren, um eine mögliche Weiterentwicklung und Bereitstellung dieser Software durch DAPHNE in Betracht zu ziehen.

Zum Vorschlagen von Analysesoftware für das DAPHNE Software-Ökosystem oder zum Bekunden von Interesse an einer Zusammenarbeit mit DAPHNE TA3 (auch außerhalb der oben genannten Schwerpunktbereiche), steht das folgende Formular zur Verfügung: Link