Herausforderungen und Ziele von TA2

Zunächst hat sich TA2 hauptsächlich mit der Erfassung von Roh(meta)datenbeständen und der Integration von verarbeiteten und veröffentlichten Daten befasst. Dies erfordert die Standardisierung von Daten und Metadaten (mit TA1) sowie die Anbindung an Softwarebestände (mit TA3). Um die Bestände miteinander zu verlinken, die sich auf verschiedene Phasen des Analyseprozesses bis hin zur Veröffentlichung beziehen, müssen gut definierte Schnittstellen und gemeinsame Standards für das verwendete Vokabular erstellt werden. Es wird die Möglichkeit geschafft, nach einer Analyse die Rohdaten mit weiteren Metadaten sowie den ausgewerteten Datensätzen, abgeleiteten neuen Daten, komplementären experimentellen, simulierten und aus theoretischen Modellen gewonnenen Daten, Präzisierungen zu Eigenschaften und Qualität der Probe sowie Links auf weitere Informationen anzureichern.

Die Ziele von TA2 sind insbesondere:

  • Implementierung und Weiterentwicklung von Datenbeständen und Katalogen

  • (Meta-)Datenstandardisierung und Probenidentifikation (Proben-PID) zusammen mit TA1

  • Schaffung der Möglichkeit verarbeitete oder besonders kuratierte Daten zu katalogisieren und bereitzustellen

DAPHNE4NFDI leistet einen wesentlichen Beitrag zur Etablierung von Standards zur Datenerfassung und -speicherung sowie zum Aufbau gut gepflegter Datenbestände. Während sich TA1 hauptsächlich mit der automatisierten Erfassung von (Meta-)Daten befasst, widmet sich TA2 den Aspekten „Findable“, „Accessible“ und „Re-useable“ der FAIR-Datenrichtlinie.

Erfahrung und Fachwissen

TA2 stützt sich auf das Fachwissen der beteiligten Gruppen an den Röntgen- und Neutronenforschungszentren, Universitäten und anderen Forschungseinrichtungen. DAPHNE4NFDI hat durch die vorausgehenden, EU-finanzierten Projekte PaNOSC und ExPaNDS enorm profitiert. Da viele verschiedene Institutionen in DAPHNE4NFDI Datenkataloge zur Erfassung der durchgeführten Experimente und erzeugten Messdaten bereitstellen, wird auch an einer Vernetzung solcher Datenkataloge zu einem Verbund gearbeitet. Dazu wurde ein gemeinsames API zur Suche in den Daten definiert und implementiert, das noch weiterentwickelt werden wird. Diese Kataloge haben auch standardisierte Schnittstellen zur Anbindung an transnationale Infrastrukturen wie OpenAIRE und EUDAT.

Schwerpunktbereiche

Der Aufbau von Datenbeständen hat sich zunächst auf die Bereiche Röntgenabsorptionsspektroskopie, Reflektometrie und XPCS konzentriert.