Aufgabenbereich 2: (Meta)Daten und Kataloge

Zusammenfassung

Das Ziel des Aufgabenbereichs 2 (TA2) ist es, miteinander verknüpfte Datenbestände und Kataloge, die den FAIR Prinzipien vollumfänglich gerecht werden, an allen teilnehmenden Neutronen- und Synchrotronstrahlungsquellen aber auch an Universitäten und anderen Forschungseinrichtungen zu implementieren. Diese Datenbestände müssen sorgfältig kuratiert und in ihrer Struktur kontinuierlich weiterentwickelt werden, um eine Auffindbarkeit, Wiederverwendung und Erweiterung der Datenbestände für die nationale und internationale Gemeinschaft von Wissenschaftlern im Bereich der Forschung mit Röntgenstrahlung und Neutronen nachhaltig sicherzustellen und zu optimieren. Dabei sollen nicht nur die Rohdaten sondern auch alle Verarbeitungs- und Analyseschritte von den Rohdaten bis zum Endergebnis und die detaillierte Beschreibung der Probe erfasst werden. Dies wird die Transparenz und damit die Qualität, Vertrauenswürdigkeit und Wiederverwendbarkeit der in Publikationen gezeigten Datensätze auf eine neue Stufe heben.

Herausforderungen und Ziele von TA2

Zunächst wird sich TA2 hauptsächlich mit der Erfassung von Roh(meta)datenbeständen und der Integration von verarbeiteten und veröffentlichten Daten befassen. Dies erfordert die Standardisierung von Daten und Metadaten (mit TA1) sowie die Anbindung an Softwarebestände (mit TA3). Um die Bestände miteinander zu verlinken, die sich auf verschiedene Phasen des Analyseprozesses bis hin zur Veröffentlichung beziehen, müssen gut definierte Schnittstellen und gemeinsame Standards für das verwendete Vokabular erstellt werden. Es soll die Möglichkeit geschaffen werden, nach einer Analyse die Rohdaten mit weiteren Metadaten sowie den ausgewerteten Datensätzen, abgeleiteten neuen Daten, komplementären experimentellen, simulierten und aus theoretischen Modellen gewonnenen Daten, Präzisierungen zu Eigenschaften und Qualität der Probe sowie Links auf weitere Informationen anzureichern. Neben der klassischen Suche in Metadaten zur Auffindung von Messdaten ist auch die Implementierung von (KI-)Suchalgorithmen zum Auffinden von Messdaten auf der Grundlage eines experimentellen oder simulierten Datensatzes vorgesehen.

Die Ziele von TA2 sind insbesondere

  • Implementierung und Weiterentwicklung von Datenbeständen und Katalogen
  • (Meta-)Datenstandardisierung und Probenidentifikation (Proben-PID)
  • Schaffung der Möglichkeit zum Einfügen zusätzlicher (Meta-)Daten in Bestand/Katalog
  • Implementierung innovativer Algorithmen zur effizienten Datensuche in Echtzeit

DAPHNE4NFDI wird einen wesentlichen Beitrag zur Etablierung von Standards zur Datenerfassung und -speicherung sowie zum Aufbau gut gepflegter Datenbestände leisten. Während sich TA1 hauptsächlich mit der automatisierten Erfassung von (Meta-)Daten befasst, widmet sich TA2 den Aspekten „Findable“, „Accessible“ und „Re-useable“ der FAIR-Datenrichtlinie.

Erfahrung und Fachwissen

TA2 stützt sich auf das Fachwissen der beteiligten Gruppen an den Röntgen- und Neutronenforschungszentren, Universitäten und anderen Forschungseinrichtungen. DAPHNE4NFDI wird durch die Einbindung einiger Partner in die EU-finanzierten Projekte PaNOSC und ExPaNDS profitieren. Mehrere Institutionen in DAPHNE4NFDI betreiben bereits Datenkataloge zur Erfassung der durchgeführten Experimente und erzeugten Messdaten. An einer Vernetzung solcher Datenkataloge zu einem Verbundkatalog wird bereits gearbeitet, indem ein gemeinsames API zur Suche in den Daten definiert und implementiert wird. Diese Kataloge haben auch Schnittstellen zur Anbindung an transnationale Infrastrukturen wie OpenAIRE und EUDAT.

Schwerpunktbereiche

Der Aufbau von Datenbeständen soll sich zunächst auf die Bereiche Röntgenabsorptionsspektroskopie, Tomographie, Beugung (Weit- und Kleinwinkel) und Spektroskopie (quasi-elastische Neutronenstreuung und XPCS) konzentrieren und auch zeitabhängige Messungen beinhalten.

Beteiligung

Die an DAPHNE4NFDI beteiligten Gruppen decken mit ihrer Expertise weite Teile der Forschung mit Röntgenstrahlen und Neutronen ab. Entsprechend werden alle relevanten Techniken vom DAPHNE4NFDI Konsortium adressiert und bei Planung und Realisierung von (Meta-)Datenformaten, Repositorien, Katalogen und Softwareprojekten berücksichtigt. Ein wichtiges Pilotprojekt für den Aufbau einer Referenzdatenbank ist im Bereich Röntgenabsorptionsspektroskopie einschließlich Röntgenemission und weiterer Photon-in/out-Techniken vorgesehen.