3. července 2023
Evropská genomická datová infrastruktura (GDI) vydala koncem června speciální "startovací sadu" založenou na ověřených koncepcích vzácných onemocnění a rakoviny z projektu Beyond 1 Million Genomes (B1MG). GDI je mezinárodní projekt na kterém se podílí i dva ústavy Masarykovy univerzity – CEITEC MUNI a ICS MUNI. Cílem tohoto projektu je vybudovat bezpečnou a udržitelnou datovou infrastrukturu potřebnou k naplnění ambicí iniciativy 1+Milon genomů (1+MG). Tato iniciativa má potenciál zlepšit prevenci nemocí, umožnit individualizovanější léčbu a uplatnit výhody genomické medicíny v celé Evropě.
Startovací sada GDI je klíčovým výstupem, který podporuje přístup partnerů ke společným genomickým datům. Bude přínosem nejen pro národní uzly GDI, ale v budoucnu také pro veřejné instituce a společnosti, které mohou využít softwarové technologie ke zvýšení právní, organizační, sémantické a servisní interoperability tím, že tento software a standardy začlení do svého vlastního prostředí.
Startovací sada je soubor softwarových aplikací a komponent, které společně vyvinulo 20 národních uzlů GDI a které jsou založeny na otevřených komunitních standardech Globální aliance pro genomiku a zdraví (GA4GH). Ty byly přizpůsobeny pro nové uzly GDI tak, aby jich mohli optimálně využít během své nástupní fáze. Startovací sada poskytuje všem zapojeným zemím technické možnosti pro přeshraniční přístup k syntetickým genomickým a fenotypovým datům.
Tato sada obsahuje více než 2 500 syntetických genomických a fenotypových dat (včetně údajů o rakovině, vzácných onemocněních a populační genomice) a umožňuje uzlům rychle nasadit funkční pilotní systém, který je prvním krokem k funkční infrastruktuře. Startovací sada je volně dostupná všem zájemcům, například průmyslový partneři mohou startovací sadu využít k pochopení toho, co projekt GDI plánuje přinést, a podle toho navrhnout své budoucí produkty.
Jednotlivé elementy startovací sady jsou zobrazeny na obrázku níže, mnohé z nich jsou softwarové produkty s otevřeným zdrojovým kódem, které jsou provozovány jako služby v národních centrech. LifeScience AAI a Beacon Network jsou nabízeny jako služba na evropské úrovni operací pro národní uzly.
"Vývoj produktů Starter Kit vedli partneři ze čtyř různých zemí, včetně České republiky, Finska, Španělska a Švédska. Tyto produkty byly vyvinuty ve spolupráci s dalšími projekty, jako je například Federated EGA. To pomáhá zajistit technickou interoperabilitu sady Starter Kit s dalšími platformami pro sdílení genomických údajů. Tento Starter Kit poskytuje ukázku standardů navržených pro použití v rámci GDI, které propojují různé složky nebo produkty dohromady, s cílem zajistit, aby data byla co nejvíce FAIR,“ vysvětlit Dylan Spalding, vedoucí pracovního balíčku 5 GDI.
Serena Scollenová, koordinátorka projektu GDI a vedoucí týmu ELIXIR pro lidskou genomiku a translační data zdůraznila, že sada GDI Starter Kit vyvolala velké nadšení, protože položila základ pro to, jak mohou země využívat datovou infrastrukturu, aby se stala funkční a integrovanou do výstupů projektu 1+MG. „Pokrok je již patrný ve všech 20 zemích. V této fázi GDI je nejdůležitější technický vývoj. Naším cílem je zajistit, aby naše infrastruktura podpořila objevování, zpřístupňování, sdílení a analýzu lidských genomických dat a fenotypových dat v masovém měřítku.
Toto vydání je první verzí startovací sady, která bude v průběhu projektu dále vyvíjena podle iterativního přístupu.
Startovací sada je k dispozici zde: https://github.com/GenomicDataInfrastructure.