Vil du være med til at skabe nye historiske data, der kan bidrage til en bedre forståelse af sundhed, sygdom og sociale dynamikker? Er du god til at finde enkle løsninger på komplicerede dataudfordringer? Har du lyst til at udforske værdien i brugen af deep learning og sprogmodeller? Så har du mulighed for at blive en del af vores Data Science Lab Om os Med næsten 1000 års analog og digital samfundsdokumentation er Rigsarkivet Danmarks hukommelse og et videncenter for det danske samfunds udvikling. Vi indsamler, bevarer og leverer originale dokumenter og data, der understøtter videns- og retssamfundets behov og skaber nye indsigter og forståelser af vores samfund. I Rigsarkivet bliver du del af en ambitiøs og moderne organisation. I tæt samarbejde med vores brugere, arbejder vi kontinuerligt på at være en vigtig spiller i den offentlige digitale infrastruktur, så vores store mængde data skaber størst mulig værdi for borgere, forskere, virksomheder og offentlige myndigheder.
I Rigsarkivets magasiner har vi kilometervis af arkivalier, der kan bidrage med ny viden, som ikke kan skabes i andre lande. Da arkivalierne er analoge, udvikler og benytter vi kunstig intelligens i form af deep learning modeller til at digitalisere og strukturere oplysningerne, så forskere kan anvende dem til forskning af væsentlig samfundsmæssig betydning. Derfor har vi nogle projekter, der skal etablere registre over indkomst, familierelationer, sundhed og kriminalitet, så forskerne kan bruge oplysningerne til at blive klogere på social mobilitet, arvelighed af sundhed og sygdom, forebyggelse m.v.
Som data scientist bliver du en del af et team på fem engagerede kolleger med baggrunde inden for fysik, ingeniørvidenskab, datalingvistik og historie. Vores projekter går alle ud på at skabe forskningsregistre af høj kvalitet og samfundsrelevans, og projekterne er finansieret af bla. Novo Nordisk Fonden og Rockwoolfonden. Vi arbejder sammen om det fælles mål at stille historiske oplysninger til rådighed for ny forskning til gavn for samfundet her og nu. Vi har en eksplorativ tilgang til opgaven, hvor der er tid til at teste nye idéer og kreative løsninger.
Jobbet I jobbet her arbejder du med innovative teknologier på en omfattende datasamling ved derigennem at bidrage til projekter, der har betydning for samfundet. Du får mulighed for at eksperimentere og udvikle nye løsninger til billedanalyse og tekstgenkendelse. Der vil også være mulighed for at bidrage til forskningspublikationer.
Du arbejder med oplysninger, der er nedskrevet i skemaer samt tabeller i både håndskrift og på skrivemaskine. Dine opgaver omfatter at
- Udvikle og eksekvere metoder for segmentering af billeder ud i meningsfulde bestanddele
- Udvikle og eksekvere metoder for tekstgenkendelse – både af håndskrift og maskinskrift
- Bidrage til datarens og –standardisering gennem udforskning af nye teknologiers potentiale
- Bidrage til udvikling af en best practice inden for de forskellige digitaliseringsopgaver
- Dokumentere egen kode
Om dig Vi forudsætter og har en kandidatgrad i data science, computer science, statistik, fysik eller tilsvarende relevant uddannelse, og at du kan læse tekster på dansk. Du har indgående kendskab til programmering i Python. Desuden har du erfaring med machine learning i fx PyTorch eller TensorFlow samt erfaring med computer vision.
Herudover er det en fordel, hvis du har erfaring med følgende
- Transformers og sprogmodeller så som Large Language Models
- OCR eller Handwritten Text Recognition
- Databasearbejde og SQL
- Behandling af personoplysninger
- Statistiske metoder
Som person er du først og fremmest vild med data. Du er desuden kvalitetsbevidst og detaljeorienteret i dit arbejde. Du beskriver dig selv som kreativ og kan selvstændigt være med til at definere dine opgaver nærmere. Vi fungerer godt i projektet med én, der er hjælpsom og humoristisk.
Vi tilbyder Du får mulighed for at bidrage til udvikling af unikke forskningsressourcer i samarbejde med ildsjæle, der er eksperter inden for arkiv, statistik og kunstig intelligens. Vi har et stærkt fagligt og socialt miljø og har let ved både sjov og sparring.
Vi har til huse centralt i indre København med Hovedbanegården lige om hjørnet. Hos os betyder tilstedeværelse sammen med vores kollegaer meget, og vi mener, at samarbejde og videndeling på tværs af Rigsarkivet er afgørende for et godt arbejdsmiljø. Samtidig vil vi gerne sikre fleksibilitet for vores medarbejdere, og hjemmearbejde aftales løbende mellem chef og medarbejder, når det er foreneligt med opgavevaretagelsen.
Det er vigtigt for os, at du får en god start i Rigsarkivet. De første uger er der lagt et onboardingprogram, hvor du får rig mulighed for at lære dine nye kollegaer og organisationen at kende samt komme godt i gang med dine arbejdsopgaver.
Løn og ansættelsesvilkår Du ansættes i henhold til enhver tid gældende overenskomst mellem Skatteministeriet og Akademikernes Centralorganisation. Arbejdstiden er gennemsnitlig 37 timer om ugen. Stillingen er placeret i Rigsarkivets enhed for Data Science, og arbejdsstedet er Kalvebod Brygge 34, København V.
Stillingen ønskes besat 1. marts 2025 eller snarest muligt. Stillingen er muliggjort ved en bevilling fra Historisk Kriminalregister og er således tidsbegrænset til to år fra ansættelsesstart.
Ansøgningsfristen er
søndag den 1. december 2024. Vi forventer at afholde første runde samtaler i uge 50 og hvis der er behov for det en anden samtale i uge 51.
Din ansøgning Send en motiveret ansøgning, CV og dokumentation for relevant uddannelse, certificering og erhvervserfaring. Du bliver guidet gennem Rigsarkivets rekrutteringssystem, når du trykker ’Søg stillingen’ nederst på denne side.
Hvis du vil høre mere om jobbet, er du velkommen til at kontakte chefkonsulent Jeppe Klok Due (4171 7211,
[email protected] eller enhedschef Jan Dalsten (4171 7246,
[email protected])
Du kan også læse mere om Rigsarkivets enhed for Data Science her
https://www.rigsarkivet.dk/om-os/organisation/dataformidling/ Rigsarkivet tilstræber at få så bred en sammensætning af medarbejdere som muligt. Derfor opfordrer vi alle kvalificerede ansøgere uanset personlig baggrund til at søge.