Instruktion för arkivering av data

1 Förbered dataunderlag för arkivering

1.1 Dataunderlag enbart från IFAU:s databaser

Dataunderlag som enbart baseras på uppgifter från IFAU:s databaser kan lämnas till arkivet i något av nedanstående format:

  • ursprungsformat (Stata, SAS, GAUS, R). Postbeskrivning behövs inte.
  • ASCII-format enligt instruktionen under rubrik 1.2 (beskrivningen nedan)

1.2 Dataunderlag inte enbart från IFAU:s databaser

Dataunderlag som inte enbart är hämtade från IFAU:s databaser ska sparas som ASCII med fast längd d.v.s. fixed format, fasta positioner. Fixed format ser ut som kolumner utan någon avgränsare som t.ex. kommatecken eller semikolon. Kolumnerna ska inte vara förskjutna (notera att även om en tab-separerad fil kan se ut på detta sätt så är det fortfarande en teckenavgränsad fil där teckenavgränsaren är en tab).

Via Stat Transfer

Data behandlad i Stata, SAS, GAUSS eller EXCEL kan föras över till ASCII med hjälp av Stat Transfer.

  • Välj det program som har använts i Input file.
  • Markera filen som ska överföras med hjälp av browse.
  • Välj ASCII - fixed format (S/T Schema) i Output file.
  • Välj plats (map/katalog) där ASCII filen ska sparas med hjälp av browse.

I Stat Transfer skapas även en fil med variabellista och positioner automatiskt. Om SAS-data innehåller lablar som beskriver innehållet för respektive variabel, så kommer även dessa på den genererade variabellistan.

Om du har många filer som ska överföras till ASCII gör på följande sätt:

  • Gå till programmet st.exe som finns i installationsmappen för StatTransfer, t.ex. C:\Program Files (x86)\StatTransfer8\st.exe
  • Sätt sökvägen till mappen med dina datafiler,
    t.ex. cd P:\åååå\nr\data\grunddata
  • Skriv från vilket format och till vilket format du vill överföra,
    t.ex. copy *.dta *.sts /O- 

Tillägget ”/O-” talar om att StatTransfer inte ska använda optimering av datatyper vid överföringen.

Via statistik program

Stata

Öppna datafilen och exekvera kommandot ”compress”, vilket omvandlar och komprimerar datafilen så att inga variabler upptar fler positioner än vad som är nödvändigt.

Spara filen med kommandot "outfile using filnamn,wide" utan filtillägg exempelvis, outfile using D:data\filnamn,wide.

Använd kommandot "describe" i Stata för att få en postbeskrivning av ett dataset. 

SAS

proc export
data=datasetsomskaexporteras /* här skriver du vilket dataset du vill exporter, t ex "datasetsomskaexporteras" */
outfile="D:\sokvag_fordin_fil\namnpadataset.txt" /* Här skriver du sökväg och namn på filen */
dbms =dlm replace;
run;

 GAUSS

indata = ”namn på datafil” ;

open f1 = ^inddata;

X= readr(f1,rowsf(f1));

output file = ut.txt reset;

X;

Output off;

R

Exportera från R till stata:

library(foreign)

load("\\\\enhet\\katalog\\DatafilTillArkivet.Rdata")

write.dta(TabellObjekt," I:\\Dataunderlag\\DNR\\DataTillArkivet.dta",version = 7L,convert.dates = TRUE, tz = "GMT",convert.factors = c("labels", "string", "numeric", "codes"))

Konvertera sedan från Stata till ASCII enligt instruktion ovan.

Postbeskrivning

Skapa även en postbeskrivningsfil (text med radbrytning) med namnet postbeskr.txt. Filen ska innehålla variabelnamn, variabeltyp, start och slutposition för varje variabel, exakt kolumnlängd, beskrivning av variabelinnehåll och annan eventuell information som gäller för postbeskrivning.

2 Dokumentera och lämna dataunderlag för arkivering

OBS! Gäller samtliga dataunderlag

Information

Skapa en textfil, med information om dataunderlagets ursprung (t ex enkäter, Händel, Ams…) och population, med vilket program analysen är gjord och annan förklaring som du anser behövs.

Spara filen som text med radbrytning, exempelvis i MS-Word väljer du alternativet ”Oformaterad text”, som filformat. Infoga radbrytning.

OBS! Det går bra att spara postbeskrivning och information i en och samma fil.

Program

Lämna programkoder (exempelvis, .do filer i Stata, .sas filer i SAS och .e eller .sim filer i GAUSS) för arkivering.

Filnamn/Katalognamn

Undvik långa filnamn. Den skapar problem vid bl.a. bränning av skivor.

Det kan vara en bra idé att ersätta mellanslag med understreck (_) och inte använda tecken som Åå, Ää, Öö.

Överlämnande av data

  • Skapa en mapp på servern, under I:\Forskningsprojekt och ärenden\Dataunderlag för arkivering.
  • Döp mappen till ”Dnr_nr_åååå” (exempelvis Dnr_1_2012).
  • Spara dataunderlaget i mappen och meddela arkivansvarig.

De som inte har tillgång till I, kan

  • spara data på servern efter samråd med databasadministratör om lämplig plats
  • lämna data på CD/DVD/Blu-Ray. Om ni skickar via posten, skicka som rekommenderat brev.

Kontakt

Vid ev. frågor, maila till ifau@ifau.uu.se så återkommer vi till dig.