Hoppa till huvudinnehåll

Dataanalys i Python och R

Lär dig hur du effektivt analyserar dina data med hjälp av vetenskapliga verktyg som finns i programmeringsspråken R och Python. Du kan välja mellan fyra moduler för att lära dig och implementera de verktyg som är mest användbara för dig. För detaljerade beskrivningar av modulerna, se kursplanerna och kursschemat (på engelska kurssidan).

R är ett språk och en miljö för statistiska beräkningar och grafik, som innehåller många användbara verktyg för dataanalys inom vattenforskning, särskilt när det gäller miljökvalitetsdata. I modulen ”Analysis of environmental quality data using R” lär du dig praktiska färdigheter för att analysera dina data i R, inklusive grunderna i att arbeta med data i R (öppna och skriva filer, utföra beräkningar på matriser och dataramar), hur man väljer lämpliga statistiska hypotestester baserat på fördelningen av dina data, hur man implementerar dessa tester i R och hur man gör grafik med hjälp av det kraftfulla ggplot2-paketet. Slutligen kommer du att lära dig att analysera dataset som innehåller icke-detekterade värden. Även om dessa värden vanligtvis antingen ersätts med ett fast värde eller elimineras för att underlätta statistisk analys, är dessa tillvägagångssätt suboptimala och kan snedvrida tolkningen. I den här kursen får du lära dig att analysera dessa typer av datauppsättningar med hjälp av de senaste metoderna för analys av vänstercensurerade data (där det sanna värdet bara är känt för att vara lägre än en viss nivå) som ingår i paketet NADA2.

Inom vattensektorn stöter vi ofta på kontinuerliga data, t.ex. tidsserier av nederbörd, vattennivåer eller konduktivitet. I kursen ”Analys av kontinuerliga data med Python” får du lära dig hur du effektivt analyserar sådana data med hjälp av tre allmänt använda bibliotek för vetenskaplig programmering i Python: numpy för snabba beräkningar på stora matriser, pandas för att organisera och analysera data och matplotlib för visualisering. Genom att kombinera dessa tre kan du effektivt analysera stora mängder data, t.ex. om du har långtidsmätningar eller många olika platser, och presentera data på ett tydligt och attraktivt sätt. Observera att tidigare kunskaper om grundläggande programmering i Python krävs. Om du inte har detta ännu (eller om du har programmeringserfarenhet med ett annat språk som Matlab), bör du också gå kursen ”Basic programming in Python”. I den här kursen lär du dig de grundläggande begreppen i programmeringsspråket Python som är nödvändiga för allt vidare arbete. Kursen är en självstudiekurs som examineras genom några korta övningar, men den ansvarige läraren finns naturligtvis tillgänglig för frågor.

Kursschema och -plan på den engelska kurssidan

Kontaktperson

Kurs ledd av Luleå tekniska universitet

Annelie Hedström
Professor

annelie.hedstrom@ltu.se

Kursdatum

start augusti 2023, men olika datum beroende på vilka moduler som väljs

Sidansvarig: catherine.paul@tvrl.lth.se | 2025-01-30