Tilmeld dig nu


Er du allerede tilmeldt og ønsker at ændre din profil, så klik her.
 

Data Science og Big Data

Data er guld, hvis man forstår at kombinere dem og udvinde værdifuld viden fra dem. Modsat en guldåre, der kan tømmes, så vokser mængden af digitale data fra apparater og sociale medier eksplosivt, så udfordringen er at finde metoder og regnekraft til at behandle de mange data. Fagpakken Data Science og Big Data henvender sig til f.eks. Data Scientists, Predictive Analytics Developers og Hadoop-udviklere, der graver efter guldet i datamængderne.

Målgruppe:

Data Scientists, Predictive Analytics Developers, Hadoop-udviklere o.lign., der ønsker både at beherske teknologierne bag Data Science og Big Data og at kunne udnytte teknologierne til at skabe forretningsmæssig værdi.

  Undervisningsform:

Undervisningen består i hvert enkeltfag af tre seminardage (fredage) med kombinerede forelæsninger og øvelsessessioner. Mellem seminarerne læser deltagerne faglitteratur og laver øvelser/opgaver.

Desuden udarbejder de i grupper på hvert af de tre enkeltfag et miniprojekt til en realistisk problemstilling.

Du skal regne med en ugentlig studieindsats på gennemsnitligt 12-15 timer. Dette kan variere efter forudsætninger og ambitionsniveau.

Enkeltfag Periode Kr. ECTS Ansøg
Introduktion til Data Science 03.11.17 - 12.01.18 6.000 5 AAU
Datamodeller og analyseteknikker 19.01.18 - 23.03.18 6.000 5 AAU
Skalering til Big Data 13.04.18 - 15.06.18 6.000 5 AAU
Indhold:

Fagpakken giver deltagerne viden om og praktisk erfaring med data science og Big Data.

Dette inkluderer data science-begreber, basale statistiske metoder og værktøjer, konkrete Big Data-eksempler, data mining og machine learning metoder og værktøjer til Big Data samt skalering på en distribueret platform. Deltagerne får et dybt kendskab til teknologierne og bliver i stand til at designe og udvikle komplette, avancerede Big Data-løsninger.

Fagpakken er bygget op af tre enkeltfag:

  • Introduktion til Data Science dækker grundlæggende data science og statistisk dataanalyse.
  • Datamodeller og analyseteknikker dækker data mining og machine learning teknikker for Big Data.
  • Skalering til Big Data dækker skalering i forlængelse af undervisningen på de to første enkeltfag.
Udbytte:

Viden:
Gennem fagpakken skal deltagerne opnå viden om teorier, metoder, teknikker og værktøjer inden for følgende områder:

  • Introduktion til data science: begreber, konkrete Big Data-eksempler, muligheder og begrænsninger.
  • Statistisk dataanalyse:
    • Indlæsning, præprocessering og rensning af data
    • Udforskning af data
    • Brug af statistikværktøjer
  • Data mining og machine learning metoder til Big Data:
    • Prædiktive metoder såsom regression og klassifikation
    • Deskriptive metoder såsom gruppering af dataobjekter (clustering)
    • Regulariseringsmetoder til behandling af højdimensionelle data.
  • Big Data-skalering:
    • Principper, modeller og platforme
    • Opsamling, lagring og processering af Big Data
    • Data mining på Big Data


Deltagerne skal kunne forholde sig kritisk og refleksivt i forhold til disse teoretiske emner.

Færdigheder:

Efter af have gennemført fagpakken skal deltagerne kunne anvende teorier, metoder og modeller fra ovennævnte områder til at identificere, analysere, vurdere og komme med forslag til løsning af konkrete Big Data-problemstillinger. De skal kunne argumentere for relevansen af de valgte teorier, metoder og modeller samt for det udarbejdede løsningsforslag. Desuden skal de kunne reflektere over betydningen for den sammenhæng, løsningen indgår i.

Konkret forventes det, at deltagerne efter gennemførelse af fagpakken er i stand til at:

  • bruge et statistisk værktøj i undersøgelser af større datasæt,
  • forstå, udvælge, anvende og eventuelt kombinere en række data mining og machine learning metoder til vidensopdagelse i både ustrukturerede og strukturerede Big Data-eksempler,
  • designe og implementere et avanceret Big Data-system,
  • skalere det implementerede system på en distribueret platform.

Kompetencer:
Deltagerne skal efter gennemførelse af fagpakken kunne reflektere over metoder, teknikker, teknologier og resultater for et givet Big Data-system, samt hvordan disse kan anvendes i praksis. Herunder

  • træffe informerede valg omkring statistiske metoder,
  • træffe informerede valg omkring anvendelse af avancerede data mining og machine learning teknikker og parametrisering af disse for et konkret Big Data-eksempel,
  • træffe informerede valg omkring avancerede Big Data-teknologier,
  • designe og udvikle et komplet Big Data-system for en kompleks, realistisk problemstilling,
  • formidle og diskutere løsningerne med fagfæller og ikke-specialister.
Adgangskrav:

Diplomuddannelse i softwarekonstruktion, bacheloruddannelse i datalogi, ikt-ingeniøruddannelse eller tilsvarende samt efterfølgende to års relevant erhvervserfaring.

Deltagerne skal desuden have en matematisk baggrundsviden med kendskab til bl.a. vektor-, matrix- og differentialregning svarende til, hvad man opnår på A-niveau på STX.

Har du ikke en af de adgangsgivende uddannelser, kan du søge om optagelse efter individuel vurdering.

Ønskelige forudsætninger:

Deltagerne bør være gode til engelsk, da litteraturen er på engelsk, og undervisningssproget kan være engelsk.

Deltagerne skal have en matematisk baggrund svarende til A-niveau på STX, herunder specifikt vektor-, matrix- og differentialregning.

Undervisningen er tilrettelagt efter, at deltagerne har et grundlæggende kendskab til algoritmer og datastrukturer samt fortrolighed med et moderne programmeringssprog. Desuden er det en fordel, hvis deltagerne har erfaring med selvstændig installation og brug af større tekniske programpakker.

Enkeltfag Periode Kr. ECTS Ansøg
Introduktion til Data Science 03.11.17 - 12.01.18 6.000 5 AAU
Datoer for undervisning:
03.11.17
24.11.17
15.12.17
Eksamen:
11.01.18 - 12.01.18
Udbyder:
Aalborg Universitet
Undervisningssted:
Aalborg Universitet, Institut for Datalogi
Selma Lagerlöfs Vej 300
9220 Aalborg Øst
Indhold:

Enkeltfaget dækker grundlæggende data science, statistiske metoder og statistisk software.

Deltagerne introduceres til data science-begrebet og opnår viden om og praktisk erfaring med basale statistiske metoder og software til håndtering, bearbejdning og visualisering af konkrete data. De lærer at udføre basale statistiske analyser understøttet af statistisk software.

Udbytte:

Viden:
Gennem enkeltfaget skal deltagerne opnå viden om, hvordan man i praksis kan danne sig et overblik over større datasæt, hvordan man kan finde og rette fejl og inkonsistens i data, samt hvordan statistisk software kan understøtte god statistisk praksis.

Konkrete emner:

  • Introduktion til data science: begreber, konkrete eksempler, muligheder og begrænsninger.
  • Indlæsning af data; data i forskellige formater, kombination af data fra forskellige kilder.
  • Udforskning af data; visualisering, data summaries, detektion af outliers.
  • Praktisk præprocessering og rensning af data.
  • Programmering i og avanceret brug af et statistisk software (eksempelvis R).
  • Dokumentation og reproducerbarhed af analyser.
  • Relevante statistiske analyser med statistisk software, eksempelvis regressionsmodeller.

Deltagerne skal kunne forholde sig kritisk og refleksivt i forhold til disse teoretiske emner

Færdigheder:
Efter at have gennemført faget skal deltagerne kunne bruge statistisk software i indledende undersøgelser af større datasæt.
De skal kunne anvende teorier, metoder og modeller fra ovennævnte områder til at identificere, analysere, vurdere og komme med forslag til konkrete statistiske analyser. De skal kunne argumentere for relevansen af de valgte teorier, metoder og modeller samt for det udarbejdede løsningsforslag.

Kompetencer:
Deltagerne skal efter gennemførelse af faget kunne:

  • reflektere over betydningen af resultaterne af de udarbejdede analyser, samt hvordan disse kan anvendes i praksis,
  • formidle og diskutere løsningerne med fagfæller og ikke-specialister,
  • Ydermere skal deltageren kunne træffe informerede valg omkring statistiske metoder, herunder hvordan et givet datasæt skal undersøges, bearbejdes og analyseres.
Undervisningsform:

Undervisningen bestå af tre seminardage med kombinerede forelæsninger og øvelsessessioner. Mellem seminarerne læser deltagerne faglitteratur og laver øvelser/opgaver. Desuden arbejder de studerende i grupper med et miniprojekt om en realistisk problemstilling, som dokumenteres med en projektrapport.

Eksamensform:

Intern mundtlig evaluering med udgangspunkt i projektrapporten for miniprojektet. Der gives karakter efter 7-trins-skalaen. Prøven varer normalt en halv time.


Enkeltfag Periode Kr. ECTS Ansøg
Datamodeller og analyseteknikker 19.01.18 - 23.03.18 6.000 5 AAU
Datoer for undervisning:
19.01.18
09.02.18
02.03.18
Eksamen:
22.03.18 - 23.03.18
Udbyder:
Aalborg Universitet
Undervisningssted:
Aalborg Universitet, Institut for Datalogi
Selma Lagerlöfs Vej 300
9220 Aalborg Øst
Indhold:

Enkeltfaget dækker grundlæggende data mining og machine learning.

Deltagerne opnår viden om og praktisk erfaring med anvendelser af data mining og machine learning metoder og værktøjer anvendt på både ustrukturerede og strukturerede Big Data-eksempler. De får et dybt kendskab til skalerbare teknikker og værktøjer, bliver i stand til at forberede data (ved hjælp af præprocessering) og benytte dem til både at udtrække indsigt fra og lave forudsigelser (predictions) for komplekse data.

Udbytte:

Viden:
Gennem enkeltfaget skal deltagerne opnå viden om teorier, metoder, teknikker og værktøjer inden for følgende områder:

  • Praktiske metoder til præprocessering af struktureret og ustruktureret data, f.eks. tekst og netværksdata. 
  • Fundamentale data mining og machine learning metoder, herunder
    • Prædiktive metoder såsom regression og klassifikation; finde f.eks. meninger (sentiments) om produkter eller services baseret på reviewtekster, likes, klik, etc.
    • Deskriptive metoder såsom gruppering af dataobjekter (clustering), finde f.eks. kunde-/brugergrupper  i sociale netværk.
  • Regulariseringsmetoder til behandling af højdimensionelle data.

Der lægges vægt på metoder, der er skalerbare til Big Data, så der er sammenhæng med det efterfølgende enkeltfag.

Deltagerne skal kunne forholde sig kritisk og refleksivt i forhold til ovenstående emner; specielt er det vigtigt, at de opnår færdighed i at udvælge den rigtige type af machine learning metode til brug i en given kontekst.

Færdigheder:
Efter at have gennemført faget skal deltagerne kunne anvende teorier, metoder og modeller fra ovennævnte områder til at identificere, analysere, vurdere og komme med forslag til løsning af konkrete data-funderede problemstillinger. De skal kunne argumentere for relevansen af de valgte teorier, metoder og modeller samt for det udarbejdede løsningsforslag. Desuden skal de kunne reflektere over betydningen for den sammenhæng, løsningen indgår i.

Konkret forventes det, at deltagerne efter gennemførelse af fagpakken er i stand til at:

  • forstå og anvende en række data mining og machine learning metoder til vidensopdagelse i både ustrukturerede og strukturerede data-eksempler,
  • forstå og sammenligne algoritmerne bag forskellige data mining og machine learning metoder,
  • matche og eventuelt kombinere metoder til et fornuftigt brug i en given praktisk kontekst.

Kompetencer:
Efter gennemførelse af faget er det målet, at deltagerne har opnået kompetencer til at

  • træffe informerede valg omkring anvendelse af avancerede data mining og machine learning teknikker,
  • parametrisere avancerede data mining og machine learning algoritmer til et givet data materiale, inkl. ustruktureret tekst, og på forsvarlig måde at behandle højdimensionelle data,
  • designe og udvikle en komplet løsning for en kompleks, realistisk problemstilling,
  • formidle og diskutere løsningerne med fagfæller og ikke-specialister.
Undervisningsform:

Undervisningen bestå af tre seminardage med kombinerede forelæsninger og øvelsessessioner. Mellem seminarerne læser deltagerne faglitteratur og laver øvelser/opgaver. Desuden udarbejder de i grupper et miniprojekt til en realistisk problemstilling.

Eksamensform:

Ekstern mundtlig evaluering med udgangspunkt i projektrapporten for miniprojektet. Der gives karakter efter 7-trins-skalaen. Prøven varer normalt en halv time.


Enkeltfag Periode Kr. ECTS Ansøg
Skalering til Big Data 13.04.18 - 15.06.18 6.000 5 AAU
Datoer for undervisning:
13.04.18
04.05.18
25.05.18
Eksamen:
14.06.18 - 15.06.18
Udbyder:
Aalborg Universitet
Undervisningssted:
Aalborg Universitet, Institut for Datalogi
Selma Lagerlöfs Vej 300
9220 Aalborg Øst
Indhold:

Enkeltfaget dækker skalering til og håndtering af store datamængder i forlængelse af undervisningen på de foregående enkeltfag.

Deltagerne opnår viden om og praktisk erfaring med anvendelser af relevante teknologier til store mængder af forskelligt strukturerede Big Data. Dette inkluderer f.eks. skalerbar datahåndtering, dataanalyse og data mining. De får et dybt kendskab til teknologierne og bliver i stand til at designe og udvikle komplette, avancerede Big Data-løsninger.

Udbytte:

Viden:
Gennem enkeltfaget skal deltagerne opnå viden om teorier, metoder, teknikker og værktøjer inden for følgende områder:

Principper for Big Data-skalering, herunder

  • Typiske maskinelplatforme til Big Data-håndtering
  • Basale modeller for distribueret databehandling
  • CAP-sætningen
  • Fejltolerance

Teknologier og værktøjer til Big Data-skalering, herunder

  • Opsamling og lagring af Big Data
  • Processering af Big Data
  • Data mining på Big Data
  • Håndtering af data med høj velocitet

Deltagerne skal kunne forholde sig kritisk og refleksivt i forhold til disse teoretiske emner.

Færdigheder:

Efter at have gennemført faget skal deltagerne kunne anvende teorier, metoder og modeller fra ovennævnte områder til at identificere, analysere, vurdere og komme med forslag til løsning af konkrete problemstillinger i praksis. De skal kunne argumentere for relevansen af de valgte teorier, metoder og modeller samt for det udarbejdede løsningsforslag. Desuden skal de kunne reflektere over betydningen for den sammenhæng, løsningen indgår i.

Konkret forventes det, at deltagerne efter gennemførelse af fagpakken er i stand til at:

  • designe et system til at opsamle, gemme og behandle Big Data,
  • implementere et avanceret Big Data-system,
  • skalere det implementerede system på en distribueret platform,
  • skalere udvælgelse og forberedelse af Big Data på en distribueret platform,
  • skalere relevante data mining-metoder til Big Data på en distribueret platform.

Kompetencer:
Efter gennemførelse af faget er det målet, at deltagerne har opnået kompetencer til at:

  • træffe informerede valg omkring avancerede Big Data-teknologier,
  • vælge den rigtige type Big Data-metode til en given avanceret problemstilling, at konfigurere avancerede Big Data-algoritmer til et givent datasæt og at analysere avancerede Big Data-resultater,
  • designe og udvikle et komplet Big Data-system for en kompleks, realistisk problemstilling,
  • formidle og diskutere løsningerne med fagfæller og ikke-specialister.
Undervisningsform:

Undervisningen bestå af tre seminardage med kombinerede forelæsninger og øvelsessessioner. Mellem seminarerne læser deltagerne faglitteratur og laver øvelser/opgaver. Desuden udarbejder de i grupper et miniprojekt til en realistisk problemstilling.

Eksamensform:

Intern mundtlig evaluering med udgangspunkt i projektrapporten for miniprojektet. Der gives karakter efter 7-trins-skalaen. Prøven varer normalt en halv time.


Praktisk information

Periode:
03.11.17 - 15.06.18
Datoer for undervisning:
03.11.17
24.11.17
15.12.17
19.01.18
09.02.18
02.03.18
13.04.18
04.05.18
25.05.18
Pris:
18.000 kr.
Dertil kommer udgifter til litteratur samt evt. forplejning og ophold ifm. seminarer.
ECTS:
15
Sprog:
Dansk (evt. engelsk)
Udbyder:
Aalborg Universitet
Undervisningssted:
Aalborg Universitet, Institut for Datalogi
Selma Lagerlöfs Vej 300
9220 Aalborg Øst
Fagansvarlig:

Særlige bemærkninger

Download flyer for fagpakken Data Science og Big Data.

Vejledning

Faglig vejledning:
Lektor Christian Thomsen
E-mail: chr(at)cs.aau.dk
Tlf: 9940 8919

Praktisk vejledning:
Studiesekretær Lene Even
E-mail: even(at)cs.aau.dk
Tlf: 9940 8853

Fagpakkekombinationer

Fagpakker værd at overveje:

Interaktionsdesign og usability-evaluering, Aalborg Universitet.

Interaktionsdesign og usability er vigtige konkurrenceparametre, når brugerne skal vælge, hvilket softwaresystem de vil købe. Fagpakken har fokus på interaktionsdesign og usability-evaluering af digitale produkter og systemer. 

Den gennemføres af undervisere ved Institut for Datalogi på Aalborg Universitet.

Forskerne fortæller

”Data Science er et nyt, hot område, der giver kompetencer til at behandle store mængder af nye former for semi- og ustrukturerede data som for eksempel tekst fra tweets, GPS data og sensordata og muligvis kombinere dem med mere strukturerede data. Eksempelvis kan en virksomhed se, hvordan dens kunder taler om virksomhedens produkter, hvor kunderne er, og hvordan det påvirker salget”, fortæller Christian Thomsen, fagansvarlig for fagpakken Data Science og Big Data.


It-vest - samarbejdende universiteter · Åbogade 15 · 8200 Aarhus N · tlf. 7027 6850 · it-vest(at)it-vest.dk · www.it-vest.dk

Cookie- og privatlivspolitik