Artesis Plantijn Hogeschool Antwerpen
Media, Design en IT
Data engineering35102/3385/2425/1/51
Studiegids

Data engineering

35102/3385/2425/1/51
Academiejaar 2024-25
Komt voor in:
  • Bachelor in de toegepaste informatica, trajectschijf 2
    Afstudeerrichting:
    • Artificiële Intelligentie
Dit is een enkelvoudig opleidingsonderdeel.
Studieomvang: 3 studiepunten
Men kan dit opleidingsonderdeel niet volgen binnen een
  • examencontract (met het oog op het behalen van een creditbewijs).
  • examencontract (met het oog op het behalen van een diploma).
Co-titularis(sen) zijn nog niet (allemaal) gekend.
Onderwijstalen: Nederlands
Kalender: Semester 2
Dit opleidingsonderdeel wordt gequoteerd op 20 (tot op een geheel getal).
Mogelijke grensdata voor leerkrediet: 15.03.2025 (2de semester)
Tweede examenkans: wel mogelijk.
Delibereerbaarheid/tolereerbaarheid: Dit opleidingsonderdeel komt in aanmerking voor deliberatie/tolerantie onder de voorwaarden van de opleiding waarvoor je bent ingeschreven.
Totale studietijd: 78,00 uren

Volgtijdelijkheid

Op dit opleidingsonderdeel is er geen volgtijdelijkheid van toepassing.

Korte omschrijving

Data engineering richt zich op het ontwerpen, bouwen en onderhouden van systemen en infrastructuur die nodig zijn voor het beheer en de verwerking van grote hoeveelheden gegevens. Het omvat verschillende technieken en tools die worden gebruikt om data pipelines te bouwen, gegevens te verzamelen, op te slaan, te transformeren en te integreren met verschillende systemen en toepassingen. Het doel van data engineering is om ervoor te zorgen dat data beschikbaar, toegankelijk, veilig en betrouwbaar is voor gebruik in data-analyse en besluitvorming.

OLR-Leerdoelen (lijst)

Analyseren
Bespreekt het belang van data engineering voor AI en ML toepassingen.
Ontwerpen
Benoemt de componenten van een data pipeline.
Beschrijft de verschillende mogelijkheden om data op te slagen en welke toegewezen is in welke situatie.
Bespreekt de voordelen van een feature store.
Kiest de juiste cloud services voor data engineering taken.
Legt de verschillende stappen uit van ETL en ELT en het verschil tussen de twee.
Ontwerpt een data pipeline voor een eenvoudige use case.
Verklaart het verschil tussen batch processing en streaming en weet wanneer welke toegewezen is.
Realiseren
Automatiseert een data pipeline met Apache Airflow.

Leerinhoud

  • Structured vs unstructured data
  • Data Warehouse en Data lake
  • Feature Store
  • Data pipelines
  • Automatisatie en orkestratie van data pipelines
  • Soorten databases
  • ETL/ELT
  • Batch processing vs streaming
  • Cloud services voor data engineering
  • Data Management

Studiematerialen (lijst)

Online leermateriaal op DigitapVerplicht

Onderwijsorganisatie

Werkvormen
Hoor- en/of werkcolleges12,00 uren
Practicum en/of oefeningen24,00 uren
Werktijd buiten de contacturen42,00 uren

Toetsing (lijst)

Evaluatie(s) voor de eerste examenkans
MomentVorm%Opmerking
Eerste examenperiodeKennis- en inzichtstoets in de examenreeks30,00Digitaal.
Eerste examenperiodeVaardigheidstoets in de examenreeks40,00Digitaal.
Evaluatie(s) voor de tweede examenkans
MomentVorm%Opmerking
Tweede examenperiodeKennis- en inzichtstoets in de examenreeks30,00Digitaal.
Tweede examenperiodeVaardigheidstoets in de examenreeks40,00Digitaal.
Evaluatie(s) voor beide examenkansen, niet herhaalbaar in tweede examenkans
MomentVorm%Opmerking
Eerste examenperiodeVaardigheidstoets permanent tijdens de lesweken (Permanente evaluatie)30,00

Toetsing (tekst)

De totale examentijd voor de kennis- en inzichtstoets(en) en/of de vaardigheidstoets(en) die tijdens de examenreeks en de toetsweek plaatsvinden, bestaat uit de voorziene tijd hiervoor plus ¼ extra examentijd – met een max. van 30 min. – voor alle studenten. De extra examentijd als individuele aanpassing is hierbij dus inbegrepen. Indien er op het moment van de toetsing een aanvullende toetsing plaats zou vinden, dan wordt de extra examentijd met een maximum van 30 min. toegekend.