Artesis Plantijn Hogeschool Antwerpen
Media, Design en IT
Data engineering35102/3112/2324/1/79
Studiegids

Data engineering

35102/3112/2324/1/79
Academiejaar 2023-24
Komt voor in:
  • Bachelor in de toegepaste informatica, trajectschijf 2
    Afstudeerrichting:
    • Artificiële Intelligentie
Dit is een enkelvoudig opleidingsonderdeel.
Studieomvang: 3 studiepunten
Men kan dit opleidingsonderdeel niet volgen binnen een
  • examencontract (met het oog op het behalen van een creditbewijs).
  • examencontract (met het oog op het behalen van een diploma).
Titularis: Van Hansewijck Dries
Co-titularis(sen) zijn nog niet (allemaal) gekend.
Onderwijstalen: Nederlands
Kalender: Semester 1
Dit opleidingsonderdeel wordt gequoteerd op 20 (tot op een geheel getal).
Mogelijke grensdata voor leerkrediet: 15.10.2023 (1ste semester)
Tweede examenkans: wel mogelijk.
Delibereerbaarheid/tolereerbaarheid: Dit opleidingsonderdeel komt in aanmerking voor deliberatie/tolerantie onder de voorwaarden van de opleiding waarvoor je bent ingeschreven.
Totale studietijd: 78,00 uren

Volgtijdelijkheid

Op dit opleidingsonderdeel is er geen volgtijdelijkheid van toepassing.

Korte omschrijving

Data engineering richt zich op het ontwerpen, bouwen en onderhouden van systemen en infrastructuur die nodig zijn voor het beheer en de verwerking van grote hoeveelheden gegevens. Het omvat verschillende technieken en tools die worden gebruikt om data pipelines te bouwen, gegevens te verzamelen, op te slaan, te transformeren en te integreren met verschillende systemen en toepassingen. Het doel van data engineering is om ervoor te zorgen dat data beschikbaar, toegankelijk, veilig en betrouwbaar is voor gebruik in data-analyse en besluitvorming.

OLR-Leerdoelen (lijst)

A.5. Architecture Design
Benoemt de componenten van een data pipeline.
Ontwerpt een data pipeline voor een eenvoudige use case.
Kiest de juiste cloud services voor data engineering taken.
Verklaart het verschil tussen batch processing en streaming en weet wanneer welke toegewezen is.
Legt de verschillende stappen uit van ETL en ELT en het verschil tussen de twee.
Beschrijft de verschillende mogelijkheden om data op te slagen en welke toegewezen is in welke situatie.
Bespreekt het belang van data engineering voor AI en ML toepassingen.
Bespreekt de voordelen van een feature store.
B.1. Design and Development
Automatiseert een data pipeline met Apache Airflow.

Leerinhoud

  • Structured vs unstructured data
  • Data Warehouse en Data lake
  • Feature Store
  • Data pipelines
  • Automatisatie en orkestratie van data pipelines met Apache Airflow
  • Soorten databases (tabular, graph, vector)
  • ETL/ELT
  • Batch processing vs streaming (Apache Kafka)
  • Cloud services voor data engineering
  • Data Management (lineage, metadata, ...)

Studiematerialen (tekst): Verplicht

ELEKTRONISCHE LEEROMGEVING: (vrij ter beschikking voor elke student)
Op de elektronische leeromgeving wordt studiemateriaal en studieinformatie aangeboden.

LAPTOP:
De student dient voor dit opleidingsonderdeel zijn/haar persoonlijke laptopcomputer te gebruiken. Er worden faciliteiten geboden voor de aanschaf/installatie van de noodzakelijke software.

Onderwijsorganisatie

Werkvormen
Hoor- en/of werkcolleges12,00 uren
Practicum en/of oefeningen24,00 uren
Werktijd buiten de contacturen42,00 uren

Toetsing (lijst)

Evaluatie(s) voor de eerste examenkans
MomentVorm%Opmerking
Eerste examenperiodeKennis- en inzichtstoets in de examenreeks30,00
Eerste examenperiodeVaardigheidstoets in de examenreeks40,00
Evaluatie(s) voor de tweede examenkans
MomentVorm%Opmerking
Tweede examenperiodeKennis- en inzichtstoets in de examenreeks30,00
Tweede examenperiodeVaardigheidstoets in de examenreeks40,00
Evaluatie(s) voor beide examenkansen, niet herhaalbaar in tweede examenkans
MomentVorm%Opmerking
Eerste examenperiodeVaardigheidstoets permanent tijdens de lesweken (Permanente evaluatie)30,00Opdrachten doorheen het semester.

Toetsing (tekst)

AFWEZIG OP (DEEL)EVALUATIE
Als je afwezig bent voor een (deel)evaluatie buiten de afgebakende examenreeksen, 
kan je deze evaluatieactiviteit inhalen op voorwaarde dat dit organisatorisch mogelijk is én :

  • Je jouw afwezigheid meldt via de module ‘Mijn afwezigheden’ in iBaMaFlex voor aanvang van de (deel)evaluatie.

  • Je dient je aanvraag voor een inhaalmoment tezamen met het nodige medisch attest in via de webmodule ‘Mijn afwezigheden’ in iBaMaFlex. 
Je doet dit binnen 2 kalenderdagen na de gemiste (deel)evaluatie. 
Indien de 2de kalenderdag een zaterdag, zondag, feest-of verlofdag is, wordt de termijn verlengd tot de eerstvolgende werkdag.

  • Je maakt, binnen de 4 kalenderdagen na de gemiste (deel)evaluaite, zelf per e-mail een afspraak met de lector omtrent het tijdstip en de wijze waarop dit (deel)examen kan ingehaald worden. 
Je kan slechts één (deel)evaluatie per opleidingsonderdeel inhalen en daarvoor éénmaal een dergelijke afspraak maken. 
Ben je op die afspraak voor het inhaalmoment ook afwezig, dan kan je het (deel)examen niet meer inhalen. 
Je dient het origineel geldig medisch attest te bewaren zodat dit in geval van onduidelijkheid alsnog kan worden opgevraagd.


Voldoe je niet aan de voorgaande voorwaarden, dan heb je geen recht op een inhaalmoment en krijg je bijgevolg 0 op deze (deel)evaluatie.