Data lake: voordelen en valkuilen

Data lake: voordelen en valkuilen

Aan de slag met ruwe data

Gratis downloaden
28 december 2016

Dat uit data veel waarde valt te halen, is voor de meeste organisaties allang geen geheim meer. Er is een toenemende trend om én steeds meer data te verzamelen én deze zo onbewerkt mogelijk te houden; zo kunnen de Business Intelligence-experts er nog meer conclusies uit trekken. Dit wordt mogelijk gemaakt door het inzetten van een zogeheten data lake of data hub. Wat is een data lake precies? Wat zijn de voordelen? En welke valkuilen dreigen voor u als gebruiker?

Wat is een data lake?

Als we spreken over een data lake, worden alle te analyseren datasets geladen in Hadoop. Dat is een open-source systeem waarmee data kunnen worden opgeslagen, verwerkt en geanalyseerd. De getransporteerde gegevens worden zo min mogelijk bewerkt voordat ze in de Hadoop-infrastructuur worden gezet, met als grote voordeel dat er zo min mogelijk informatie verloren gaat. Ook kenmerken van data die nu nog niet relevant zijn, kunnen later nog van nut zijn voor uw bedrijf.

Samenstelling data lake

Wat voor soort data gaan nu naar een data lake? We noemen enkele voorbeelden:

  • Logs van machines en sensordata (Internet of Things)
  • Gedrag van klanten (bijvoorbeeld de klikken op een website)
  • Social media
  • Documenten (bijvoorbeeld e-mails)
  • Geolocatie-data
  • Afbeeldingen
  • Video
  • Audio
  • Transacties (ERP, CRM, SCM)

Uitdagingen data lake

Tot zover in onze beschrijving lijkt er geen vuiltje aan de lucht. Waarom gebruikt dan niet iedereen zo’n data lake? De uitdaging  is de volgende: Hadoop is niet goed berekend op data lakes, de mogelijkheden zijn helaas te beperkt. Het gevolg: organisaties weten niet precies hoe ze voordeel kunnen halen uit hun data lakes en hoe ze analytische applicaties kunnen ontwikkelen die hun eindgebruikers daadwerkelijk waarde bieden. Deze whitepaper analyseert dit probleem en helpt u met het vinden van de juiste oplossing.

Wat hebt u precies nodig?

Als u het onderste uit de kan wilt halen op datagebied, is het de vraag of u nog wel genoeg hebt aan Hadoop of dat u wellicht aanvullende tools nodig hebt. Door het lezen van dit kennisdocument kunt u bepalen of u nog up-to-date bent met uw huidige systeem of dat u toe bent aan de volgende stap op het gebied van big data analytics.

Gratis downloaden