Datahåndtering: Et jukseark

Bilde: ipopba, Getty Images / iStockphoto

Hver virksomhet i verden må kjempe med data. Fra en enkeltperson LLC til multinasjonale virksomheter, data er overalt, og det må styres riktig for å være et effektivt forretningsverktøy.

Data er ikke bare kundeoppføringer og annen ekstern informasjon, medarbeiderregistreringer, nettverkskart, lønnsdata og andre former for ekstern og intern informasjon faller alle under listen over data som må håndteres.

Det krever mye arbeid å gjøre data om til noe brukbart. Uten riktig styring kan du ende opp med dupliserte poster, feil informasjon, bortkastet tid og lagringsplass og en rekke andre problemer som følger med dårlig organisering. Digitale data er mye mer kompliserte enn papir, så det krever spesialiserte ferdigheter for å organisere dem.

Gå inn i datahåndteringens verden. Her er det viktigste om datahåndtering, inkludert modeller, programvare, implementering og mer. Denne artikkelen er også tilgjengelig som nedlasting, Cheat sheet: Data management (gratis PDF).

Hva er datahåndtering?

Det er like mange måter å definere datastyring som det er nettsteder som fokuserer på det. DAMA International, et konsortium av fagfolk innen databehandling, definerer datahåndtering som "utvikling og utførelse av arkitekturer, retningslinjer, praksis og prosedyrer for å håndtere en bedrifts informasjonslivssyklusbehov på en effektiv måte."

Med andre ord, datahåndtering er tverrfaglig og holder data organisert på en praktisk, brukbar måte. På det mest grunnleggende nivået jobber datastyring for å sikre at en organisasjons hele datamassen er nøyaktig og konsistent, lett tilgjengelig og ordentlig sikret.

Sammen med å være en måte å eliminere duplikater og standardisere formater, legger datahåndtering også grunnlaget for dataanalyse. Uten god datahåndtering er analyse praktisk talt umulig i verste fall og upålitelig i beste fall.

Tilleggsressurser

  • Forretningsanalyse: Det vesentlige ved datadrevet beslutningstaking (ZDNet)

  • Hvordan masterdatastyring bringer orden til big data (TechRepublic)

Hva er involvert i en komplett datahåndteringsmodell?

Hvis definisjonene og beskrivelsene av datahåndtering får hodet til å snurre litt, er det forståelig - det er mye som går inn i praksis for datahåndtering.

DAMA International deler databehandling ned i 11 kunnskapsområder:

  1. Datastyring, som er planleggingen av alle aspekter av datahåndtering. Dette inkluderer ofte å sikre tilgjengelighet, brukervennlighet, konsistens, integritet og sikkerhet for data som administreres av en organisasjon.

  2. Dataarkitektur, eller den overordnede strukturen i en organisasjons data og hvordan de passer inn i en bredere bedriftsarkitektur.

  3. Datamodellering og design, som dekker dataanalyse og design, bygging, testing og vedlikehold av analysesystemer.

  4. Datalagring og operasjoner, som er opptatt av den fysiske maskinvaren som brukes til å lagre og administrere data.

  5. Datasikkerhet, som omfatter alle elementer for å beskytte data og sikre at bare autoriserte brukere har tilgang.

  6. Dataintegrasjon og interoperabilitet, som inkluderer alt å gjøre med transformasjonen av data til en strukturert form (dvs. i en organisert database) og arbeidet som er nødvendig for å opprettholde det.

  7. Dokumenter og innhold, som inkluderer alle former for ustrukturerte data og arbeidet som er nødvendig for å gjøre det tilgjengelig for og integrert med strukturerte databaser.

  8. Referanse- og stamdata, eller prosessen med å håndtere data på en slik måte at redundans og andre feil reduseres ved å standardisere dataverdier.

  9. Datalagring og forretningsinformasjon, som involverer styring og anvendelse av data for analyse og beslutningsprosesser.

  10. Metadata, som involverer alle elementer i å lage, samle, organisere og administrere metadata (data som refererer til andre data, for eksempel overskrifter, etc.).

  11. Datakvalitet, som innebærer praksis for overvåking av data og datakilder for å sikre at kvalitet blir levert, integritet opprettholdes og data av dårlig kvalitet blir filtrert ut.

Alle disse elementene må inkluderes i en total datahåndteringsmodell; hvis til og med ett element mangler, er noe aspekt ved håndtering av data komplisert, hvis det ikke skades helt. Hvis du for eksempel kvitter deg med metadatastyring, mister du muligheten til å enkelt kategorisere data. Uten at datakvaliteten er sikret, blir hele datastrukturen mistenkt, og analyse blir ubrukelig. Å eliminere integrasjon og interoperabilitet ville gjøre det nesten umulig å kombinere forskjellige datamaterialer i en brukbar helhet.

Tilleggsressurser

  • 10 tegn på at du kan ha et datastyringsproblem (TechRepublic)

  • Hvorfor virksomheter er utsatt for dårlig personvernpraksis (TechRepublic)

  • Vil du øke kundens engasjement? Invester i dataintegrasjon, metadata, datastyring, sier Informatica (ZDNet)

Hvordan passer datahåndtering inn i en større big data-modell?

Hvis en analysemodell er produktet laget av en virksomhets data, er datahåndtering fabrikken, materialene, forsyningskjeden - alt som skal til for å lage produktet.

Du kan ikke ha en stor datamodell uten datastyring - å prøve å gjøre det ville være som å si at det rotete skrivebordet ditt er et perfekt organisert kaos der du kan finne noe; med tiden vil du miste noe viktig.

60 måter å få mest mulig ut av big data-initiativene dine (gratis PDF)

Datahåndtering er et totalt livssyklussystem som følger data fra det øyeblikket de ble opprettet til de slutter å være nyttige. Datahåndtering sporer dataene fra sted til sted, overvåker overgangen av data fra en form til en annen, og sikrer at ikke noe viktig blir igjen fra en forretningsanalysemodell.

Kort sagt, datahåndtering passer ikke bare inn i en big data-modell - det er paraplyen som all big data faller under.

Tilleggsressurser

  • Hvorfor foretak endelig betaler for stor datasikkerhet (TechRepublic)

  • 6 tips for å lage effektive big data-modeller (TechRepublic)

  • Big data policy (TechRepublic Premium)

  • Hvordan bli en dataforsker: Et jukseark (TechRepublic)

Hvilke ferdigheter trenger databehandlere?

Det er ikke noe å ta feil av den essensielle rollen som data spiller i den moderne forretningsverdenen. Big data-fagfolk må ha spesielle sett med ferdigheter som muliggjør god datahåndtering.

Et datahåndteringsteam trenger flere mennesker som er dyktige til visse elementer i hele end-to-end-ledelseskjeden. Kompetansen som en databehandler skal være opplært i inkluderer:

  • Generell informatikk: En kvalifisert databehandler skal utdannes i det grunnleggende innen informatikk - de kommer til å bruke mye tid på å bruke grunnleggende ferdigheter for å organisere data.

  • Databaseprogrammering: Noen av de viktigste databasespråkene i datahåndteringsverdenen inkluderer SQL, Python, R, Hadoop, XML og PERL. Sørg for å lære minst ett av disse språkene og bli kjent med de tilhørende databaseplattformene.

  • BI / BA : Business intelligence (BI) og business analytics (BA) er kjernen i hvorfor selskaper samler inn og organiserer data. Proffene for datahåndtering skal kunne forstå hvordan og analyse av analyser.

  • Cloud computing : Datahosting kan ta mye lagringsplass, og det er grunnen til at mange bedrifter henvender seg til skyen for å være vertskap, administrere og analysere dataene sine. Dyktige fagadministratorer bør være kjent med AWS, Microsoft Azure, Google Cloud, IBM Cloud og andre store plattformer.

  • Maskinlæring : Dataanalyse, særlig de senere stadier som prediktiv analyse og reseptbelagte analyser, gjør omfattende bruk av maskinlæringsteknologi for å redusere beregningstiden som er nødvendig for å levere resultater.

  • Datahåndteringssertifiseringer: Datahåndtering er en vitenskap i seg selv, og det er flere sertifikater som databehandlere kan følge. DAMA International tilbyr Certified Data Management Professional (CDMP) sertifisering. Oracle, IBM og andre tilbyr også sertifiseringer.

  • Myke ferdigheter: Å benytte seg av data krever mye samarbeid med ikke-IT-avdelinger for å planlegge og utføre big data-strategier. God skriving, tale og nytenkning er et essensielt sett med ferdigheter for vellykkede fagfolk innen databehandling.

Tilleggsressurser

  • Myke ferdigheter: En bedrifts brukerveiledning (gratis PDF) (TechRepublic)

  • Topp 5 tekniske ferdighetsdata forskere trenger, og hvordan de kan lære dem (TechRepublic)

  • 4 måter å forbedre big data-prosjektledelse (TechRepublic)

  • Topp 10 teknologiske ferdigheter du trenger for å få en cloud data engineering jobb (TechRepublic)

  • Slik gjør du bedriften din til big data-leder: 5 trinn (TechRepublic)

Hvilken datahåndteringsprogramvare er tilgjengelig?

Datahåndtering kan ikke gjøres på en tilfeldig måte - organisasjoner må investere i en datastyringsplattform som kan levere alle resultatene de trenger for å lykkes med å håndtere og bruke data.

Det finnes en rekke datastyringsplattformer, hver med sine egne unike funksjoner og bransjer som den passer inn i. Noen av de beste plattformene inkluderer:

  • SAS Data Management

  • Adobe Data Management Platform

  • Salesforce Audience Studio

  • IBM Data Management

  • Oracle BlueKai

Noen plattformer, som Google Cloud's big data analytics-programvare, er ikke spesielt bygget for å gjøre datastyring, men det betyr ikke at de ikke kan gjøre det. Når det gjelder Google Cloud er all nødvendig programvare til stede, men den må konfigureres for å fungere som en databehandlingsplattform.

Som med alle større programvareplattformer, kan det å velge riktig fra begynnelsen utgjøre en enorm forskjell i en organisasjons suksess. Forsikre deg om at når du bestemmer deg for en plattform, har datastyringsteamet en god forståelse av typen data du har, hvordan du vil være vert for den og hva dine sluttmål for datahåndtering er. Bevæpnet med denne informasjonen, kan et datastyringsteam gjøre det best mulige valget for organisasjonens behov.

Tilleggsressurser

  • Er det en leverandør med en kildekode for datastyring? Ennå ikke (ZDNet)

  • De 10 største datarammene som brukes i bedriften (TechRepublic)

  • Er Googles Snorkel DryBell fremtiden for bedriftsdatastyring? (ZDNet)

  • Big data's største utfordringer: 3 løsninger (TechRepublic)

  • SAP lager sin skydatatjeneste, datahåndtering med HANA (ZDNet)

  • Hvorfor dataforskere handler tradisjonell big data for cloud-native tech (TechRepublic)

Hvordan kan organisasjoner komme i gang med datahåndtering?

Det kan virke som en million og en del å planlegge et datahåndteringsinitiativ, men ikke bli fast i ugresset: Å planlegge å integrere datastyring i organisasjonen din er akkurat som et hvilket som helst annet virksomhetsomvandlingsprosjekt.

Først må du sørge for at datahåndteringsinitiativet ditt har et klart mål: Til hvilket mål prøver du å organisere dataene dine? En virksomhet som ønsker å bruke data for å gjøre interne endringer, for eksempel, vil ha forskjellige behov for datastyring enn et selskap som ønsker å bruke dataene sine for å øke salget.

Når du har et uttalt mål, er det på tide å tenke over hva som skal til for at det skal skje. Hvis dataene dine eksisterer helt som ustrukturerte filer og dokumenter, vil du ha et annet utgangspunkt enn en organisasjon med store Hadoop-databaser fylt med velorganiserte poster.

Tenk på alle mulige behov: Omfordeling av ansatte, nyansatte, opplæring, programvareplattformer, budsjett, tidsramme, hvilke typer data som allerede er tilgjengelig, hvilke typer data som trengs, og mer. Å ha alle disse elementene i bakhodet vil hjelpe deg når du faktisk begynner å planlegge for alvor.

4 måter å hjelpe brukere med å akklimatisere seg til big data gjennom trening

Dernest er det på tide å sette talentet ditt på plass. Ansett nye medarbeidere, tilordne de som skal begynne å jobbe med datahåndteringsprosjektet ditt, og bli teamet kjent med datahåndteringsmålene dine.

Når datahåndteringsteamet er på plass, er det på tide å starte planleggingsfasen. Utenfor hvordan teamet skal oppnå sine mål, er det når en datahåndteringsplattform velges, trening kan gjennomføres, og hele modellen begynner å komme sammen.

Etter dette skal datastyringsteamet ditt være på god vei til å bygge, teste og implementere en fullstendig databehandlingsmodell. Når alle disse forutsetningene er på plass og datahåndtering er en integrert del av virksomheten din, er det på tide å begynne å tenke på hva som kommer videre: Hvordan alle disse velorganiserte dataene kan bidra til å transformere organisasjonen din, internt og eksternt.

Hele prosessen med å bygge et datastyringssystem kan ta lang tid, og selv da er datahåndtering bare grunnlaget for videre bruk av big data.

Datahåndtering er ikke et mål i seg selv: Det er huset der organisasjonens data bor. Det er opp til den organisasjonen å benytte seg av huset det bygde ved å sette dataene i arbeid.

Ukens beste nyhetsbrev

Redaktørene våre fremhever TechRepublic-artikler, gallerier og videoer som du absolutt ikke kan gå glipp av for å holde deg oppdatert om de siste IT-nyhetene, innovasjonene og tipsene. fredager

Registrer deg i dag

Tilleggsressurser

  • Hvordan riktig bruk av big data kan hjelpe virksomheten din til å blomstre (TechRepublic)
  • Volum, hastighet og variasjon: Forstå de tre V-ene for store data (ZDNet)
  • Hvordan bedrifter kan bruke big data for sosialt beste (TechRepublic)
  • Funksjonssammenligning: Dataanalyseprogramvare og tjenester (TechRepublic Premium)
  • Volum, hastighet og variasjon: Forstå de tre V-ene for store data (ZDNet)
  • Beste skytjenester for små bedrifter (CNET)
  • Big data: Mer må-lese dekning (TechRepublic på Flipboard)

© Copyright 2020 | mobilegn.com