Mi nehezíti az adatelemzők munkáját?
Az adatelemzés manapság egy meglehetősen felkapott
szakterület. Valóban szükség van megfelelő szaktudással rendelkező
szakemberekre, nem véletlen, hogy sokan career-hack keretében próbálnak betörni
a munkaerőpiac ezen szegmensébe.
És ez nem is feltétlenül baj, hisz jelenleg hiány van a
Power BI-t vagy Tableau-t magabiztosan használni tudó munkaerőből, és nem egy
agysebészet megtanulni ezeket. Sőt, én is erre ösztökéllek, ha érdekel a téma
itt írtam róla bővebben:
Önképzés, avagy tanulni, tanulni, tanulni….
Most egy kicsit arról szeretnék írni, hogy milyen
nehézségekkel szoktunk szembe találkozni adatelemzőként a mindennapi munka
során.
Mert amikor a szoftverek (Power BI, SQL, Access, bármi…)
kezelését tanulod egy tanfolyam keretein belül, akkor mindig egy kvázi ideális környezetben
vagy. Értem ezalatt, hogy olyan egységes, és jól felépített adatbázisokon
gyakorolsz, amik teljeskörűek, minden funkciót ki tudsz velük próbálni, de a
gyakorlati életben ez általában nincs így.
Nézzük, hogy milyen akadályozó tényezőkkel kell szembenéznünk.
Sok különböző rendszerből kell adatokat kinyerni és
azokat elemezni.
A vállalatok (általában, vagy inkább jó esetben) törekednek
arra, hogy megfelelő hatékonysággal kezeljék adataikat, és optimalizálják
munkafolyamataikat, de gyakran ez úgy valósul meg, hogy tíznél is több (tudok
olyan céget mondani, ahol ez több, mint 30) informatikai rendszerrel dolgoznak egyidejűleg
(vállalatirányítási rendszer, tervező szoftver, szerződéskezelő,
beszerzéskezelő, készletnyilvántartó, és még sorolhatnám).
Szóval az adatelemzőnek gyakran a sok-sok vállalati szoftver
adatait kell feldolgozni, amik nincsenek feltétlenül összekötve interface-ekkel
(vagy legalábbis nem mindegyik).
És ezáltal nem is olyan egyszerű jól felépíteni azt az
adatbázist, amivel hatékonyan tudunk dolgozni.
De biztos, hogy nem lehetetlen csak akarni kell. Meg kell
találni azokat a kapcsolódási pontokat, amikkel megfelelően össze tudjuk
kapcsolni az egyes rendszerekből kinyert adatokat.
Egy jól felépített Power Query, vagy SQL/Access lekérdezés
segítségével ez viszonylag hatékonyan megoldható. Egy jó lekérdezés-rendszer
megírása mindig időigényes (ezért keresett ez a szakma), de az biztos, hogy
utána nagyon nagy hatékonysággal (és kevés idő és energiabefektetéssel) tudunk
a vezetőség számára „csilli-villi” riportokat és dashboard-okat készíteni.
Az is akadályozó tényező számunkra, ha olyan adatokat is
elemeznünk kell, amik nem részei a vállalati szoftvereknek.
Ez már egy keményebb dió. És itt most nem arra gondolok,
hogy egyes cégeknél nem minden számla kerül be az ERP rendszerbe. Sajnos ilyenre
is van számos példa (főleg a magyar KKV-k berkeiben), de ezzel most nem
foglalkoznék.
Olyan esetekre gondolok, amikor például a tervezés külön
excel-táblákban történik, amik nem egységesek (mert mindenki más formátumra
esküszik, vagy másképp szeret dolgozni), de a nap végén az adatelemzőnek ezeket
az excel-táblákat is hozzá kéne tenni (például) az ERP rendzserből kinyert
adatbázishoz.
Itt lehet makrózni, másolgatni, hogy a nap végén a sok
táblából egy egységesen használható adatbázis legyen. Ez időigényes, sok
manuális munkát igényel, és tele van hibalehetőségekkel, könnyen adatvesztés
lehet a vége, amit nem biztos, hogy időben észre fogunk venni…
És azt senki sem szereti, ha fals adatok alapján készül el a
management-meeting prezentációja.
Az biztos, hogy ez nem szerencsés, és ha van mód próbáljuk
ösztökélni munkáltatónkat arra, hogy ezek az adatok is valamely vállalati
szoftver részivé váljanak. Hosszú távon ez biztos, hogy a cég előnyére fog
válni (még ha rövid távon extra költségeket is fog generálni) – de könnyű ezt
mondani, én is tapasztalom, hogy sok helyen nem nyitottak erre. És gyakran a
munkavállalók sem, hiszen kevesen szeretik a változásokat, hisz rövid távon ez
mindenkitől extra energiabefektetést követel meg.
És azt se felejtsük el, hogy a munkafolyamatok
automatizálásának minden esetben a (bér)költségek hosszútávú csökkentése a
célja.
Nem férünk hozzá valamilyen adatokhoz, vagy csak részlegesen.
Adatelemzőként azt szeretjük, ha mindenhez (is) read+write
access-ünk van.
IT osztályunk pedig olyan módon szeretné szegregálni a
hozzáféréseket, hogy a lehető legkevesebb adatot lássuk (csak azt, amihez
ténylegesen és a munkánkhoz nélkülözhetetlenül szükségünk van).
Ennek a két halmaznak kell megtalálnunk a megfelelő
metszetét, hogy a kecske is jól lakjon és a káposzta is megmaradjon.
Nyilván érthető, hogy minden vállalatnál vannak szenzitív
adatok (bérköltségek, bizalmas projektek adatai, hosszú távú tervek pénzügyi
adatai, és még sorolhatnám…).
Ha nincs lehetőségünk valamely adathalmazhoz hozzáférni (de
azért elemeznünk kell…), akkor általában egy köztes megoldásként egy összevont
kimutatást nagy valószínűséggel tudunk kapni. És utána jöhet az excelek
fesülgetése, lásd előző pont…
Persze ha van rá módunk, akkor üssük addig az IT osztályt
amég meg nem kapjuk a kért hozzáféréseket az adatokhoz.
Real-time-ban kell adatot változtatnunk.
Ez nem egy tipikus adatelemzői probléma, de gyakran
előfordul, hogy egy megbeszélés keretein belül (forecast meeting például) valós
időben kell adatokat változtatgatnunk, úgy hogy a megbeszélés végére legyen egy
kezelhető output.
Ilyenkor nincs módunk Power BI dashboard-okat készítgetnünk.
Marad az excel-tábla.
Én nem vagyok híve annak, hogy az excel egy jó adatelemző
tool (bár sokat használom, szeretem is, de nem adatelemzésre).
Viszont ilyenkor ez a leggyorsabb, és nem utolsó sorban
mindenki számára kezelhető megoldás. Hisz ne felejtsük el, hogy hiába vagyunk
mi Power BI/SQL/Tableau… szakértők, az igazgató maximum egy excel-táblát tud
kezelni.
Korlátozott szoftver-hozzáférés
Ez nem egy áthághatatlan gordiuszi csomó, de tapasztalatból
hallottam, hogy van ilyen.
Ha egy vállalatnál van egy megszokott munkafolyamat (ami nem
feltétlenül jó, vagy hatékony, de működik), akkor nem fogadják mindig tárt
karokkal a lelkes munkavállalók újítási ötleteit.
Főleg, ha fizetni is kell érte.
Értem ezalatt, hogy hiába szeretném én Power BI-ban
prezentálni a vezetőség számára a heti reportot, ha nem akar a vállalat
beruházni a Power BI-ra (mert ugyebár corporate célra már nem ingyenes a
történet).
Van, hogy a Microsoft Access-ért is könyörögni kell az IT
osztálynek, nem, hogy egy SQL Server-ért.
Szóval nem könnyű az adatelemzők élete, de mindenre van
megoldás! 😊
Megjegyzések
Megjegyzés küldése