Mi nehezíti az adatelemzők munkáját?

 


Az adatelemzés manapság egy meglehetősen felkapott szakterület. Valóban szükség van megfelelő szaktudással rendelkező szakemberekre, nem véletlen, hogy sokan career-hack keretében próbálnak betörni a munkaerőpiac ezen szegmensébe.

És ez nem is feltétlenül baj, hisz jelenleg hiány van a Power BI-t vagy Tableau-t magabiztosan használni tudó munkaerőből, és nem egy agysebészet megtanulni ezeket. Sőt, én is erre ösztökéllek, ha érdekel a téma itt írtam róla bővebben:

Önképzés, avagy tanulni, tanulni, tanulni….

Most egy kicsit arról szeretnék írni, hogy milyen nehézségekkel szoktunk szembe találkozni adatelemzőként a mindennapi munka során.

Mert amikor a szoftverek (Power BI, SQL, Access, bármi…) kezelését tanulod egy tanfolyam keretein belül, akkor mindig egy kvázi ideális környezetben vagy. Értem ezalatt, hogy olyan egységes, és jól felépített adatbázisokon gyakorolsz, amik teljeskörűek, minden funkciót ki tudsz velük próbálni, de a gyakorlati életben ez általában nincs így.

Nézzük, hogy milyen akadályozó tényezőkkel kell szembenéznünk.


Sok különböző rendszerből kell adatokat kinyerni és azokat elemezni.


A vállalatok (általában, vagy inkább jó esetben) törekednek arra, hogy megfelelő hatékonysággal kezeljék adataikat, és optimalizálják munkafolyamataikat, de gyakran ez úgy valósul meg, hogy tíznél is több (tudok olyan céget mondani, ahol ez több, mint 30) informatikai rendszerrel dolgoznak egyidejűleg (vállalatirányítási rendszer, tervező szoftver, szerződéskezelő, beszerzéskezelő, készletnyilvántartó, és még sorolhatnám).

Szóval az adatelemzőnek gyakran a sok-sok vállalati szoftver adatait kell feldolgozni, amik nincsenek feltétlenül összekötve interface-ekkel (vagy legalábbis nem mindegyik).

És ezáltal nem is olyan egyszerű jól felépíteni azt az adatbázist, amivel hatékonyan tudunk dolgozni.

De biztos, hogy nem lehetetlen csak akarni kell. Meg kell találni azokat a kapcsolódási pontokat, amikkel megfelelően össze tudjuk kapcsolni az egyes rendszerekből kinyert adatokat.

Egy jól felépített Power Query, vagy SQL/Access lekérdezés segítségével ez viszonylag hatékonyan megoldható. Egy jó lekérdezés-rendszer megírása mindig időigényes (ezért keresett ez a szakma), de az biztos, hogy utána nagyon nagy hatékonysággal (és kevés idő és energiabefektetéssel) tudunk a vezetőség számára „csilli-villi” riportokat és dashboard-okat készíteni.

Az is akadályozó tényező számunkra, ha olyan adatokat is elemeznünk kell, amik nem részei a vállalati szoftvereknek.


Ez már egy keményebb dió. És itt most nem arra gondolok, hogy egyes cégeknél nem minden számla kerül be az ERP rendszerbe. Sajnos ilyenre is van számos példa (főleg a magyar KKV-k berkeiben), de ezzel most nem foglalkoznék.

Olyan esetekre gondolok, amikor például a tervezés külön excel-táblákban történik, amik nem egységesek (mert mindenki más formátumra esküszik, vagy másképp szeret dolgozni), de a nap végén az adatelemzőnek ezeket az excel-táblákat is hozzá kéne tenni (például) az ERP rendzserből kinyert adatbázishoz.

Itt lehet makrózni, másolgatni, hogy a nap végén a sok táblából egy egységesen használható adatbázis legyen. Ez időigényes, sok manuális munkát igényel, és tele van hibalehetőségekkel, könnyen adatvesztés lehet a vége, amit nem biztos, hogy időben észre fogunk venni…

És azt senki sem szereti, ha fals adatok alapján készül el a management-meeting prezentációja.

Az biztos, hogy ez nem szerencsés, és ha van mód próbáljuk ösztökélni munkáltatónkat arra, hogy ezek az adatok is valamely vállalati szoftver részivé váljanak. Hosszú távon ez biztos, hogy a cég előnyére fog válni (még ha rövid távon extra költségeket is fog generálni) – de könnyű ezt mondani, én is tapasztalom, hogy sok helyen nem nyitottak erre. És gyakran a munkavállalók sem, hiszen kevesen szeretik a változásokat, hisz rövid távon ez mindenkitől extra energiabefektetést követel meg.

És azt se felejtsük el, hogy a munkafolyamatok automatizálásának minden esetben a (bér)költségek hosszútávú csökkentése a célja.

Nem férünk hozzá valamilyen adatokhoz, vagy csak részlegesen.



Adatelemzőként azt szeretjük, ha mindenhez (is) read+write access-ünk van.

IT osztályunk pedig olyan módon szeretné szegregálni a hozzáféréseket, hogy a lehető legkevesebb adatot lássuk (csak azt, amihez ténylegesen és a munkánkhoz nélkülözhetetlenül szükségünk van).

Ennek a két halmaznak kell megtalálnunk a megfelelő metszetét, hogy a kecske is jól lakjon és a káposzta is megmaradjon.

Nyilván érthető, hogy minden vállalatnál vannak szenzitív adatok (bérköltségek, bizalmas projektek adatai, hosszú távú tervek pénzügyi adatai, és még sorolhatnám…).

Ha nincs lehetőségünk valamely adathalmazhoz hozzáférni (de azért elemeznünk kell…), akkor általában egy köztes megoldásként egy összevont kimutatást nagy valószínűséggel tudunk kapni. És utána jöhet az excelek fesülgetése, lásd előző pont…

Persze ha van rá módunk, akkor üssük addig az IT osztályt amég meg nem kapjuk a kért hozzáféréseket az adatokhoz.

Real-time-ban kell adatot változtatnunk.


Ez nem egy tipikus adatelemzői probléma, de gyakran előfordul, hogy egy megbeszélés keretein belül (forecast meeting például) valós időben kell adatokat változtatgatnunk, úgy hogy a megbeszélés végére legyen egy kezelhető output.

Ilyenkor nincs módunk Power BI dashboard-okat készítgetnünk. Marad az excel-tábla.

Én nem vagyok híve annak, hogy az excel egy jó adatelemző tool (bár sokat használom, szeretem is, de nem adatelemzésre).

Viszont ilyenkor ez a leggyorsabb, és nem utolsó sorban mindenki számára kezelhető megoldás. Hisz ne felejtsük el, hogy hiába vagyunk mi Power BI/SQL/Tableau… szakértők, az igazgató maximum egy excel-táblát tud kezelni.

Korlátozott szoftver-hozzáférés


Ez nem egy áthághatatlan gordiuszi csomó, de tapasztalatból hallottam, hogy van ilyen.

Ha egy vállalatnál van egy megszokott munkafolyamat (ami nem feltétlenül jó, vagy hatékony, de működik), akkor nem fogadják mindig tárt karokkal a lelkes munkavállalók újítási ötleteit.

Főleg, ha fizetni is kell érte.

Értem ezalatt, hogy hiába szeretném én Power BI-ban prezentálni a vezetőség számára a heti reportot, ha nem akar a vállalat beruházni a Power BI-ra (mert ugyebár corporate célra már nem ingyenes a történet).

Van, hogy a Microsoft Access-ért is könyörögni kell az IT osztálynek, nem, hogy egy SQL Server-ért.

 

Szóval nem könnyű az adatelemzők élete, de mindenre van megoldás! 😊


Megjegyzések

Népszerű bejegyzések ezen a blogon

Excel – tips & tricks

SQL – hints & tips