Adatbányászat- adatelemzés

Nagy értékre elkövetett bűnügyben a sértett felkérésére végeztünk nyomozást támogató adatelemzési eljárást nagytömegű adatokon

Bűnügyi igazságügyi szakértői tevékenység
A kép csak illusztráció

Előzmények

Magánszemély, sértett részéről érkezett az a megkeresés, hogy nagytömegű mobiltelefonos hívásadatok elemzésével kell különféle adatokat vizuálissá tenni illetve megfelelő kapcsolatokat kimutatni adatok között

Az elemzések célja egyebek között a hívólisták mögött lévő entitások kapcsolati ábráinak elkészítése volt, továbbá a cellainformációkból az egyes entitások térben és időben történő együttmozgásának kimutatása, továbbá mindezek korellálása egy járműkövetési rendszerből származó adatokkal.

Az adatelemzés folyamata

Aki találkozott már az egyes szolgáltatók által a hatóság részére biztosított híváslistákkal, az tapasztalhatta, hogy ahány szolgáltató, annyi féle formátum és megoldás eredménye azok a kimeneti listák, amelyeket a hatóság rendelkezésére bocsátanak. Nem tisztünk azt boncolgatni, hogy ez a hatóság gyengeségének, avagy a szolgáltatók üzletpolitikájának az eredménye, mely szerint az ügyfelek adatainak védelme még a törvény alapján kötelező adatszolgáltatás révén nyerhető társadalmi előnyöknél is fontosabb.

A jelen ügyben 3 szolgáltatótól érkezett - természetesen 3 különböző formátumú - hívásrekordokat és helymeghatározási adatokat tartalmazó lista. Első lépésben tehát ezen listák alapján egy legmegfelelőbb, közös adatbázisszerkezet kialakítása történt MS Access formátumban, majd valamennyi adat ebbe a formátumba került importálásra. Miután a listák entitásai az ügyben valamennyien érintettek voltak, szükséges volt a duplikált adatok kiszűrése (vagyis amikor az egyik entitásnál a saját szolgáltató hivásadatában egy másik entitás felé menő hívás szerepel, ugyanezen adat a másik entitás híváslistájában a beérkező hívások között is szerepelt).

Az adatbázis megfelelő kialakítása és tisztítása után (kb. 20 ezer rekord alapján) már egyszerű kereszttáblás lekérdezések megírásával hatékonyan lehetett az igényelt kapcsolati hálókat grafikusan értelmezhető jelentésekbe konvertálni, illetve a helymeghatározási adatok felhasználásával elkészíteni az egyes entitások térben és időben történő együttmozgásának és aktivitásának kimutatását.

A vizuális megértést segítendő, ezeket az adatokat egy computeranimációs videóban szemléltettük