Strona główna Machine Learning Wykrywanie fraudów kartowych przy użyciu uczenia maszynowego i danych strumieniowych

Smartfon z komunikatem o wykrytym oszustwie kartowym na drewnianym blacie — Źródło: Pexels | Autor: RDNE Stock project

Machine Learning

Wykrywanie fraudów kartowych przy użyciu uczenia maszynowego i danych strumieniowych

Przez

Karolina Zieliński

17 marca, 2026

140

3/5 - (9 votes)

Nawigacja:

Kontekst biznesowy fraudów kartowych i specyfika problemu

Skala i typowe scenariusze nadużyć kartowych

Fraudy kartowe są dla banku i fintechu przede wszystkim problemem finansowym i reputacyjnym. Nawet pojedyncze spektakularne zdarzenie, nagłośnione w mediach, potrafi podkopać zaufanie do instytucji i spowodować odpływ klientów. Jednocześnie w ujęciu wolumenowym oszustwa są rzadkie, co silnie wpływa na sposób projektowania modeli uczenia maszynowego.

Najczęściej wyróżnia się dwa podstawowe typy transakcji z punktu widzenia fraudów: card-present (CP) i card-not-present (CNP). W CP karta jest fizycznie obecna w terminalu lub w bankomacie. W CNP transakcja odbywa się zdalnie – w e-commerce, aplikacji mobilnej, call center. Dla każdego z tych kanałów wzorce fraudów są inne, a modele antyfraudowe zwykle buduje się oddzielnie lub stosuje cechy specyficzne dla kanału.

Przykładowe scenariusze nadużyć:

Skimming i kopiowanie karty – pozyskanie danych paska magnetycznego/chipa i PIN-u, a następnie wypłaty w bankomatach lub transakcje w punktach POS w innych krajach.
Card-not-present fraud – użycie danych karty w sklepach internetowych, często z wykorzystaniem automatycznych skryptów testujących małe kwoty w wielu sklepach.
Phishing i vishing – wyłudzenie danych logowania, PIN-u, haseł SMS lub danych 3-D Secure, a następnie szybkie wyczyszczenie środków, zanim klient zorientuje się, co się stało.
Przejęcie konta (account takeover) – zmiana numeru telefonu, adresu e-mail czy limitów bezpieczeństwa, a potem intensywne transakcje lub przelewy.

Charakterystyczne dla fraudów kartowych jest to, że oszuści reagują na politykę bezpieczeństwa banków niemal w czasie rzeczywistym. Gdy określony schemat jest skutecznie blokowany, pojawiają się jego warianty: inne kwoty, inny kanał, inne godziny.

Ograniczenia biznesowe: szybkość decyzji i koszt fałszywych alarmów

System wykrywania fraudów kartowych działa w bardzo ostrym reżimie SLA (Service Level Agreement). Dla transakcji online (np. płatność w sklepie) na decyzję pozostaje zwykle od kilkudziesięciu do kilkuset milisekund. W tym czasie trzeba:

odebrać zdarzenie z systemu autoryzacyjnego,
policzyć lub odczytać cechy transakcji,
przepuścić je przez modele ML i reguły biznesowe,
zwrócić decyzję: zaakceptuj, odrzuć, skieruj do dodatkowej weryfikacji (np. 3-D Secure, call center).

Drugie krytyczne ograniczenie to trade-off między fałszywymi alarmami (false positives) a przeoczonymi fraudami (false negatives). Zbyt agresywny system powoduje częste blokady legalnych transakcji, co generuje:

frustrację klientów i większą liczbę reklamacji,
ryzyko porzucenia koszyka zakupowego w e-commerce,
koszt obsługi operacyjnej (call center, ręczna weryfikacja).

Z kolei zbyt łagodny system prowadzi do większych strat finansowych i gorszych wskaźników bezpieczeństwa. Projektowanie modeli antifraud wymaga więc ścisłej współpracy z biznesem w definiowaniu tolerowanego poziomu fraudów i akceptowalnego odsetka blokowanych transakcji.

Dlaczego proste reguły nie wystarczają

Tradycyjne systemy antifraudowe opierają się na statycznych regułach typu if-then. Przykładowo:

jeśli kwota > X i kraj nieznany klientowi – odrzuć,
jeśli więcej niż N transakcji w ostatnich M minutach – zablokuj kartę,
jeśli terminal na czarnej liście – odrzuć.

Takie podejście działa dobrze na prostych, powtarzalnych schematach, ale szybko się starzeje. Oszuści:

testują granice kwot i limitów,
uczą się, które kombinacje krajów i MCC przechodzą bez weryfikacji,
dostosowują się do znanych wzorców kontroli (np. unikają transakcji nocnych, jeśli te są silniej kontrolowane).

Ręczna aktualizacja reguł jest kosztowna i opóźniona. W praktyce proces wygląda tak: analitycy fraudu identyfikują nowy schemat, zbierają przykłady, projektują reguły, testują je i wdrażają. Od wykrycia do wdrożenia mija czas, w którym system działa nieskutecznie, a straty rosną. Stąd rosnąca rola uczenia maszynowego, które potrafi:

widzieć zależności wielowymiarowe (wiele cech naraz),
uczyć się na świeżych danych i adaptować do zmieniających się wzorców,
personalizować oceny ryzyka do indywidualnych zachowań klienta.

Rola uczenia maszynowego i danych strumieniowych

Uczenie maszynowe w wykrywaniu fraudów kartowych łączy dwa światy: modele offline uczone na dużych zbiorach historycznych oraz strumieniowe przetwarzanie danych w czasie zbliżonym do rzeczywistego. Modele klasyfikacyjne potrafią przeliczać ryzyko dla pojedynczej transakcji w milisekundach, ale ich jakość zależy od świeżości cech i danych uczących.

Dane strumieniowe umożliwiają:

liczenie cech behawioralnych w oknach minutowych, godzinowych, dziennych bez nadmiernych opóźnień,
budowanie mikro-modeli adaptacyjnych, które aktualizują swoje parametry na świeżych zdarzeniach,
monitorowanie driftu danych: zmian w rozkładach transakcji, merchantów, kanałów i lokalizacji.

Kluczowe jest połączenie ML i streamingu w jeden spójny system: silnik strumieniowy (np. oparty o Apache Kafka i Apache Flink) dostarcza świeże cechy, a modele generują scoring w czasie rzeczywistym i współdecydują wraz z regułami biznesowymi o losie transakcji.

Charakterystyka danych transakcyjnych i źródeł informacji

Struktura danych dostępnych przy transakcji kartowej

Dane transakcyjne można podzielić na kilka kategorii: informacje o samej transakcji, o karcie, o kliencie, o punkcie akceptacji (merchant/terminal) oraz o kontekście technicznym. W praktyce różne systemy dostarczają je w różnym stopniu, a część z nich jest dostępna tylko offline.

Typowe pola dostępne w czasie autoryzacji:

kwota transakcji i waluta,
kraj i miasto punktu akceptacji (na podstawie BIN lub danych merchantów),
MCC (Merchant Category Code) – typ działalności akceptanta,
kanał transakcji: POS, ATM, e-commerce, MOTO (mail order / telephone order),
typ karty: debetowa, kredytowa, prepaid, biznesowa,
tryb uwierzytelniania: PIN, podpis, 3-D Secure, brak dodatkowego uwierzytelnienia.

Część informacji o kliencie jest dostępna w momencie transakcji tylko częściowo lub przez warstwę cache. Np. segment klienta, kraj rezydencji, podstawowe limity i wskaźniki scoringowe mogą być przetrzymywane w pamięci lub w szybkich bazach NoSQL.

Źródła danych dla systemu antifraud

System wykrywania fraudów korzysta z wielu źródeł, które trzeba spiąć w jedną, spójną architekturę danych strumieniowych i batchowych. Najważniejsze źródła:

System autoryzacyjny kart – dostarcza zdarzenia transakcyjne online, w tym informacje techniczne i biznesowe potrzebne do podjęcia decyzji.
CRM i core banking – dane o kliencie: segment, wiek, kraj, historia produktów, typ klienta (indywidualny, biznesowy), podstawowe wskaźniki ryzyka.
Systemy KYC/AML – informacje o ryzyku prania pieniędzy, listy sankcyjne, czarne listy klientów i kontrahentów.
Bazy merchantów – historia ryzyka związana z konkretnymi akceptantami, branżami, terminalami.
Zewnętrzne źródła – systemy scoringowe, listy zastrzeżonych kart, bazy adresów IP o podwyższonym ryzyku, dane geolokalizacyjne.

Dla uczenia modeli ML ważne są także zbiory offline, zawierające historię transakcji, decyzji antifraud, chargebacków, zgłoszeń klientów oraz wyniki ręcznych analiz analityków fraudu.

Etykieta „fraud / nie-fraud” i jej opóźnienie

Największym wyzwaniem w trenowaniu modeli jest przygotowanie wiarygodnych etykiet. Transakcja nie staje się „fraudem” w systemie w momencie wykonania. Status jest nadawany później na podstawie:

zgłoszenia klienta (reklamacja, zastrzeżenie karty),
przeprowadzonych dochodzeń i analiz (działy bezpieczeństwa),
chargebacków i decyzji organizacji kartowych.

Pomiędzy datą transakcji a datą etykiety może minąć od kilku dni do kilku miesięcy. Dodatkowo część fraudów nigdy nie zostanie zidentyfikowana, a część zgłoszeń klientów okaże się nieuzasadniona. To powoduje, że dane uczące są zaszumione i niekompletne.

Przy konstrukcji zbioru treningowego stosuje się najczęściej okno obserwacji, np. transakcje z ostatnich 6–12 miesięcy, dla których status fraudu jest już w miarę stabilny. Najnowsze transakcje, które jeszcze mogą zmienić status, zwykle są wyłączane z treningu lub oznaczane oddzielnie.

Ograniczenia danych w trybie online vs offline

Nie wszystkie cechy, które są dostępne w hurtowni danych offline, da się wykorzystać w czasie rzeczywistym. Typowe ograniczenia:

opóźnienia w replikacji danych z systemów źródłowych do warstwy operacyjnej,
brak czasu na złożone zapytania do kilku systemów podczas autoryzacji,
koszty wydajnościowe – zbyt rozbudowane featury zwiększają latency i obciążenie infrastruktury.

Dlatego w projektowaniu systemu antifraud ważna jest separacja na:

cechy online – liczone na strumieniu lub trzymane w szybkich cache’ach, wykorzystywane w decyzji w czasie rzeczywistym,
cechy offline – bogatsze, często bardziej skomplikowane, używane do budowy i analizy modeli, ale niekoniecznie dostępne przy produkcyjnej decyzji.

Przykładowo: szczegółowa historia transakcji klienta z ostatniego roku z dokładnym podziałem na branże i kraje może być wykorzystywana w treningu, ale w produkcji system ogranicza się do kilku zagregowanych wskaźników z ostatnich dni lub tygodni.

Specyfika problemu ML: niebalans, opóźnione etykiety, zmienny przeciwnik

Ekstremalny niebalans klas i jego konsekwencje

Udział fraudów w transakcjach kartowych jest z reguły bardzo niski. W wielu portfelach wynosi ułamki procenta. W praktyce oznacza to, że model ma do czynienia z ekstremalnie niezbalansowanym zbiorem danych. Gdyby oceniać model klasyczną miarą accuracy, można by uzyskać wynik na poziomie niemal 100% po prostu zawsze przewidując klasę „nie-fraud”.

Niebalans powoduje kilka problemów:

modele mają tendencję do ignorowania rzadkiej klasy,
standardowe procedury walidacji (np. losowy podział danych) przestają być reprezentatywne,
wymagane jest inne podejście do metryk i doboru progu decyzji.

W fraudach kartowych kluczowe staje się nie tylko „trafienie” fraudów, ale także odpowiednie zagospodarowanie obszaru wysokiego ryzyka. Model powinien produkować ranking transakcji według prawdopodobieństwa fraudu tak, aby przy akceptowalnym odsetku fałszywych alarmów wykryć możliwie największą część nadużyć.

Opóźnione i niepełne etykiety w treningu modeli

Opóźnienie w nadawaniu etykiet skutkuje tzw. problemem label delay. Dane treningowe sprzed kilku miesięcy są bardziej kompletne, ale gorzej odzwierciedlają aktualne schematy fraudów. Dane z ostatnich tygodni są świeższe, lecz część transakcji nie ma jeszcze statusu fraud/nie-fraud.

Typowe podejścia radzenia sobie z tym zjawiskiem:

wybór horyzontu, po którym uznaje się etykiety za „stabilne” (np. 90 dni od daty transakcji),
oznaczanie transakcji bez jednoznacznego statusu jako „nieznane” i wyłączanie ich z treningu lub stosowanie metod semi-supervised,
uwzględnianie w modelowaniu, że stary fraud może lepiej odzwierciedlać nowy schemat niż losowa nie-fraudowa transakcja.

Dodatkowym źródłem niepewności są niezidentyfikowane fraudy. Część strat może być uznana za normalne zachowanie klienta lub nie zostać w ogóle zgłoszona. Model uczy się więc na danych, w których klasa „nie-fraud” jest częściowo zanieczyszczona przypadkami faktycznie niepożądanymi.

Przeciwnik adaptujący się do modelu

Strategie utrudniania adaptacji oszustom

Oszust obserwuje, jak system reaguje na jego próby. Testuje małymi kwotami, zmienia kanały i lokalizacje, korzysta z botów. Jeśli model jest statyczny i przewidywalny, schematy ataku stabilizują się bardzo szybko.

Podstawowe strategie obrony:

częstsze relearningi modeli na świeżych danych (np. co kilka dni lub w cyklu ciągłym),
ensemblowanie modeli trenowanych na różnych horyzontach czasowych,
rotacja cech i progów – zmiany konfiguracji bez uprzedzania rynku,
łączenie modelu skoringowego z regułami, które łatwo i szybko dostosować do nowego patternu.

Dodatkowo pomaga wprowadzenie pewnego „szumu” z poziomu biznesowego: niektóre wysokiego ryzyka transakcje są puszczane z dodatkową weryfikacją zamiast twardych blokad, aby utrudnić oszustowi odwrotną inżynierię zachowania systemu.

Projektowanie cech behawioralnych w oparciu o strumień

Wzorce zachowania klienta

Na poziomie pojedynczej transakcji model widzi niewiele. Siła leży w tym, jak transakcja wpisuje się w historię. Dane strumieniowe umożliwiają liczenie bieżących agregacji.

Typowe cechy behawioralne klienta:

liczba transakcji z ostatnich 5, 30, 120 minut,
suma i odchylenie standardowe kwot w krótkich i dłuższych oknach,
udział transakcji e-commerce vs POS w ostatnich dniach,
liczba nieudanych prób (odrzucone przez antifraud, odrzucone PIN, błędne CVC),
liczba nowych merchantów/państw w ostatnich 24 godzinach.

Przykładowo, klient, który zwykle płaci raz dziennie lokalnie, a nagle wykonuje kilkanaście mikropłatności w krótkim czasie w obcym kraju, ma istotnie podwyższone ryzyko.

Wzorce merchantów i terminali

Drugim filarem są cechy opisujące punkt akceptacji. Oszust potrafi zmieniać karty, ale trudniej mu zmieniać infrastrukturę merchantów na masową skalę.

Przydatne agregaty strumieniowe po merchant/terminalu/MCC:

aktualna liczba różnych kart użytych w danym terminalu w krótkim oknie,
liczba kart z wielu krajów w krótkim czasie,
udział transakcji odrzuconych z powodu antifraud vs wszystkich,
nagłe skoki wolumenu względem mediany z poprzednich dni,
złożone wskaźniki „entropii” – jak bardzo rozproszona jest baza klientów merchantu.

Jeśli na pojedynczym terminalu w krótkim czasie pojawia się wiele kart z różnych kontynentów, a wcześniej ruch był lokalny, to silny sygnał ostrzegawczy.

Cechy geolokalizacyjne i urządzeniowe

W e-commerce oraz transakcjach mobilnych liczy się połączenie informacji o lokalizacji i o urządzeniu. Same IP czy współrzędne bywają mylące, ale ich dynamika w czasie już nie.

Proste, ale skuteczne cechy:

odległość między ostatnią znaną lokalizacją klienta a bieżącą (w km),
liczba różnych krajów IP klienta w ostatnich godzinach,
częstość zmiany przeglądarki/urządzenia w krótkim oknie,
użycie znanych VPN/proxy vs normalna sieć.

Dobrym kompromisem jest liczenie surowych wskaźników w streamingu, a ewentualne mapy ryzyka (np. score IP, score urządzenia) trzymać w szybkich cache’ach aktualizowanych batchowo.

List z informacją o nowej karcie kredytowej wśród dokumentów finansowych — Źródło: Pexels | Autor: RDNE Stock project

Architektura systemu: od strumienia do decyzji

Warstwa ingestu i kolejek zdarzeń

System autoryzacyjny generuje zdarzenia w wysokiej częstotliwości. Pierwszym krokiem jest ich bezpieczne przyjęcie i ustrukturyzowanie. Najczęściej używa się rozwiązań typu Apache Kafka lub innych logów zdarzeń.

Na tym etapie wykonuje się:

normalizację formatów (np. JSON/Avro),
wzbogacanie o podstawowe dane referencyjne (np. mapa BIN → kraj),
routing do różnych tematów: autoryzacje online, reversale, chargebacki, alerty.

Ważna jest odporność na opóźnienia i powtórzenia zdarzeń. Idempotentność przetwarzania pozwala spokojnie przeliczać cechy, gdy strumień jest odtwarzany (replay) po awarii.

Warstwa przetwarzania strumieniowego

Silnik strumieniowy (Flink, Spark Structured Streaming, ksqlDB, własne rozwiązania) liczy cechy w ruchu. Ustawiane są okna czasowe, klucze partycjonujące i reguły agregacji.

Typowy pipeline strumieniowy:

przyjęcie i parsowanie zdarzenia transakcyjnego,
wzbogacenie o najnowsze dane klienta/merchantu z cache,
aktualizacja agregatów na kluczach: karta, klient, merchant, terminal, IP,
wyliczenie wektora cech online,
przekazanie gotowego wektora do silnika skoringowego.

Przy odpowiednim zaprojektowaniu kluczy i okien można utrzymać opóźnienia na poziomie pojedynczych milisekund do kilkudziesięciu milisekund na transakcję.

Warstwa scoringu i decyzji

Skoring może być realizowany na kilka sposobów: jako funkcja wewnątrz silnika strumieniowego, jako oddzielny serwis REST/gRPC lub jako plugin w samym systemie autoryzacyjnym.

Minimalny kontrakt to:

wejście: wektor cech online, identyfikator modelu i kontekst transakcji,
wyjście: score ryzyka (np. 0–1) oraz kluczowe cechy dla wyjaśnienia decyzji.

Na skoring nakłada się warstwę decyzyjną, w której mieszają się:

progi skoringowe dla różnych segmentów (np. inne dla e-commerce, inne dla POS),
reguły twarde (blacklisty, sankcje, ewidentne patterny),
zasady eskalacji: SMS/Push do klienta, call center, ręczna weryfikacja.

Na końcu powstaje akcja: akceptacja, odrzucenie, soft decline (np. wymuszenie dodatkowego uwierzytelnienia 3-D Secure, telefon do klienta).

Cykl życia modelu antifraud w praktyce

Budowa i walidacja offline

Punkt startu to zrzut danych historycznych z odpowiednio długiego okresu i z dojrzałymi etykietami. Dane są czyszczone, deduplikowane, uzupełniane o cechy offline.

Ważne elementy przygotowania:

czasowa walidacja modeli (train na starszym, test na młodszym okresie),
separacja kart/klientów między train i test, aby nie przeciekała informacja,
kontrola przecieku cech (data leakage) – żadnych informacji z przyszłości względem momentu decyzji.

Modele porównuje się w oparciu o metryki rankingowe (AUC, Gini), ale równie ważne są krzywe zysku: wykrycie X% fraudów przy Y% transakcji blokowanych lub kierowanych do dalszej weryfikacji.

Implementacja i shadow mode

Gotowy model trzeba przełożyć na wersję produkcyjną. Najprościej, gdy ten sam kod i pipeline cech działają w trybie offline i online. W przeciwnym razie rośnie ryzyko rozjazdu cech.

Przed włączeniem realnego wpływu na decyzje stosuje się tryb:

shadow – model liczy score równolegle do starego systemu, ale nie podejmuje decyzji,
champion–challenger – nowy model obsługuje część ruchu, a wyniki są porównywane.

Analizuje się różnice w strukturze odrzuceń, wpływ na wolumen fraudów i na doświadczenie klienta. Shadow mode pokazuje błędy w cechach online i pozwala skorygować implementację bez ryzyka biznesowego.

Monitorowanie jakości i driftu

Po wdrożeniu modelu głównym zadaniem staje się monitorowanie. Dotyczy to zarówno jakości predykcyjnej, jak i stabilności cech.

Typowy zestaw monitoringu:

rozkłady kluczowych cech vs okres treningowy (statystyczne testy driftu),
stabilność skali score (PSI, zmiany kwartylów),
skuteczność na dostępnych etykietach: TPR/FPR, wykrycie kwotowe fraudu,
operacyjne KPI: odsetek transakcji wymuszających dodatkowe uwierzytelnienie, średni czas decyzji, wolumen reklamacji „niesłusznej blokady”.

W systemach z label delay wczesne sygnały opiera się na proxy: np. liczbie chargebacków przypadających na określony przedział score lub zmianach w strukturze reklamacji klientów.

Dobór algorytmów i technik uczenia pod fraudy kartowe

Modele nadzorowane na mocno niezbalansowanych danych

Najczęściej stosuje się modele nadzorowane: gradient boosting, drzewa losowe, nierzadko logistyczną regresję jako model bazowy. Każdy z nich wymaga dopasowania do skrajnego niebalansu.

Najczęstsze techniki:

ważenie klas – większa kara za pomyłkę na fraudzie niż na nie-fraudzie,
undersampling klasy większościowej przy zachowaniu jej różnorodności,
czasem oversampling fraudów (ostrożnie, z uwzględnieniem czasu i schematów).

Lepsze rezultaty często daje połączenie ważenia klas z przemyślanym wyborem metryk optymalizacyjnych, np. skupieniem na części krzywej ROC przy wysokich progach.

Modele nienadzorowane i detekcja anomalii

W obszarach, gdzie etykiety są bardzo ubogie lub opóźnione (np. nowe rynki, nowe kanały), przydatne są techniki nienadzorowane.

Przykładowe podejścia:

modele gęstości (np. isolation forest, autoenkodery) wykrywające obserwacje nietypowe względem „normalnego” ruchu,
klasteryzacja merchantów/klientów i detekcja nagłego przejścia do klas wysokiego ryzyka,
proste reguły statystyczne: odchylenie o wiele sigma od typowego zachowania w agregatach czasowych.

Modele anomalii często nie nadają się bezpośrednio do twardych blokad, ale są źródłem alertów dla analityków oraz materiałem do konstruowania nowych cech i reguł.

Uczenie online i modele adaptacyjne

Przy dynamicznym przeciwniku duży sens mają modele, które uczą się w sposób ciągły. Część bibliotek (np. River, Vowpal Wabbit) obsługuje aktualizację parametrów na strumieniu.

Możliwe strategie:

główny model trenowany batchowo + lekki model online korygujący score na podstawie najnowszych danych,
rolling training: codzienne/tygodniowe dobudowywanie modelu na oknie ruchomym,
modele „per segment” aktualizowane niezależnie (np. osobno dla e-commerce, dla POS w turystyce, dla portfeli wirtualnych).

W systemie produkcyjnym aktualizacje muszą być kontrolowane. Każdy nowy model lub zestaw parametrów przechodzi krótką fazę kwarantanny/walidacji na części ruchu, zanim stanie się „championem”.

Integracja z procesami operacyjnymi i pracą analityków

Alerty, kolejki i priorytetyzacja

Model antyfraudowy nie tylko blokuje transakcje. Równie istotne są alerty przekazywane do zespołów operacyjnych. Ich liczba musi być zrównoważona z możliwościami obsługi.

Standardem jest budowa kilku kolejek:

alerty krytyczne – wysokie score, duże kwoty, wrażliwe segmenty klientów,
alerty średniego priorytetu – do weryfikacji w rozsądnym czasie,
alerty informacyjne – użyteczne analitycznie, rzadko podejmowane ręcznie.

Prawidłowe ustawienie progów dla tych kolejek przekłada się bezpośrednio na odzyskany fraud oraz obciążenie zespołów.

Feedback loop od analityków do modelu

Praca analityków fraudu generuje bardzo cenny sygnał zwrotny. Każde przeanalizowane zdarzenie może wzbogacić dane treningowe lub słownik reguł.

Warto systemowo zbierać:

adnotacje do alertów (dlaczego fraud / dlaczego false positive),
identyfikatory schematów ataków, które pojawiają się w wielu sprawach,
informacje o lukach: transakcje ewidentnie fraudowe, które nie trafiły do alertu.

Takie dane, po odpowiednim oczyszczeniu, stają się dodatkowymi cechami (np. tagi merchantów, urządzeń, IP) oraz materiałem do walidacji skuteczności nowych modeli.

Wyjaśnialność decyzji dla biznesu i regulacji

Systemy antifraud muszą być zrozumiałe dla komitetów ryzyka, audytu i regulatorów. Nie wystarczy dobry AUC – potrzebne są argumenty, dlaczego konkretna transakcja została zablokowana.

Praktyczne podejścia do wyjaśnialności:

Praktyczne techniki interpretowalności modeli

Wyjaśnialność zaczyna się już na etapie projektowania cech i wyboru algorytmu. Im prostsze, bardziej intuicyjne cechy, tym łatwiej później zbudować narrację biznesową.

W praktyce stosuje się kilka warstw interpretacji:

globalna ważność cech – ranking feature importance (np. z modelu drzewiastego) tłumaczący, co ogólnie napędza score,
lokalne wyjaśnienia – SHAP, LIME lub własne, uproszczone scorecardy pokazujące, które cechy „podniosły” score konkretnej transakcji,
mapowanie na reguły – zamiana wybranych fragmentów przestrzeni cech na czytelne reguły tekstowe dla analityków i biznesu.

Dla operacji najważniejsze jest lokalne wyjaśnienie: analityk widzi np. że transakcja została odrzucona ze względu na nietypową geolokalizację, wysoki wolumen prób w krótkim czasie i historię fraudów na danym urządzeniu.

Do komunikacji z klientem i reklamacji przydaje się uproszczona wersja – powody pogrupowane w kilka kategorii: „nietypowe miejsce”, „nietypowa kwota”, „podejrzenie przejęcia urządzenia”.

Wymogi regulacyjne i audyt modeli

Instytucje finansowe podlegają regulacjom dotyczącym zarządzania modelami (np. wytyczne EBA, lokalne rekomendacje nadzorcze). Oczekiwane są ścieżki audytu i kontrola zmian.

Standardowy zestaw artefaktów obejmuje:

dokumentację danych wejściowych, featuringu i zakresu działania modelu,
opis procesu trenowania, walidacji i kryteriów akceptacji,
historię wersji modelu, wraz z metrykami i datami wdrożeń,
raporty stabilności i skuteczności w czasie.

Dla bardziej złożonych modeli (np. głębokie sieci) dochodzi temat „model risk”: scenariusze, w których model może zawieść, oraz plany awaryjne (fallback do prostszych reguł, ręczne podniesienie progów).

Audyt wewnętrzny i zewnętrzny będzie pytał nie tylko o AUC, ale też o wpływ na klientów: czy istnieje ryzyko dyskryminacji określonych grup, jak często błędne blokady dotykają klientów z danego kraju lub segmentu.

Zbliżenie na umowę karty kredytowej platinum leżącą na drewnianym biurku — Źródło: Pexels | Autor: RDNE Stock project

Bezpieczeństwo, prywatność i zgodność z RODO

Minimalizacja danych i pseudonimizacja

System antifraud przetwarza wrażliwe dane: identyfikatory kart, klientów, geolokalizację, dane o urządzeniach. Kluczem jest ograniczenie dostępu i zasięgu tych danych.

W praktyce stosuje się:

pseudonimizację numerów kart i klientów w hurtowniach i środowiskach analitycznych,
oddzielne przechowywanie słowników mapujących pseudonimy na realne identyfikatory, z innymi uprawnieniami,
maskowanie danych w interfejsach dla analityków (np. tylko ostatnie cyfry karty, zanonimizowana lokalizacja).

Modele nie potrzebują pełnych danych osobowych. W wielu przypadkach wystarczy stabilny identyfikator techniczny i informacja o segmencie ryzyka zamiast surowych atrybutów klienta.

Ograniczanie celu przetwarzania i retencji

Dane używane do wykrywania fraudów powinny mieć jasno określony cel i czas przechowywania. Nie wszystkie informacje potrzebne są bezterminowo.

Typowy podział to:

krótkookresowe logi transakcyjne do zasilania modeli online,
średniookresowe zbiory treningowe do budowy i walidacji modeli,
długookresowe, silnie zanonimizowane agregaty do analiz trendów.

Wrażliwe identyfikatory można usuwać lub silnie anonimizować po określonym czasie, zachowując jedynie informacje statystyczne przydatne do kalibracji modeli.

Bezpieczne środowiska eksperymentów

Eksperymentowanie na danych produkcyjnych wymaga odseparowanych, dobrze kontrolowanych środowisk. Kopie danych powinny być minimalne i szyfrowane.

Dobre praktyki to m.in.:

wykorzystanie wyłącznie zanonimizowanych danych w środowisku data science,
dostęp na zasadzie „need-to-know” z czasowo ograniczonymi uprawnieniami,
logowanie zapytań i pobrań większych zestawów danych.

W przypadku współpracy z zewnętrznymi dostawcami modeli granicą jest wynoszenie danych poza organizację. Często lepszym rozwiązaniem jest wdrożenie modelu dostawcy w infrastrukturze banku z kontrolą danych po stronie instytucji.

Architektura techniczna w środowiskach o wysokiej dostępności

Redundancja i odporność na awarie

System scoringu antifraud staje się elementem krytycznym procesu autoryzacji kart. Jego awaria nie może zatrzymać całej organizacji.

Podstawowe zasady projektowania:

replikacja klastrów stream processing i baz stanowych w co najmniej dwóch strefach dostępności,
statelessowe serwisy scoringowe za load balancerem, łatwe do szybkiego przeskalowania,
asynchroniczne kolejki na styku z systemem autoryzacyjnym, aby krótkie skoki opóźnień nie blokowały ruchu.

Niezbędny jest też mechanizm „graceful degradation”: jeśli model nie odpowiada w określonym czasie, używany jest prostszy fallback (np. zestaw sprawdzonych reguł) zamiast całkowitego odcięcia autoryzacji.

Zarządzanie wersjami modeli i cech

Każdy model i zestaw cech musi być wersjonowany. Dla tej samej transakcji z przeszłości powinno dać się odtworzyć użyty score.

Praktyczny schemat obejmuje:

repozytorium modeli (model registry) z metadanymi: nazwa, wersja, data wdrożenia, parametry treningu,
wersjonowanie schematów wektorów cech, wraz z informacją o kompatybilności z modelami,
logowanie identyfikatora modelu i wersji cech przy każdej decyzji autoryzacyjnej.

Przy migracji na nowe cechy przejściowo działają dwa równoległe pipeline’y: stary (stabilny) oraz nowy (w shadow). Dopiero po zebraniu danych o skuteczności nowy pipeline staje się referencyjny.

Testy end-to-end i chaos engineering

Wysoka dostępność to nie tylko redundancja, lecz także regularne testy zachowania systemu pod obciążeniem i w warunkach awaryjnych.

Zakres testów obejmuje m.in.:

symulacje skoków ruchu (np. okresy wzmożonych promocji e-commerce),
odłączanie części infrastruktury (np. jednego DC) i obserwację czasu przełączenia,
wstrzykiwanie opóźnień w serwis scoringowy i weryfikację zadziałania fallbacków.

Do tego dochodzą testy regresyjne na historycznym strumieniu transakcji: nowe wersje modeli powinny dawać przewidywalne, zrozumiałe różnice w decyzjach, bez niespodziewanych „dziur” w określonych segmentach klientów.

Zaawansowane schematy detekcji oparte na kontekście

Modelowanie sekwencji transakcji

Fraud kartowy często realizowany jest jako ciąg zdarzeń, a nie pojedynczy strzał. Skuteczne systemy wykorzystują sekwencje.

Techniki stosowane w praktyce:

proste cechy sekwencyjne: liczba prób odrzuconych, zmiany kwot, zmiany merchantów w ostatnich minutach/godzinach,
modele sekwencyjne (np. GRU/LSTM, nowsze architektury oparte na attention) budujące reprezentację historii karty lub urządzenia,
wykrywanie nietypowych przejść między stanami (np. „normalne użycie lokalne → nagły skok do innego kontynentu → nietypowe MCC”).

W systemie strumieniowym takie modele wymagają efektywnego przechowywania kondensatu historii (embeddingów) zamiast pełnych sekwencji, aby zachować niskie opóźnienia.

Grafowe modele powiązań

Frauderzy rzadko działają w izolacji. Karty, klienci, urządzenia i merchanty tworzą sieć powiązań, którą można wykorzystać modelowo.

Typowe elementy grafu:

węzły: karty, klienci, urządzenia, adresy e-mail, numery telefonów, IP, merchanty,
krawędzie: transakcje, logowania, rejestracje, reklamacje, wspólne dane kontaktowe.

Analiza grafowa pozwala wykrywać m.in.:

klastry wysokiego ryzyka (np. wiele kart powiązanych z tym samym urządzeniem o historii fraudowej),
rozlewanie się fraudu z jednego węzła na kolejne (propagacja ryzyka),
nietypowe „mosty” między wcześniej niepowiązanymi częściami grafu.

W wersji online można wykorzystywać prostsze cechy grafowe, np. stopień węzła, udział połączeń do węzłów oznaczonych jako fraud, lokalne centralności. Bardziej zaawansowane podejścia stosują grafowe sieci neuronowe, ale wymagają one ostrożnego zaprojektowania pod kątem opóźnień.

Łączenie wielu źródeł sygnału

Model antifraud nie działa w próżni. Obok niego funkcjonują systemy antyphishingowe, monitorujące logowania, systemy scoringu kredytowego, narzędzia do wykrywania przejęcia konta (ATO).

Dobre efekty daje budowa wspólnego „profilu ryzyka” klienta i urządzenia, który uwzględnia:

niedawne anomalia logowania (nowe urządzenie, nowe miasto),
zgłoszone incydenty bezpieczeństwa (podejrzenie phishingu, instalacji złośliwego oprogramowania),
zmiany w zachowaniu na innych produktach (np. nagłe przewalutowania, nietypowe przelewy).

Wektor cech antifraud może wtedy korzystać z gotowego „risk score” z innych systemów. Konieczne jest jednak ograniczenie sprzężeń zwrotnych: score jednego modelu nie powinien dominować drugiego bez dodatkowej walidacji.

Skalowanie zespołu i procesów wokół systemu antifraud

Podział ról w zespole

Efektywny system antifraud łączy kompetencje biznesu, data science, inżynierii danych i operacji. Sam zespół data science nie wystarczy.

Sprawdza się m.in. taki podział:

data scientist – projektuje cechy, modele, eksperymenty,
ML engineer / data engineer – odpowiada za pipeline’y, wdrożenia i monitorowanie,
fraud analyst – zna schematy ataków, tworzy reguły, weryfikuje alerty,
product owner / risk manager – ustala priorytety biznesowe, progi ryzyka, kierunek rozwoju systemu.

Krytyczny jest szybki kanał wymiany informacji: nowe schematy wykryte przez analityków muszą szybko trafić do backlogu modelowego, a zespół modelowy powinien tłumaczyć swoje zmiany w języku zrozumiałym dla ryzyka i operacji.

Proces zarządzania zmianą modeli

Każda zmiana w modelu antifraud może wpływać na klientów i wyniki finansowe. Dlatego potrzebny jest sformalizowany, ale zwinny proces.

Typowy workflow:

zidentyfikowanie potrzeby (spadek skuteczności, nowe schematy, nowe produkty),
budowa i walidacja nowego modelu lub zestawu reguł na danych offline,
przegląd biznesowy i ryzyka: wpływ na false positive, segmenty klientów, compliance,
shadow mode / champion–challenger z jasno zdefiniowanymi kryteriami sukcesu,
formalna akceptacja i wdrożenie na pełen ruch,
post-implementation review po określonym czasie.

Automatyzacja części kroków (np. generowanie standardowych raportów walidacyjnych) skraca czas reakcji, bez obniżania standardów kontroli.

Szkolenie operacji i komunikacja z klientami

Nawet najlepszy model nie zastąpi dobrze przygotowanego frontu: call center, oddziałów, kanałów cyfrowych. To tam klienci zderzają się z efektami decyzji antifraud.

Elementy, które mocno pomagają:

proste skrypty tłumaczące typowe sytuacje (blokada za granicą, nietypowy zakup online),
jasne procesy odblokowania karty po weryfikacji klienta,
komunikaty w aplikacji i SMS-ach, które nie straszą, ale informują, co dokładnie się stało i jakie są kolejne kroki.

Dobry system antifraud minimalizuje tarcie: klient widzi, że ktoś czuwa nad bezpieczeństwem, ale zawsze ma prostą ścieżkę wyjaśnienia sprawy i kontynuacji płatności, gdy transakcja była legalna.

Bibliografia

Payment Card Industry Data Security Standard (PCI DSS) v4.0. PCI Security Standards Council (2022) – Wymogi bezpieczeństwa kart płatniczych, kontekst fraudów kartowych
Card-not-present fraud: A primer on trends and mitigation. Federal Reserve Bank of Kansas City (2016) – Charakterystyka fraudów CNP, trendy i sposoby ograniczania ryzyka
Fraud Detection: A Survey. IEEE Transactions on Knowledge and Data Engineering (2010) – Przegląd metod wykrywania nadużyć, w tym kartowych, z użyciem ML
Real-time Big Data Analytics: Emerging Architecture. O’Reilly Media (2013) – Architektury analityki strumieniowej, zastosowania w systemach czasu rzeczywistego
Credit Card Fraud Detection: A Realistic Modeling and a Novel Learning Strategy. Springer (2019) – Metody ML dla fraudów kartowych, problem niezbalansowanych danych
The European Central Bank report on card fraud. European Central Bank (2020) – Statystyki skali fraudów kartowych w Europie, typowe scenariusze
Machine Learning for Credit Card Fraud Detection – Practical Handbook. Worldline (2018) – Praktyczne podejście do modeli antifraud, cechy, metryki, wdrożenia
Data Mining and Machine Learning in Credit Card Fraud Detection. Elsevier (2019) – Przegląd technik data mining i ML w detekcji fraudów kartowych
Apache Kafka: A Distributed Streaming Platform. Apache Software Foundation – Opis platformy Kafka, zastosowania do przetwarzania danych strumieniowych
Stateful Stream Processing with Apache Flink. Ververica (2019) – Koncepcje przetwarzania strumieniowego z oknami czasowymi i stanem