Back to all posts
Analityka12 kwietnia 20267 min read

Od eksportu czatu na 50 000 linii do jasnego obrazu sprawy z i2 TextChart

Praktyczny workflow do zamiany nieustrukturyzowanych rozmów — WhatsApp, Telegram, eksporty z aplikacji szyfrujących — w podmioty, powiązania i wykres gotowy do sądu.

MJ

Marek Janowski

Senior Analytics Trainer

Niewiele rzeczy bardziej przeraża analityka niż świeży folder z sześcioma miesiącami czatów grupowych i deadline na wczoraj. i2 TextChart nie poprowadzi sprawy za Ciebie, ale w jedno popołudnie przeprowadzi Cię od tekstu do struktury podmiotów.

Co dokładnie robi TextChart

TextChart to rozszerzenie do IBM i2 Analyst's Notebook, które uruchamia rozpoznawanie nazwanych podmiotów (NER) na korpusie nieustrukturyzowanego tekstu i od razu zasila wykres podmiotami (osoby, organizacje, numery telefonów, konta, lokalizacje) i ich powiązaniami. To pomost między zrzutem dowodowym a powierzchnią analityczną.

Skalowalny workflow

  1. Znormalizuj źródła. Konwertuj eksporty do plain textu lub RTF; usuń komunikaty systemowe, metadane aplikacji i szum emoji.
  2. Uruchom TextChart ze słownikiem dziedzinowym. Utrzymujemy słowniki dla kategorii spraw (handel narkotykami, przestępczość finansowa, CSE) — różnica w jakości ekstrakcji jest mierzalna.
  3. Zrób triage wykresu. Scal zduplikowane podmioty, przytnij oczywisty szum, pogrupuj według ról.
  4. Dołóż źródła ustrukturyzowane. CDR-y telekomu i wyciągi bankowe trafiają teraz do sprawy; podmioty z TextChart pełnią rolę kotwicy.
  5. Iteruj z prowadzącym sprawę. 30 minut przeglądu z liderem operacyjnym to najwyżej dźwigniowy krok, jaki analityk może wykonać na tym etapie.

Najczęstsze błędy

Dwa, które widzimy najczęściej: ślepe zaufanie do automatycznych typów podmiotów (zawsze scalaj ręcznie po roli) i import zbyt dużej porcji naraz. Jeden wykres z 18 000 węzłów jest nieczytelny; osiem mniejszych spiętych podsumowaniem działa znacznie lepiej.

Kiedy wciągnąć nasz zespół

Przy zbiorach powyżej miliona rekordów, transkrypcjach głosowych albo gdy dane trzeba spiąć z bankowymi i OSINT — nasi konsultanci analityczni siadają obok Twojej jednostki na czas trwania sprawy. Pracujemy pod NDA, embedujemy się w Wasze narzędzia i zostawiamy po sobie metodykę.

FAQ

Czy TextChart obsługuje języki inne niż angielski?

Tak — niderlandzki, niemiecki, francuski i polski działają out of the box; dodatkowe języki przez modele customowe.

Czy obsłuży transkrypcje głosowe?

Tak, po transkrypcji. Często łączymy TextChart z pipeline'em transkrypcyjnym do nagrań.

Czy wynik jest dowodowo wiarygodny?

TextChart pełni rolę analityczną, nie dowodową. Dowodem pozostaje źródło; wykres to produkt pochodny, udokumentowany w aktach.

Back to all posts

More from our analysts