Test engineering & AI in QA Inżynieria testów & AI w QA

Building reliable test pipelines for fifteen years. Lately with AI in the loop.

Buduję niezawodne pipeline'y testowe od piętnastu lat. Ostatnio z AI w pętli.

I help engineering teams cut test cycles from days to hours and bring AI into QA without breaking what already works.

Pomagam zespołom skrócić cykle testowe z dni do godzin i wdrożyć AI w QA bez psucia tego, co już działa.

$ whoami 15y QA · ex-Adobe | PayU | IOG (Cardano)
Radosław Sporny
IOG / Cardano 10 min e2e
PayU 50% faster
Adobe Workfront 5 yrs shipped
01 — Patterns I keep seeingWzorce, które się powtarzają

Three problems show up in almost every QA setup.

Trzy problemy powtarzają się w niemal każdym setupie QA.

— 01

Your test suite is flaky.

Twoje testy są niestabilne.

Engineers ignore red builds because half of them are false positives. Coverage looks fine on paper. Confidence is zero.

Zespół ignoruje czerwone buildy, bo połowa to false positive. Pokrycie wygląda dobrze na papierze. Zaufania zero.

— 02

You tried AI in QA. It didn't stick.

Próbowaliście AI w QA. Nie wyszło.

ChatGPT generated test cases that looked smart and broke on day one. Now the team thinks AI in QA isn't ready. It is — when it's set up properly.

ChatGPT generował test case'y, które wyglądały mądrze i sypały się pierwszego dnia. Teraz zespół uważa, że AI w QA jeszcze nie działa. Działa — jeśli jest dobrze wdrożone.

— 03

Releases take too long.

Release'y trwają za długo.

Regression runs for days. Manual sign-off is the bottleneck. You know automation should solve this. It hasn't.

Regresja trwa dniami. Manualny sign-off to wąskie gardło. Wiesz, że automatyzacja powinna to rozwiązać. Nie rozwiązała.

A demo Demo

What an AI-augmented test pipeline can look like in practice.

Jak może wyglądać w praktyce pipeline testowy wspomagany przez AI.

~/acme-app — qa-pipeline
02 — How I think about itJak o tym myślę

Three principles I keep coming back to after fifteen years.

Trzy zasady, do których wracam po piętnastu latach.

01

Find the 20% that does 80% of the work.

Znajdź te 20%, które robi 80% roboty.

Risk-based testing · Prioritization
Testowanie oparte na ryzyku · Priorytetyzacja

Most test suites are bloated with low-value coverage and starved of high-value coverage at the same time. Before adding anything new — including AI — figure out which tests are actually catching bugs and which are just noise. Ruthless prioritization beats clever tooling, every time.

Większość pakietów testów jest jednocześnie przeładowana niskowartościowym pokryciem i zagłodzona wysokowartościowym. Zanim dodasz cokolwiek nowego — w tym AI — sprawdź, które testy faktycznie łapią bugi, a które są tylko szumem. Bezwzględna priorytetyzacja zawsze wygrywa z mądrymi narzędziami.

Principle Zasada
02

AI is augmentation, not replacement.

AI to wsparcie, nie zastępstwo.

AI in QA · Pragmatic adoption
AI w QA · Pragmatyczne wdrożenie

AI in QA works when it removes friction from things humans already do well: generating boilerplate, healing brittle selectors, summarizing failures, suggesting edge cases. It fails when teams expect it to replace judgment about what to test. The best AI integrations are quiet — engineers barely notice them, but flakiness drops.

AI w QA działa, kiedy zdejmuje tarcie z rzeczy, które ludzie i tak robią dobrze: generowanie boilerplate'u, naprawa kruchych selektorów, podsumowywanie błędów, sugerowanie edge case'ów. Zawodzi, kiedy zespół oczekuje, że zastąpi osąd, co w ogóle warto testować. Najlepsze integracje AI są ciche — inżynierowie ich prawie nie zauważają, ale flakiness spada.

Principle Zasada
03

Test infrastructure is product code.

Infrastruktura testowa to kod produkcyjny.

DevX · Maintainability · Ownership
DevX · Utrzymywalność · Własność

A test framework that engineers can't run locally, can't extend without help, and can't trust — that framework is a liability, no matter how comprehensive its coverage looks on a slide. The goal isn't testing artifacts; it's a system the team can own, change, and improve without me in the room.

Framework testów, którego inżynierowie nie potrafią uruchomić lokalnie, nie potrafią rozszerzyć bez pomocy i któremu nie ufają — taki framework jest balastem, niezależnie od tego, jak imponująco wygląda jego pokrycie na slajdzie. Celem nie są artefakty testowe; celem jest system, który zespół potrafi mieć na własność, zmieniać i ulepszać beze mnie w pokoju.

Principle Zasada
03 — Selected workWybrane realizacje

Some of what I've shipped.

Część tego, co dostarczyłem.

IOG
Cardano Partner Chains · 2022–2025

Built a CI workflow that runs the full e2e test suite on a local cluster in under 10 minutes. Served as Release Manager for multiple open-source releases. Designed the testing strategy from the ground up.

Zbudowałem CI workflow, który wykonuje pełen pakiet testów e2e na lokalnym klastrze w mniej niż 10 minut. Pełniłem rolę Release Managera przy wielu open-source'owych wydaniach. Zaprojektowałem strategię testowania od podstaw.

↳ Public proof ↳ Publiczny dowód View the 10-minute e2e workflow run on GitHub → Zobacz 10-minutowy workflow run e2e na GitHubie → github.com/input-output-hk/partner-chains
Stack: Python · pytest · Docker · GitHub Actions
Adobe Workfront
Enterprise SaaS · 2015–2021

Major contributor to the test automation framework that supported a large enterprise SaaS through acquisition by Workfront, then Adobe. Risk-based testing, integration tests in Cypress, performance work with k6.

Kluczowy współtwórca frameworka automatyzacji testów, który wspierał enterprise SaaS przez przejęcia przez Workfront, a następnie Adobe. Testowanie oparte na ryzyku, testy integracyjne w Cypress, performance testy w k6.

Stack: Python · Ruby · Cypress · k6
PayU
Payment gateway · 2012–2015

Initiated test automation for the payment gateway, increased release confidence, cut execution time by 50% with Selenium Grid. Defined testing processes and metrics adopted across the organization.

Zainicjowałem automatyzację testów dla payment gateway, zwiększyłem pewność release'ów, skróciłem czas wykonania o 50% dzięki Selenium Grid. Zdefiniowałem procesy testowe i metryki, które przyjęły się w całej organizacji.

Stack: Selenium · Java · Jenkins
04 — Currently exploringCo teraz badam

A few questions I'm sitting with this year.

Kilka pytań, nad którymi się zastanawiam w tym roku.

QA is going through its biggest shift since the move from manual to automated testing. Most teams haven't fully figured out where AI helps and where it just adds noise. Neither have I — but here's where I'm focusing my attention.

QA przechodzi największą zmianę od czasu przejścia z testów manualnych na automatyczne. Większość zespołów nie do końca jeszcze zorientowała się, gdzie AI pomaga, a gdzie tylko dodaje szumu. Ja też nie — ale właśnie na tym skupiam teraz uwagę.

  • 01 / Question
    01 / Pytanie
    When does AI-generated test code actually save time? Kiedy kod testów wygenerowany przez AI faktycznie oszczędza czas? Generation is fast. Reviewing, debugging, and maintaining generated tests often isn't. I'm trying to find the line where AI gives a real net positive — and where it just shifts work from writing to verifying. Generowanie jest szybkie. Przeglądanie, debugowanie i utrzymywanie wygenerowanych testów — często już nie. Próbuję znaleźć granicę, za którą AI realnie daje wartość netto — i tę, za którą tylko przesuwa pracę z pisania na weryfikowanie.
  • 02 / Question
    02 / Pytanie
    Self-healing tests: signal or noise? Self-healing testów: sygnał czy szum? When a test heals itself by updating a stale selector, that's useful. When it heals around a real bug because the heuristic was too eager, that's dangerous. Calibrating that boundary is harder than the demos suggest. Kiedy test sam się naprawia przez aktualizację nieaktualnego selektora — to użyteczne. Kiedy „naprawia się" wokół prawdziwego buga, bo heurystyka była zbyt agresywna — to niebezpieczne. Skalibrowanie tej granicy jest trudniejsze, niż sugerują demo.
  • 03 / Question
    03 / Pytanie
    What does a senior QA engineer's job look like in 2027? Jak wygląda praca senior QA engineera w 2027? If AI handles boilerplate, generation, and a lot of triage — the human role shifts toward judgment, architecture, and risk assessment. The skills that matter are changing faster than most QA career tracks acknowledge. Jeśli AI weźmie na siebie boilerplate, generowanie i znaczną część triażu — rola człowieka przesuwa się w stronę osądu, architektury i oceny ryzyka. Umiejętności, które się liczą, zmieniają się szybciej, niż przyznają to standardowe ścieżki kariery w QA.
05 — AboutO mnie

About Radosław.

O Radosławie.

Radosław Sporny
Racibórz, Poland · 2026 Racibórz, Polska · 2026

Fifteen years ago I started in a bank's QA department, executing manual test cases and emailing daily reports to managers. I learned that most production bugs aren't bugs — they're decisions someone made too early, with too little information.

Piętnaście lat temu zaczynałem w dziale QA w banku, wykonując manualne test case'y i wysyłając codzienne raporty do menedżerów. Zrozumiałem wtedy, że większość błędów produkcyjnych to nie błędy — to decyzje podjęte za wcześnie, na podstawie zbyt małej liczby informacji.

From there I went into automation at PayU, spent five years inside what became Adobe Workfront through two acquisitions, and then I led test automation for Cardano Partner Chains at IOG. I've seen QA at every scale: regulated banking, high-throughput payments, enterprise SaaS, open-source blockchain. The patterns repeat. The fixes are usually the same.

Stamtąd przeszedłem do automatyzacji w PayU. Następnie spędziłem pięć lat w firmie SaaS, która po dwóch przejęciach utworzyła produkt, funkcjonujący dzisiaj pod nazwą Adobe Workfront. W kolejnym etapie mojej kariery stałem na czele automatyzacji testów Web3 dla Cardano Partner Chains w IOG. Widziałem QA w różnej skali: regulowana bankowość, wysokoprzepustowe płatności, enterprise SaaS, open-source blockchain. Wzorce się powtarzają. Rozwiązania są zwykle te same.

Most teams don't need more testers. They need someone who's been here before, knows what to look for, and isn't afraid to tell them which 20% of their pipeline is actually doing 80% of the work.

Większość zespołów nie potrzebuje więcej testerów. Potrzebuje kogoś, kto już to przerabiał, wie, czego szukać, i nie boi się powiedzieć, które 20% pipeline'u faktycznie robi 80% roboty.

Currently consulting on test automation for Midnight — a fourth-generation, privacy-focused blockchain.

Obecnie konsultuję w zakresie automatyzacji testów dla Midnight — blockchaina czwartej generacji nastawionego na prywatność.

Radosław Sporny
QA & AI automation consultant
Konsultant QA & automatyzacji AI
radoslaw@sporny.pl

Get in touch.

Skontaktuj się.

If you'd like to talk about test automation, AI in QA, or anything else from my work — drop me a line. I read every email.

Jeśli chcesz pogadać o automatyzacji testów, AI w QA, albo o czymkolwiek innym z mojej pracy — napisz. Czytam każdego maila.

radoslaw@sporny.pl