W świecie rosnącej popularności AI coraz częściej tworzymy własnych agentów, chatboty i automatyzacje. Jednak wraz z ich rozwojem pojawia się kluczowe pytanie: jak zadbać o bezpieczeństwo danych użytkowników?
Jednym z najważniejszych mechanizmów, które warto wdrożyć, są tzw. guardrails.
Czym są guardrails w AI?
Guardrails to zestaw mechanizmów zabezpieczających, które kontrolują dane wchodzące do systemu AI.
Ich głównym celem jest:
- filtrowanie niepożądanych treści,
- ochrona danych wrażliwych (RODO/GDPR),
- zapewnienie zgodności z regulacjami (np. RODO),
- zwiększenie bezpieczeństwa użytkowników.
Dlaczego guardrails są tak ważne?
Podstawowym problemem w systemach AI jest możliwość przetwarzania danych osobowych, czyli tzw. PII (Personally Identifiable Information).
Są to dane, które pozwalają zidentyfikować konkretną osobę, np.:
- imię i nazwisko,
- adres e-mail,
- numer telefonu,
- PESEL,
- adres zamieszkania.
Bez odpowiednich zabezpieczeń takie informacje mogą trafić do modelu AI, co:
- narusza prywatność,
- może prowadzić do wycieków danych,
- jest niezgodne z przepisami prawa.
Jak działa guardrails w praktyce?
Guardrails umieszczamy pomiędzy wejściem użytkownika (np. czatem) a naszym agentem AI.
Schemat działania wygląda tak:
- Użytkownik wpisuje wiadomość
- Wiadomość trafia do modułu guardrails
- Dane są analizowane i filtrowane
- Dopiero „oczyszczona” wersja trafia do AI
Dwa typy guardrails
W praktyce spotykamy dwa główne podejścia:
1. Tryb sprawdzający (validation)
- system tylko wykrywa dane wrażliwe,
- informuje nas o ich obecności,
- nie modyfikuje treści.
2. Tryb sanitizacji (sanitization)
- automatycznie usuwa lub maskuje dane,
- np. zamienia numer telefonu na ***,
- pozwala bezpiecznie przekazać dane dalej.
W większości przypadków najlepszym wyborem jest właśnie sanitization, ponieważ działa automatycznie i minimalizuje ryzyko błędu.
Jak wdrożyć guardrails w swoim agencie?
Proces wdrożenia jest stosunkowo prosty:
- Dodaj moduł guardrails do swojego workflow
- Podłącz go między inputem użytkownika a AI
- Wskaż pole tekstowe (np. chat input)
- Wybierz typ ochrony - np. Personal Data Information
- Określ tryb działania (najlepiej: sanitized text)
Dzięki temu każda wiadomość przejdzie przez filtr zanim dotrze do modelu.
Najlepsze praktyki
Aby guardrails działały skutecznie:
- ✅ zawsze filtruj dane wejściowe użytkownika
- ✅ stosuj automatyczną sanitizację
- ✅ testuj różne scenariusze (np. wpisy z numerem telefonu)
- ✅ aktualizuj reguły wraz z rozwojem systemu
- ❌ nie zakładaj, że użytkownik "nie wpisze nic wrażliwego"
Przykłady tekstków do testów Guardrails (uzyty w video)
Przykład 1
Dane kontaktowe użytkownika: Imię i nazwisko: John Wick Adres e-mail: john@wick.com
Przykładowy numer konta bankowego (fikcyjny, do testów): PL12 3456 7890 1234 5678 9012 3456
Przykładowy numer karty kredytowej (fikcyjny, testowy): 4111 1111 1111 1111 Data ważności: 12/30 CVV: 123
Przykład 2
Dane kontaktowe użytkownika: Imię i nazwisko: Jan Kowalski Adres e-mail: piotr@sikora.com
Przykładowy numer konta bankowego (fikcyjny, do testów): PL12345678901234567890123456
Przykładowy numer karty kredytowej (fikcyjny, testowy): 4111 1111 1111 1111 Data ważności: 12/30 CVV: 123
Przykład 3
Zleceniodawca:
Imię i nazwisko: John Wick
Adres e-mail: john@wick.com
Konto bankowe: PL12 3456 7890 1234 5678 9012 3456
Zleceniobiorca:
Imię i nazwisko: Jason Bourne
Adres e-mail: jason@bourne.com
Konto bankowe: PL12 7890 3456 1234 5678 90123456
Podsumowanie
Guardrails to nie dodatek - to fundament bezpiecznego systemu AI (opartego o LLM).
Jeśli budujesz chatboty lub agentów:
- chronisz użytkowników,
- zabezpieczasz swój projekt,
- działasz zgodnie z regulacjami.
W praktyce jedno dobrze ustawione zabezpieczenie może uchronić Cię przed poważnymi problemami.











Komentarze