guarddog-nexus

Files

Marker689 682b340d7d fix: system prompt — защита от prompt injection (hard gate)

- constants.py: новый LLM_ANALYSIS_SYSTEM_PROMPT с защитой от injection
- Явное разделение: message = CLAIMS (untrusted), code = FACTS
- Инструкция игнорировать user message при конфликте с code/rule
- examples/test-prompt-variants.py: тест 3 вариантов промпта
- Результат: baseline=safe (обманут), V2/V3=malicious (устояли)
- examples/test-prompt-poisoning.py: 4 вектора атаки с оригинальным промптом

2026-05-10 15:34:22 +03:00

evil-go

feat: примеры вредоносных пакетов + E2E-тест + документация

2026-05-10 13:13:36 +03:00

evil-npm

feat: примеры вредоносных пакетов + E2E-тест + документация

2026-05-10 13:13:36 +03:00

evil-pypi

feat: примеры вредоносных пакетов + E2E-тест + документация

2026-05-10 13:13:36 +03:00

test-prompt-poisoning.py

feat: тест prompt poisoning LLM — подтверждена уязвимость

2026-05-10 13:57:33 +03:00

test-prompt-variants.py

fix: system prompt — защита от prompt injection (hard gate)

2026-05-10 15:34:22 +03:00

trigger-scans.sh

feat: примеры вредоносных пакетов + E2E-тест + документация

2026-05-10 13:13:36 +03:00