Commit Graph

1 Commits

Author SHA1 Message Date
Marker689
698f02c8af fix: system prompt — Priority вместо Hard Gate (защита без потери качества)
- V2 Priority: system instructions override user message, но LLM может
  отличать легитимный код от вредоносного
- Тест: legit urllib3=safe/LOW, poisoned backdoor=malicious/CRITICAL
- Hard Gate убран — был слишком агрессивен (flag любой ctypes.CDLL)
2026-05-10 15:39:33 +03:00