refactor: вынос хардкода + LLM-анализ finding'ов

## Часть A: Вынос хардкода
- Новый модуль constants.py — все magic strings, лимиты, severity, ключи
  (104 хардкод-значения централизованы)
- Новый модуль queries.py — общие SQL-запросы (build_scan_list_query,
  build_package_list_query, get_dashboard_stats)
  Убрана дупликация между api/*.py и web/routes.py (~90%)

- config.py: добавлены NLP_ENABLED, nexus_timeout, guarddog_binary,
  log_syslog_facility, LLM-переменные
- nexus_client.py: таймауты из конфига, SHA256_CHUNK_SIZE из constants
- scanner.py: error-ключи из constants, GUARDDOG_OUTPUT_FORMAT из constants
- webhooks.py: RELEVANT_WEBHOOK_ACTIONS, METADATA_PATTERNS, ignore-строки
  из constants
- logging_setup.py: конфигурируемый syslog facility, APP_PACKAGE из constants
- main.py: APP_NAME, APP_DESCRIPTION, APP_PACKAGE из constants
- models.py: поле report: JSON | None в Finding для LLM-отчётов
- harvester.py: авто-очистка tmpdir через finally; ERROR_MESSAGE_MAX_LENGTH
  из constants; PACKAGE_EXTENSIONS вместо SUPPORTED_EXTENSIONS (с .gem)
- api/*.py + web/routes.py: используют build_*_query из queries.py,
  константы для лимитов и сортировок
- tests/conftest.py: SEVERITY_WARNING, DEFAULT_ECOSYSTEM из constants

## Часть B: LLM-анализ finding'ов
- llm.py: клиент для OpenAI-совместимых API с промптом security-аналитика
- harvester.py: авто-триггер после flagged scan, сохранение report в БД
- api/findings.py: POST /{id}/analyze — ручной триггер
- web/routes.py: POST /api/v1/findings/{id}/analyze — HTMX-фрагмент
- _llm_report_fragment.html: шаблон фрагмента с вердиктом
- scan_detail.html, package_detail.html: кнопка Analyze with LLM
  (htmx-post, spinner, inline-замена на LLM-отчёт)
- style.css: стили для .llm-report .verdict-safe/suspicious/malicious

## Часть C: Тесты
- 50 тестов, все зелёные
- Линтер чистый
- Тесты используют constants где нужно
This commit is contained in:
Marker689
2026-05-10 04:37:07 +03:00
parent c43e7c4c9b
commit 834138368a
21 changed files with 1094 additions and 476 deletions

View File

@@ -6,6 +6,7 @@ import sys
from logging.handlers import SysLogHandler
from guarddog_nexus.config import config
from guarddog_nexus.constants import APP_PACKAGE
class JsonFormatter(logging.Formatter):
@@ -21,8 +22,23 @@ class JsonFormatter(logging.Formatter):
return json.dumps(payload, ensure_ascii=False)
def _resolve_facility(value: str) -> int:
"""Resolve a facility name string to a SysLogHandler constant."""
mapping = {
"local0": SysLogHandler.LOG_LOCAL0,
"local1": SysLogHandler.LOG_LOCAL1,
"local2": SysLogHandler.LOG_LOCAL2,
"local3": SysLogHandler.LOG_LOCAL3,
"local4": SysLogHandler.LOG_LOCAL4,
"local5": SysLogHandler.LOG_LOCAL5,
"local6": SysLogHandler.LOG_LOCAL6,
"local7": SysLogHandler.LOG_LOCAL7,
}
return mapping.get(value.lower(), SysLogHandler.LOG_LOCAL0)
def setup_logging() -> logging.Logger:
logger = logging.getLogger("guarddog_nexus")
logger = logging.getLogger(APP_PACKAGE)
logger.setLevel(config.log_level.upper())
stdout_handler = logging.StreamHandler(sys.stdout)
@@ -30,9 +46,10 @@ def setup_logging() -> logging.Logger:
logger.addHandler(stdout_handler)
if config.log_syslog_host:
facility = _resolve_facility(config.log_syslog_facility)
syslog_handler = SysLogHandler(
address=(config.log_syslog_host, config.log_syslog_port),
facility=SysLogHandler.LOG_LOCAL0,
facility=facility,
)
syslog_handler.setFormatter(JsonFormatter())
logger.addHandler(syslog_handler)