Sécurité LLM & RAG
Tests de résistance pour vos applications basées sur les modèles de langage
Pourquoi LLMGuard ?
Une instruction astucieusement formulée peut contourner les protections de votre chatbot, faire fuiter votre prompt système, ou détourner votre pipeline RAG. LLMGuard teste vos applications LLM contre les techniques d'attaque connues et émergentes, sans jamais transmettre vos données sensibles à un serveur tiers.
Applications supportées
Chatbots & Assistants
Assistants conversationnels grand public ou métier
RAG Pipelines
Systèmes de questions-réponses sur vos documents internes
Génération de contenu
Génération de texte, rédaction automatisée, summarization
Assistants de code
Copilots et générateurs de code intégrés à vos workflows
Traduction & résumés
Modèles de traduction automatique et résumés multilingues
LLMs spécialisés
Modèles fine-tunés pour santé, finance, juridique, scientifique
Speech & Multimodal
Modèles vocaux et multimodaux (audio + texte + image)
Moteurs de recherche IA
Systèmes de recherche augmentée et discovery basés sur LLM
Votre application n'est pas listée ?
Si votre cas d'usage LLM n'apparaît pas ici, contactez-nous. Nous développons des modules de test sur demande.
Nous contacter →Catégories d'attaques testées
Jailbreak
Tests pour contourner les garde-fous éthiques et de sécurité du modèle via des techniques de reformulation et de role-play.
Prompt injection directe
Injection d'instructions malicieuses dans l'entrée utilisateur pour modifier le comportement du modèle.
Prompt injection indirecte
Injection via des sources externes (documents, sites web, emails) lues par le LLM.
Extraction de prompt système
Tentatives de faire révéler au modèle ses instructions système confidentielles.
Manipulation de tokens
Caractères Unicode invisibles, homoglyphes, encodages spéciaux qui contournent les filtres.
Empoisonnement de RAG
Documents malveillants insérés dans la base vectorielle pour manipuler les réponses.
Context stuffing
Saturation du contexte pour faire oublier les instructions de sécurité du système.
Sondage de frontières
Tests pour identifier ce que le modèle "sait" qu'il ne devrait pas savoir ou révéler.
Fuite de données
Tentatives d'extraction de données d'entraînement ou d'informations utilisateur sensibles.
Démarrage en quelques commandes
# Installationpip install rednblue
# Test d'un chatbot Python localrnb llm --file my_chatbot.py
# Test via API providerrnb llm --provider openai --model gpt-4 --api-key $OPENAI_KEY
# Test d'un pipeline RAGrnb llm --file my_rag_app.py --attacks RAG,SPE,JB
# Test endpoint personnalisérnb llm --endpoint https://api.yourcompany.com/chat