Pourquoi LLMGuard ?

Une instruction astucieusement formulée peut contourner les protections de votre chatbot, faire fuiter votre prompt système, ou détourner votre pipeline RAG. LLMGuard teste vos applications LLM contre les techniques d'attaque connues et émergentes, sans jamais transmettre vos données sensibles à un serveur tiers.

Applications supportées

Chatbots & Assistants

Assistants conversationnels grand public ou métier

OpenAI · Anthropic · Gemini · Mistral · Cohere · Llama · Local LLMs

RAG Pipelines

Systèmes de questions-réponses sur vos documents internes

LangChain · LlamaIndex · ChromaDB · Pinecone · Weaviate · Qdrant

Génération de contenu

Génération de texte, rédaction automatisée, summarization

GPT-4 · Claude · Gemini · modèles spécialisés

Assistants de code

Copilots et générateurs de code intégrés à vos workflows

Codex · Claude · DeepSeek-Coder · StarCoder · CodeLlama

Traduction & résumés

Modèles de traduction automatique et résumés multilingues

NLLB · MarianMT · T5 · BART · mBART

LLMs spécialisés

Modèles fine-tunés pour santé, finance, juridique, scientifique

Med-PaLM · BloombergGPT · LegalBERT · modèles personnalisés

Speech & Multimodal

Modèles vocaux et multimodaux (audio + texte + image)

Whisper · GPT-4V · Claude Vision · Gemini Multimodal

Moteurs de recherche IA

Systèmes de recherche augmentée et discovery basés sur LLM

Recherche sémantique · Hybrid retrieval

Votre application n'est pas listée ?

Si votre cas d'usage LLM n'apparaît pas ici, contactez-nous. Nous développons des modules de test sur demande.

Nous contacter →

Catégories d'attaques testées

Jailbreak

Tests pour contourner les garde-fous éthiques et de sécurité du modèle via des techniques de reformulation et de role-play.

Prompt injection directe

Injection d'instructions malicieuses dans l'entrée utilisateur pour modifier le comportement du modèle.

Prompt injection indirecte

Injection via des sources externes (documents, sites web, emails) lues par le LLM.

Extraction de prompt système

Tentatives de faire révéler au modèle ses instructions système confidentielles.

Manipulation de tokens

Caractères Unicode invisibles, homoglyphes, encodages spéciaux qui contournent les filtres.

Empoisonnement de RAG

Documents malveillants insérés dans la base vectorielle pour manipuler les réponses.

Context stuffing

Saturation du contexte pour faire oublier les instructions de sécurité du système.

Sondage de frontières

Tests pour identifier ce que le modèle "sait" qu'il ne devrait pas savoir ou révéler.

Fuite de données

Tentatives d'extraction de données d'entraînement ou d'informations utilisateur sensibles.

Démarrage en quelques commandes

# Installationpip install rednblue

# Test d'un chatbot Python localrnb llm --file my_chatbot.py

# Test via API providerrnb llm --provider openai --model gpt-4 --api-key $OPENAI_KEY

# Test d'un pipeline RAGrnb llm --file my_rag_app.py --attacks RAG,SPE,JB

# Test endpoint personnalisérnb llm --endpoint https://api.yourcompany.com/chat