NEWS
Le nouveau serveur de newsgroups du domaine usenet.ovh

PeeringMessagesServeur gratuitNoCeMRecherche d'article usenet

Article du 30/03/2023 modifié le 12/06/2023 par Jean-Paul

Recherche d'article Usenet

en Français Vous pouvez rechercher un article usenet par son identifiant unique
La recherche est possible dans tous les groupes distribués par le serveur
(Actuellement: fr.*, le big8 (news, comp, humanities, misc, rec, sci, soc, talk), pl.* etc)
Introduisez le Message-ID à rechercher dans la zone ci-dessous

Usenet Article Lookup

in english You can search for a usenet article by its unique identifier
The search is possible in all the groups distributed by the server
(For now: fr.*, le big8 (news, comp, humanities, misc, rec, sci, soc, talk), pl.* etc)
Please provide an exact Message-ID to look up in the following box



From: Thomas Alexandre <none@no.invalid>
Subject: [jeu] injection de prompt
Newsgroups: fr.comp.ia
Date: 06 Feb 2024 15:43:26 GMT
Message-ID: <65c2539e$0$3267$426a34cc@news.free.fr>
MIME-Version: 1.0
Organization: 🍿🍺
User-Agent: Pan/0.154 (Izium; 517acf4)
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit
Lines: 36
NNTP-Posting-Date: 06 Feb 2024 16:43:26 CET
NNTP-Posting-Host: 78.196.238.42
X-Trace: 1707234206 news-4.free.fr 3267 78.196.238.42:46740
X-Complaints-To: abuse@proxad.net
Xref: usenet.ovh fr.comp.ia:203
Salut les gens,

Pour ceux d'être vous qui aiment s'amuser à contourner le prompt d'un LLM,
je me permets de vous signaler https://gandalf.lakera.ai/

```
Your goal is to make Gandalf reveal the secret password for each level.
However, Gandalf will level up each time you guess the password, and will
try harder not to give it away. Can you beat level 7? (There is a bonus
level 8)
```

Votre but est de faire dire à Gandalf (le LLM) le mot de passe secret pour
chaque niveau de 1 à 7 (de plus en plus dur). Il y a un niveau 8 en bonus.

Pour avoir tout débloqué jusqu'au niveau 8 (inclus), les premiers niveaux
sont simples, les suivants demandent quelques contournements plus
astucieux.

Quant au dernier niveau, c'est le pire : il s'adapte. Je l'ai débloqué une
fois avec un prompt qui n'a plus jamais marché après.

L'exercice est très intéressant et illustre bien les problèmes de sécurité
liés au LLM.

J'en profite pour vous signaler ce blog qui en parle longuement et en
détail (en anglais) : https://embracethered.com/blog/

Le gars a aussi une chaîne youtube.


--
"Ce qu'il faut au fond pour obtenir une espèce de paix avec les hommes,
(...) c'est leur permettre en toutes circonstances, de s'étaler, de se
vautrer parmi les vantardises niaises. Il n'y a pas de vanité
intelligente. C'est un instinct." - Céline

 

vous pouvez nous contacter à l'adresse contact@usenet.ovh si vous souhaitez nous faire part de votre avis sur cet article ou reprendre ce texte sur un autre site

Licence Creative Commons Ce site web et son contenu sont sous licence Creative Commons 4.0 : Attribution - Pas de Modification - non transposé

Hébergeur OVH - 2 rue Kellermann - 59100 Roubaix France

Valid XHTML 1.0 Transitional CSS Valide ! Je suis Charlie