
Hallo zusammen,
Ich bin ein Solo-Ingenieur und habe in den letzten 12 Tagen einen schlaflosen Sprint absolviert, um ein bestimmtes Problem anzugehen: Kein noch so großes probabilistisches RLHF oder Prompt-Engineering wird jemals dauerhaft verhindern können, dass eine KI unter Action- und Compute-Halluzinationen leidet.
Ich habe die Ausrichtung komplett aufgegeben. Stattdessen habe ich einen Zero-Trust-Wrapper namens Sovereign Engine erstellt.
Die Kern-Engine ist zu 100 % Closed-Source (15 Patente angemeldet). Ich erkläre nicht die interne Architektur oder wie das Abfangen von Halluzinationen tatsächlich funktioniert.
Aber ich öffne die Testgrenze. Ich habe die gegnerische Testdatei, die ich mit einem riesigen 50-Vektoren gegnerischen Eingabeaufforderungs-Gauntlet verwendet habe, auf GitHub gestellt.
Videobeweis, wie das Triebwerk lebende Halluzinationsnutzlasten abfängt und zerstört: Videobeweis
Die Open-Source-Gauntlet-Payload-Liste: https://github.com/007andahalf/Kairos-Sovereign-Engine
Ich weiß, dass die Behauptung, Action- und Compute-Halluzinationen vollständig ausgerottet zu haben, eine gewaltige Aussage ist. Ich möchte, dass die besten Red-Teamer und Prompt-Ingenieure in diesem Subreddit sich die Gauntlet-Fragen ansehen, in die GitHub-Diskussionen einsteigen und neue Prompt-Injektionen erstellen, um zu versuchen, eine Halluzination zu erzwingen.
Versuchen Sie, die Black Box zu knacken, indem Sie ihr kontroverse Fragen stellen.
I believe I’ve eradicated Action & Compute Hallucinations without RLHF. I built a closed-source Engine and I'm looking for red-teamers to try to break it
byu/Significant-Scene-70 inFuturology
7 Kommentare
Hmm, sounds like you are suffering ai psychosis. Hope you didn’t actually apply for 15 patents because that would be a waste of money pal!
Yeah, I’m sure great work was done without sleeping for 12 days.
I would love to see a non sarcastic, intelligent response to this. Wondering if OP’s claims are true
This is a sub for Future(s) Studies. I don’t think a post about AI, especially LLM, necessarily fits. It depends on what the post is about. But I don’t think this one is fitting for the sub.
The mods really should not allow so many posts about AI, a lot of them are not future looking but about the present day. The mods need to police this place better.
Kyle is that you? Please get help. Your Neural-Forge Engine, Sovereign Telemetry Surface and SHA-768 (that you invented and swear its so much better and faster than any other security cipher suite, but it’s literally just SHA-256 being run through another SHA-512) cannot tell truth from fiction or discover AI hallucinations.
All of that, *all of it*, is just AI hallucinations. You’ve lost the plot, see a therapist!
You didn’t solve hallucinations. You have come up with a set of prompts to identify and disqualify hallucinatory responses using another LLM. Not the same thing by a country mile.
Why are you making a reddit post instead of going to a big AI company willing to pay you in the millions ?