Hallo r/Futurology, ich habe gerade den QRCodeGenerator fertiggestellt, ein Projekt, das LangChain nutzt. [Deep Lake](https://www.activeloop.ai/) und Stable Diffusion mit ControlNet zur Generierung künstlerischer und einzigartiger QR-Codes, die auf dem Inhalt einer Website basieren können. Es ist alles Open Source – schauen Sie sich das GitHub-Repo an! Ich beschloss, mich mit dieser Kreation zu befassen, weil es online nichts gab, das all diese Technologien zusammenführte und die Erstellung benutzerdefinierter, leicht scannbarer QR-Codes skalierbar und flexibel machte. QRCodeGenerator übernimmt die auf dem gespeicherten Informationen [Deep Lake Vector Store](https://docs.activeloop.ai/), eine Datenbank für KI, und deren Abfrage mit LangChain generiert eine Eingabeaufforderung basierend auf dem Website-Inhalt, die dann über Stable Diffusion in ein Bild umgewandelt wird.

[AUTOMATIC1111 ](https://github.com/AUTOMATIC1111/stable-diffusion-webui) ist eine Weboberfläche, die es Ihnen ermöglicht, alle zum Generieren von Bildern erforderlichen Einstellungen manuell zu konfigurieren und Stable Diffusion und ControlNet zu integrieren. Um optisch ansprechende und wirklich scannbare QR-Code-Bilder zu erstellen, habe ich mich für die Verwendung des Diffusionsmodells dreamshaper\_631BakedVae und zweier verschiedener ControlNet-Modelle entschieden: Helligkeit und Kachel. Obwohl diese Schnittstelle wirklich praktisch und einfach zu bedienen ist, hat mich der anfängliche Ansatz nicht ganz zufrieden gestellt. Ich wollte eine Pipeline, die es mir ermöglicht, eine große Anzahl von Bildern zu generieren, ohne jedes Mal die Einstellungen ändern und das neue Bild manuell erstellen zu müssen. Möglich wurde dies dank [ComfyUI](https://github.com/comfyanonymous/ComfyUI), das graphbasierte Logik verwendet, um verschiedene Funktionalitäten zu orchestrieren. Jeder Knoten im Diagramm stellt eine bestimmte Aufgabe dar (z. B. Bilderzeugung, Diffusions-Checkpointing, ControlNet-Integration), die über logische Kanten miteinander verbunden ist. Mit Hilfe eines Plugins konnte ich diese Diagramme in ausführbaren Code übersetzen, der sich leicht automatisieren lässt. Dank dieser Pipeline können wir nun Hunderte oder Tausende von Bildern generieren, ausgehend von unterschiedlichen Eingabeaufforderungen, unterschiedlichen Diffusionsmodellen, unterschiedlichen ControlNet-Modellen, kurz gesagt, mit allen gewünschten Konfigurationen. Um den Kreis zu schließen, gibt es auch eine Funktion, die dafür sorgt, dass QR-Codes verworfen werden, die nicht leicht zu scannen sind. Benutzer müssen also nur das Programm mit allen gewünschten Konfigurationen starten, alle Bilder generieren lassen und das Bild auswählen, das ihnen am besten gefällt. ohne sich um irgendetwas anderes kümmern zu müssen. Der Grundgedanke dieses Projekts besteht darin, dass Sie damit auf skalierbare und automatisierte Weise eine große Menge an Bildern mit sehr hoher Qualität und Zuverlässigkeit generieren können, die aus unterschiedlichen Konfigurationen stammen, und das alles in nur wenigen Schritten. Die Anwendungsmöglichkeiten dieses Projekts sind vielfältig , wenn Sie mehr über die Funktionsweise und die erzielten Ergebnisse erfahren möchten, lesen Sie den Artikel über [Activeloop ](https://www.activeloop.ai/resources/build-an-ai-qr-code-generator-with-control-net-stable-diffusion-and-lang-chain/) und experimentieren Sie mit dem Code direkt aus dem [notebook](https://github.com/efenocchi/QRCodeGenerator/blob/main/qr_code_article.ipynb) in meinem GitHub-Repository. Teilen Sie mir mit, wie Sie dieses Projekt nutzen möchten und welche Ergebnisse Sie erzielt haben.

https://old.reddit.com/r/Futurology/comments/1by82rb/p_how_to_create_artistic_qr_codes_using_langchain/

Leave A Reply