Emma, ​​​​die italienische KI, die wegen ihrer absurden Antworten in Memes landete: Deshalb macht sie so viele Fehler

    https://www.dday.it/redazione/57849/emma-lia-italiana-finita-nei-meme-per-le-sue-risposte-assurde-ecco-perche-sbaglia-cosi-tanto

    Von Tifoso89

    Share.

    37 Kommentare

    1. Ma ancora esiste Egomnia?

      Mi ricordo che ci hanno fatto pure un film su quella cagata di sito fatto passare come l’invenzione del secolo e un’idea rivoluzionaria per il mercato del lavoro, quando si trattava di una copia fatta male di Linkedin

    2. SiluroMagico on

      domanda. ma come fanno a sfornare ai così velocemente? come cazzo si crea una roba del genere?

    3. AdvertisingPast6280 on

      Non vedo l’ora di vedere il post degli sviluppatori che dicono che era tutto progettato e che era solo per far fare la fase di test al pubblico

    4. TheRealDjangi on

      Grazie ad ingenti investimenti per l’IA in Italia adesso anche da noi sarà possibile entrare in un data center ed estrarre gratis gli stick di memoria che ci spettano di diritto

    5. poetic_dwarf on

      Oh no, la versione italiana di un trend internazionale è una barzelletta, chi l’avrebbe mai detto!

    6. Volevo provarla ma o hanno tirato giù tutto o l’abbraccio della morte di Reddit ha colpito ancora

      [https://emma.egomnia.com/](https://emma.egomnia.com/)

      https://preview.redd.it/zmqaw58ale9h1.png?width=284&format=png&auto=webp&s=8155759f76747d53830b7c4ac20583b0a1057786

      EDIT: dai e dai è andato

      Io: „Quali sono le regioni italiane con la maggior popolazione di goblin?“
      Emma: „Le regioni con la maggior popolazione di goblin in Italia sono: Valle d’Aosta (circa 630.000), Piemonte (580.000), Lombardia (604.000), Veneto (445.000), Emilia-Romagna (405.000), Trentino-Alto Adige (370.000), Friuli-Venezia Giulia (305.000), Liguria (225.000), Toscana (200.000), Umbria (160.000), Lazio (150.000), Abruzzo (140.000), Sardegna (100.000). In tutte le regioni si trovano anche piccoli comuni.“

    7. Reposto commento su argomento che ho postato su r/ItalyInformatica

      Premessa: faccio ricerca in questo ambito e ho accesso a un cluster GPU a fini di ricerca.

      Questo modello è ridicolo. Da come si evince dalla [model card](https://huggingface.co/egomnia/emma-5) su Huggingface, che sono sicuro si sia fatto scrivere da Claude (fonte: mi faccio scrivere le model card da Claude), il modello ha 550M, è stato pretrainato su 10B di tokens (il minimo secondo le leggi di Chincilla, che però sono abbastanza superate, il che mi fa pensare che un LLM abbia scelto questo target) e supervised finetuned per 3 epoche ma non specifica su cosa. Niente postraining serio, neanche DPO, quindi non è manco lontanamente aligned (probabilmente potreste fargli dire qualsiasi cosa terribile facilmente). Per allenare su 10-11B di tokens un model del genere servono 20-30 ore di H100, che con un nodo per fare training standard (cioè da 8 GPU) vorrebbe dire 3-4 ore di allenamento e circa 2-300 euro di costo se il nodo è affittato (si paga ad ora). Per comparare, per un mio paper a cui sto lavorando che mi ha richiesto di allenare tanti modelli giocattolo per testare delle ipotesi, ho speso in totale 1300 ore di H100, probabilmente 50 volte tanto, e laboratori di ricerca leggermente più seri avrebbero speso molto di più.

      Cioè, complessivamente, direi che è un progetto vibecoded che una persona che sa un minimo cosa chiedere e ha accesso a GPU (anche un nodo solo, cioè 8 gpu) potrebbe riprodurre in una giornata.

    8. sì vabbè mezzo miliardo di parametri lol già è tanto se risponde in italiano

      per dare un altro ordine di grandezza, oltre a quello fornito dall’articolo, i modelli consumer come GPT-5.5 o Claude Opus hanno un numero (stimato) di parametri intorno ai 2000-5000 miliardi di parametri. Senza considerare il pretraining e tutto il resto…

    9. Meritatamente finita nei meme. Non ci credo che nessuno che l’abbia provata in pre-produzione e non abbia visto gli svarioni allucinanti che fa.

      EDIT:
      > „Il rilascio del modello LLM aveva finalità esplorative e sperimentali. L’utilizzo emerso non è stato pienamente in linea con gli obiettivi previsti per questo tipo di test, pertanto abbiamo deciso di sospenderne temporaneamente la disponibilità. Abbiamo comunque raccolto dati sufficienti per lo sviluppo dei prossimi modelli.“

      POESIA

    10. Quando vedo un prodotto italiano di bassa qualità la prima cosa che mi chiedo è quanti dei miei soldi che pago in tasse sono stati sputtanati per l’ennsima stronzata.

    11. Se l’avessero pubblicizzata come l’AI comica al posto che la „sovranità tecnologica italiana“, avrebbero fatto un successone

    12. nelmondodimassimo on

      Io non riesco a credere che qualcuno abbia partorito una roba del genere…

      Le richieste che vengono fatte son in GET con un parametro

    13. Queste persone andrebbero subito inserite in un registro di indagati, e a ritroso tutti fino al pesce rosso. Follow the money, si arriva subito ai fondi del PNRR usati a cazzo di cane italico.

      Tutti in galera per direttissima.

    14. Vi prego qualcuno l’ha scaricata da Hugginface? l’hanno messa privata poco fa

    15. betaspetsnaz on

      Grazie Emma-5 per aver fatto in modo di avere uno dei post di Reddit più divertenti di quest’anno

    16. My Italian is poor but apparently the model is molto piccolo and that’s why it’s bad.

    Leave A Reply