Se hai mai postato su Reddit è molto probabile che tu stia aiutando ad addestrare la prossima generazione di modelli di intelligenza artificiale con le tue parole, immagini e meme, perché l’azienda sta vendendo l’accesso ai suoi 20 anni di contenuti per una cifra dichiarata di 60 milioni di dollari. È probabile che tu sia già stato utilizzato per addestrare le IA, dato che Reddit è già presente in modo massiccio nei dati di addestramento di diversi modelli linguistici (LLM) e generatori di immagini, ma almeno ora qualcuno viene pagato per questo.
I modelli generativi di intelligenza artificiale, come ChatGPT e Stable Diffusion, devono essere addestrati su database che comprendono centinaia di milioni di immagini, libri, videoclip, musica e così via. A volte la fonte è disponibile pubblicamente e utilizzabile da chiunque, altre volte le aziende di AI prendono semplicemente “in prestito” ciò che si trova in giro per il web. Ma raramente c’è un passaggio di denaro tra i due enti. Non è così nel caso di Reddit, che sembra aver concluso un accordo in base al quale, per una bella somma di denaro all’anno, un modello di intelligenza artificiale può utilizzare i contenuti del sito per l’addestramento.
Secondo quanto riportato da Bloomberg, l’accordo ha un valore di 60 milioni di dollari all’anno. Nel mondo della tecnologia, dove le transazioni si aggirano intorno ai miliardi di dollari, questa cifra potrebbe non sembrare molto alta, ma è praticamente sconosciuta nel campo dell’addestramento dell’intelligenza artificiale. Non ci sono indicazioni su chi sia la controparte dell’accordo, ma è improbabile che si tratti di una piccola start-up nel retrobottega di qualcuno.
Reddit ospita quasi 20 anni di contenuti postati sui suoi server, quindi chiunque sia l’azienda di AI, ha fatto un vero e proprio affare. OpenAI, gli sviluppatori di ChatGPT, avrebbe stipulato accordi di licenza con diverse società di media ed editori, il che non sembra molto diverso dall’accordo di Reddit.
Tuttavia, questi editori di solito pagano il lavoro dei creatori di contenuti o, per lo meno, assumono direttamente le persone che producono il materiale che OpenAI vuole utilizzare. Reddit, invece, non fa nulla di simile, sebbene il sito stesso sia completamente gratuito. Naturalmente non esiste un sito gratuito e Reddit genera entrate attraverso la pubblicità e le funzioni a pagamento per gli utenti.
Supponendo che l’accordo vada in porto (e non vedo alcun motivo per non farlo), non dubito che ci sarà un’altra reazione da parte degli utenti, simile a quella che si è verificata quando Reddit ha modificato le tariffe delle API. Gli effetti di quella reazione, però, sono scomparsi nel tempo e il sito è tornato praticamente com’era prima che numerose sezioni venissero oscurate.
Anche se ci sarà molto rumore iniziale, il risultato sarà che Reddit ha lo stesso aspetto e funziona come adesso. Nessun utente si renderà conto che i suoi post vengono attivamente scartati e utilizzati per l’addestramento dei modelli. Quindi si tratta solo di un po’ di confusione per nulla, giusto?
Forse non lo è se hai mai usato Reddit per mostrare le tue capacità di scrittura, le tue opere d’arte o la tua musica. Potresti pensare che i contenuti siano tuoi e protetti dalle leggi sul copyright, ma tutto diventa molto oscuro quando si tratta di addestramento per l’IA generativa. Tu fai tutto il duro lavoro ma qualcun altro ne trae i benefici e, soprattutto, non ti riconosce né ti compensa in alcun modo.
Tutto questo segnerà sicuramente l’inizio di una marea di accordi tra aziende di AI e altri siti di social media. Sospetto che i più grandi stiano già raschiando i contenuti per l’addestramento e nascondano i dettagli di questa operazione nelle minuzie dei loro enormi contratti con gli utenti finali. Ma forse è arrivato il momento di prestare molta più attenzione a cosa e dove pubblichi la tua produzione creativa, soprattutto se speri di farne una carriera.
Leggi di più su www.pcgamer.com

Absolutegamer è un gruppo di nerd vecchia scuola, progressisti, appassionati di gaming, meglio se indie, saltuariamente retro ma senza essere snob verso l’ultima versione di Unreal Engine, con un atteggiamento no bullshit e con una certa predisposizione all’attivismo. Hanno generalmente un umorismo discutibile ma se volevano piacere a tutti nascevano patate fritte.
They/Them (ovviamente, geni)