AI Data Chains

Man mano che l’intelligenza artificiale (AI) continua a evolversi, necessita di sempre più dati generati dagli utenti per l’addestramento dei modelli, sollevando preoccupazioni sulla privacy e sul controllo dei dati. Questo report esamina il concetto di blockchain di dati AI, prendendo Vana e CARV Protocol come casi di studio.

Rni Ai Data Chains B

Disclaimer

Disclaimer e approfondimenti di Crypto.com sui report di ricerca

Panoramica generale

  • I dati rappresentano la linfa vitale dello sviluppo dell’intelligenza artificiale (AI). Tuttavia, ci sono problemi legati ai dati, tra cui la qualità incoerente, la mancanza di trasparenza nelle fonti, le problematiche di privacy e sicurezza, e una distribuzione iniqua delle ricompense per i contributori. Il Web3 fornisce soluzioni utilizzando il registro digitale immutabile della blockchain per fornire trasparenza. Inoltre, la decentralizzazione nel Web3 migliora la sicurezza in ambiti come la governance e l’archiviazione.
  • Man mano che l’AI continua a evolversi, avrà bisogno di dati sempre più diversificati e voluminosi generati dagli utenti per addestrare i modelli. Questo solleva preoccupazioni sulla privacy e sul controllo dei dati degli utenti.
  • Esistono diversi progetti emergenti, tra cui Vana e CARV Protocol, che consentono agli utenti di essere proprietari dei propri dati e di ottenere ritorni tramite la “tokenizzazione dei dati“.
    • Vana è una blockchain layer1 compatibile con Ethereum Virtual Machine (EVM) per i dati di proprietà degli utenti. L’obiettivo è creare una rete distribuita in cui gli utenti possano possedere, governare e trarre guadagno dai modelli di AI a cui contribuiscono.
    • CARV si propone di costruire il più grande layer di identità e dati modulari (IDL), aggregando dati e facilitando l’accesso per le case di produzione di giochi e le aziende AI. Dal 2022, CARV ha accumulato circa 9,5 milioni di giocatori registrati, attratto il 30% dei giochi Web3 e favorito crescenti partnership strategiche nel settore dell’AI.
  • I progetti emergenti delle AI data chain rappresentano un cambiamento significativo verso la decentralizzazione nella gestione dei dati e nello sviluppo dell’AI, enfatizzando l’autonomia degli utenti e la privacy nell’era digitale.

1. Introduzione

I dati sono la linfa vitale dell’intelligenza artificiale (AI) e rappresentano la base fondamentale per gli algoritmi, che apprendono, generano output e prendono decisioni. Tuttavia, con la crescente popolarità dell’AI, sono emerse alcune problematiche nei processi di raccolta e gestione dei dati:

  • Qualità dei dati: i dati utilizzati per l’addestramento dell’AI possono essere incompleti, disorganizzati o inaccurati, il che può portare il modello AI a prendere decisioni errate. D’altra parte, la frammentazione dei dati può compromettere la loro qualità, poiché essi risultano sparsi su diversi sistemi e piattaforme, creando repository isolati e incoerenze.
  • Mancanza di trasparenza nelle fonti dei dati: affinché gli utenti possano fidarsi dei modelli AI, è fondamentale poter tracciare la fonte dei dati di addestramento, così da spiegare l’algoritmo e aumentare la fiducia nei risultati prodotti.
  • Privacy e sicurezza dei dati: gli utenti spesso non hanno controllo né privacy sull’uso e la memorizzazione dei loro dati, che possono essere raccolti, utilizzati o persino modificati dalle piattaforme senza il loro consenso.
  • Distribuzione iniqua delle ricompense: gli utenti generano dati attraverso le loro attività quotidiane e il traffico web, ma sono spesso le piattaforme a monetizzarli o a stipulare accordi di licenza per “vendere” questi dati a fini di addestramento dell’AI.

Le problematiche relative ai dati menzionate sopra non sono nuove; diversi progetti sono emersi per affrontarle nell’addestramento dell’AI, utilizzando la tecnologia blockchain. Ad esempio, Ocean Protocol è progettato per sbloccare i dati per l’AI attraverso un marketplace decentralizzato, consentendo ai proprietari di dati di condividerli e monetizzarli mantenendone il controllo.

Inoltre, diversi progetti emergenti consentono agli utenti di diventare proprietari dei propri dati e di ottenere rendimenti tramite la “tokenizzazione dei dati”. Vana e CARV Protocol sono due esempi, che discutiamo di seguito. Abbiamo anche osservato un aumento della capitalizzazione di mercato nei settori, tra cui l’archiviazione decentralizzata e i big data per l’AI.

ProblemiCaratteristiche del Web3Applicazioni
Qualità dei datiAttivare i dati per garantire che rimangano a prova di manomissione e convalidati Verificare l’autenticità dei dati e assicurarsi che soddisfino determinati criteri prima di essere accettati e utilizzati per l’addestramento (ad esempio, la Proof of Contribution di Vana)
Mancanza di trasparenza sulla fonte di dati Il registro digitale immutabile della blockchain fornisce trasparenza e tracciabilità dei dati I modelli AI on-chain (ad esempio, Vana e Ora) hanno collaborato al lancio del Reddit DataDAO, il primo modello AI on-chain di proprietà degli utenti, utilizzando dataset forniti dagli utenti di Reddit per sviluppare un prototipo iniziale di un grande modello linguistico (LLM)
Privacy dei dati & SicurezzaDecentralizzazione nella memorizzazione e gestione dei dati, e controllo delle revisioniUtilizzo di tecnologie come le ZK proofs e gli ambienti di esecuzione fidati (TEEs) per verificare e validare i dati senza rivelare informazioni sensibili, insieme alla gestione dei dati tramite DAO, che consente agli utenti di votare sull’utilizzo dei dati
Distribuzione iniqua delle ricompense Facilita la monetizzazione consentendo l’utilizzo dei dati personali per addestrare l’AIGli utenti possono monetizzare in base ai contributi che offrono

2. Vuota

Vana, nato come progetto di ricerca nel 2018, è una blockchain layer1 compatibile con Ethereum Virtual Machine (EVM) che gestisce dati di proprietà degli utenti e mira a creare una rete distribuita in cui gli utenti possano possedere, guadagnare e governare i modelli di intelligenza artificiale a cui contribuiscono. Questa iniziativa si basa sul principio che gli utenti dovrebbero avere il controllo sui propri dati, che, nonostante siano legalmente di loro proprietà, sono spesso detenuti da piattaforme centralizzate.

2.1 Meccanismo

Di seguito sono riportate alcune caratteristiche chiave di Vana:

  • Data Liquidity Layer: consente di convalidare, tokenizzare e scambiare i dati come se fossero un asset liquido. Ospita le pool di liquidità dei dati (DLP), che aggregano dati con temi simili (ad esempio, finanza, fitness, Reddit) nelle pool di liquidità decentralizzate, accessibili ai consumatori di dati.
  • Proof of Contribution: un meccanismo che convalida i dati preservando la privacy e garantisce che i dati aggiunti ai DLP siano autentici e di alta qualità. Utilizza le Zero-Knowledge (ZK) proof per dimostrare che i dati contribuiti soddisfano determinati criteri senza rivelarne il contenuto.
  • Layer di portabilità dei dati: un layer applicativo che abilita la condivisione dei set di dati tra diverse applicazioni decentralizzate (DApp) e piattaforme. Garantisce l’interoperabilità, permettendo agli utenti di mantenere il controllo sui propri dati e di governare il modo in cui vengono utilizzati e condivisi.

Il flusso di lavoro generale è descritto di seguito:

  • I contributori di dati alimentano i DLP. Successivamente, i dati vengono crittografati e memorizzati off-chain in una posizione scelta dal DLP, rappresentata da un URL.
  • I dati vengono validati attraverso il Proof of Contribution. Una volta convalidati, i contributori vengono ricompensati con token VANA.
  • I dati vengono tokenizzati, e i consumatori possono acquistare l’accesso per diverse applicazioni (ad esempio, l’addestramento dei modelli di intelligenza artificiale) tramite il layer di portabilità dei dati.

2.2 DataDAO ed esempi

Una caratteristica chiave di Vana sono i DataDAO, che abilitano la decentralizzazione della governance. Ogni DLP è gestita da una DAO, governata dai possessori di token DLP, che hanno il diritto di votare su come vengono utilizzati i dati e distribuite le ricompense. Esistono oltre 300 DataDAO in fase di sviluppo sulla testnet Vana. Vana dovrebbe presentare a breve la sua rete principale, consentendo ai DataDAO di raccogliere attivamente dati dalla community e migliorare la governance degli utenti.

Esempi di DataDAOTemaCaratteristiche
r/datadaoDati di RedditConsente agli utenti di collegare il proprio account Reddit, contribuire con dati per guadagnare punti e, allo stesso tempo, costruire un dataset di proprietà della community. Il token nativo $RNAT viene utilizzato per permettere alla community di votare sull’utilizzo dei dati. Ha sviluppato per primo modello AI on-chain di proprietà degli utenti insieme a Vana e Ora — utilizzando dataset Reddit contribuiti dagli utenti per sviluppare un prototipo LLM iniziale
DatapigStrategie di investimentoRaccoglie le preferenze di trading degli utenti e i dati dalle piattaforme DeFi per l’analisi. L’analisi dei dati basata su intelligenza artificiale fornisce strumenti di trading ai trader, con i risultati presentati in forma di meme, GIF e brevi video per renderli più divertenti e coinvolgenti
Kleo NetworkCronologia del browserUn’estensione del browser che si integra nelle azioni quotidiane sul web, catturando i contenuti delle pagine e le interazioni. Gli utenti possono guadagnare punti Kleo XP in base all’intelligenza e alla complessità delle attività svolte nel browser, mantenendo il pieno controllo sui propri dati
FinquariumPrevisioni finanziarieGli analisti condividono previsioni su qualsiasi asset finanziario, verificate tramite il monitoraggio delle prestazioni per garantire qualità e affidabilità. Gli utenti possono acquistare l’accesso agli Insights utilizzando i token $FINQ, mentre i contributori ricevono ricompense
Aggiornato al 17 novembre 2024 Fonti: siti web Vana, DataDAO, Crypto.com Research

In definitiva, consentendo agli utenti di guadagnare ricompense in base ai dati forniti e restituendo la proprietà dei dati ai contributori, Vana ha aumentato la trasparenza, l’integrità e l’equità dei dati, affrontando anche alcuni dei problemi critici nella formazione dei modelli AI menzionati in precedenza.

3. CARV Protocol

Un layer di identità e dati modulare (IDL), CARV Protocol facilita lo scambio di dati e la distribuzione del valore tra i settori del gaming e dell’AI. Comprende l’intero flusso dei dati, dalla verifica e autenticazione dell’identità, passando per l’archiviazione e l’elaborazione, fino alla formazione dei modelli e alla distribuzione del valore.

CARV Protocol mira a risolvere il problema della frammentazione dei dati nel mondo digitale odierno, dove le informazioni sono disperse tra Web2, Web3 e numerose blockchain, ostacolando l’interoperabilità. Inoltre, esiste una mancanza di sovranità sui dati e di protezione della privacy per quanto riguarda i dati degli utenti.

CARV Protocol fornisce ai consumatori (ad esempio, studi di gioco e aziende AI) dati per la formazione e l’analisi, garantendo al contempo la privacy e il controllo per i singoli contributori di dati (come i giocatori).

3.1 Caratteristiche principali

Il layer di identità e dati (IDL), un framework per la gestione decentralizzata dell’identità e dei dati nell’ecosistema Web3, rappresenta un’infrastruttura chiave di CARV, consentendo agli utenti di controllare e monetizzare le proprie identità e i propri dati digitali. Il framework a cinque layer di CARV include:

LayerDescrizione
Layer di identitàCARV ID, il nucleo del protocollo, è un sistema di identità decentralizzato che permette agli utenti di stabilire, controllare e gestire autonomamente le proprie identità digitali. È uno standard di token EIP-7231 che lega le identità Web2 e Web3 degli individui ai token non fungibili (NFT) e ai token Soulbound (SBT).
Layer di archiviazione dei datiUna soluzione di archiviazione flessibile e scalabile con varie opzioni per l’efficienza dei costi e le esigenze di persistenza.
Layer di calcolo e addestramentoElabora e analizza dati da utilizzare nell’addestramento di modelli AI. Utilizza l’ambiente di esecuzione fidata (TEE) per offrire attestati e prove ZK per la verifica. Questo layer consente alle aziende AI di accedere ai dati all’interno di un TEE, migliorando la privacy.
Layer di esecuzioneOpera in un framework multichain e facilita lo scambio di dati e valori. Questo include la registrazione degli attestati, la supervisione del consenso tra i verificatori e la successiva distribuzione delle ricompense ai fornitori di dati, nonché l’addebito ai consumatori di dati.
Layer di verificaConsiste in nodi di verifica per garantire che CARV Protocol rimanga decentralizzato. I nodi convalidano le attestazioni generate dal TEE prima di registrarle on-chain.

3.2 Casi d’uso

CARV Play è il prodotto chiave di CARV Protocol, dove i giocatori non solo scoprono giochi tramite la piattaforma, ma aggregano anche le loro credenziali di gioco e i successi ottenuti, che sono rappresentati da NFT non trasferibili, noti come token Soulbound. D’altra parte, sviluppatori e studi di gioco possono accedere agli approfondimenti sui dati per acquisire e mantenere utenti, ad esempio, tramite dati post-evento o profili mirati dei giocatori.

Screenshot di CARV Play (Fonte: CARV Protocol)

Il protocollo consente agli utenti di possedere, controllare e monetizzare i propri dati. Attraverso CARV Play, gli utenti possono beneficiare dei loro contributi allo sviluppo del gioco e alla generazione dei dati, sia in modo passivo che attivo. Possono scegliere di condividere i loro dati storici con brand e giochi per guadagnare un reddito passivo, e allo stesso tempo, ottenere ricompense partecipando attivamente a campagne e attività di gioco (ad esempio, sondaggi ed eventi su CARV Play).

Inoltre, utilizzando gli ID CARV e incoraggiando gli utenti a collegare i propri account, CARV Protocol consente loro di interagire tra le piattaforme Web2 e Web3 con un’unica identità digitale, migliorando l’interoperabilità. Ad esempio, gli utenti possono collegare le proprie credenziali di gioco (Steam, CARV Play), i dati sui social media (X, Discord) e le attività Web3 (MetaMask) in un’unica struttura, scegliendo di condividere la propria impronta digitale. Questi dati possono essere successivamente accessibili dalle aziende di intelligenza artificiale per l’addestramento di modelli, al fine di sviluppare servizi personalizzati per gli utenti, o dagli inserzionisti per creare pubblicità mirata.

Nei tre anni dal suo lancio, CARV Protocol ha registrato circa 9,5 milioni di giocatori, con oltre tre milioni di CARV ID coniati. Ha dimostrato una maggiore adozione nel settore gaming, attirando oltre il 30% dei giochi Web3, così come nel settore AI grazie a crescenti partnership strategiche. Andando avanti, la roadmap di CARV prevede il miglioramento della sua infrastruttura, includendo sequencer decentralizzati e l’archiviazione dei dati (CARV DB).

L’IDL modulare di CARV e le misure adottate per la conservazione della privacy dei dati attirano naturalmente gli utenti desiderosi di guadagnare un reddito passivo dai loro dati. D’altra parte, i dati stanno diventando sempre più cruciali per le aziende AI e le piattaforme che desiderano crescere, conferendo a CARV Protocol un potenziale crescente per capitalizzare sull’espansione del gaming Web3 e dell’AI.

4. Conclusione

Con l’aumento dell’importanza dell’AI, essa richiederà volumi di dati più diversificati e consistenti per l’addestramento, accrescendo così l’attrattiva dei dati forniti dagli utenti. In contrasto con le soluzioni dati Web2 tradizionali, che tendono a essere centralizzate, le data chain Web3 promuovono la trasparenza e la distribuzione equa del valore dei dati.

Sia Vana che CARV Protocol sono esempi di protocolli Web3 che consentono agli utenti di possedere e monetizzare i propri dati. I Data Liquidity Pools e i DataDAO di Vana hanno rivoluzionato la governance dei dati, mentre l’identità modulare e il layer di dati di CARV Protocol aggregano le informazioni, rendendole facilmente accessibili agli studi di gioco e alle aziende AI. Entrambi segnano un significativo passo verso la decentralizzazione nella gestione dei dati e nello sviluppo dell’AI, mettendo in evidenza l’autonomia degli utenti e la protezione della privacy nell’era digitale.

Leggi il report completo: AI Data Chains

Interessato a saperne di più? Accedi ai report esclusivi registrandoti come membro privato, unendoti al nostro Programma VIP Crypto.com Exchange, o collezionando un Loaded Lions NFT.

Autori

Crypto.com team di Ricerca e Insights


Ricevi gli ultimi aggiornamenti su mercato, DeFi & NFT direttamente nella tua casella di posta:

Sii il primo a conoscere nuovi insights:

Condividi con gli amici

Sei pronto per avventurarti nel mondo delle criptovalute?

Ottieni subito la guida per configurare il tuo account Crypto.com

Cliccando sul pulsante Invia, riconosci di aver letto l' Informativa sulla privacy di Crypto.com dove illustriamo come usiamo e proteggiamo i tuoi dati personali.