
À mesure que l’intelligence artificielle (IA) se développe, elle a besoin de plus en plus de données générées par les utilisateurs pour l’entraînement des modèles, ce qui soulève des préoccupations concernant la confidentialité et le contrôle des données. Ce rapport explore le concept de la chaîne de données IA, en prenant Vana et CARV Protocol comme études de cas.
Avertissement de Crypto.com Research and Insights pour les rapports de recherche
Les données sont l’élément vital de l’intelligence artificielle (IA), constituant une base essentielle pour permettre aux algorithmes d’apprendre, de générer des résultats et de prendre des décisions. Cependant, avec l’essor du secteur de l’IA, plusieurs problèmes ont été mis en lumière dans les processus de collecte et de gestion des données :
Ces problématiques ne sont pas nouvelles. Plusieurs projets ont vu le jour pour y remédier en intégrant la technologie blockchain dans l’entraînement des modèles d’IA. Par exemple, Ocean Protocol est conçu pour libérer l’accès aux données pour l’IA en proposant un marché décentralisé où les propriétaires de données peuvent partager et monétiser leurs ensembles de données tout en conservant le contrôle de ceux-ci.
De plus, plusieurs projets émergents permettent désormais aux utilisateurs d’être propriétaires de leurs propres données et d’en tirer des revenus grâce à la « tokenisation des données ». Vana et CARV Protocol en sont deux exemples que nous analysons ci-dessous. Par ailleurs, nous observons une croissance de la capitalisation boursière dans plusieurs secteurs, notamment le stockage décentralisé et les mégadonnées en IA.
Problèmes | Caractéristiques du Web3 | Applications |
---|---|---|
Qualité des données | Permet aux données de rester infalsifiables et validées | Vérifier l’authenticité des données et s’assurer que les données répondent à certains critères avant d’être acceptées et utilisées dans la formation (par exemple, la preuve de contribution de Vana) |
Manque de transparence sur la source des données | L’enregistrement numérique immuable de la blockchain garantit la transparence et la traçabilité des données | Les modèles d’IA on-chain (ex. : Vana et Ora) ont collaboré pour soutenir le lancement du premier modèle d’IA on-chain détenu par les utilisateurs, utilisant les ensembles de données Reddit pour développer un prototype de grand modèle de langage (LLM) |
Confidentialité & sécurité des données | Décentralisation du stockage des données et des audits Gouvernance décentralisée des données | Utilisation de technologies comme les preuves à divulgation nulle de connaissance (ZK proofs) et les environnements d’exécution de confiance (TEEs) pour vérifier et valider les données sans exposer d’informations sensibles Gouvernance des données via des DAOs, permettant aux utilisateurs de voter sur l’utilisation des données |
Répartition inéquitable des récompenses | Facilite la monétisation en permettant l’utilisation des données personnelles pour entraîner l’IA | Les utilisateurs peuvent monétiser leurs données en fonction de leur contribution |
Vana, qui a débuté comme un projet de recherche en 2018, est une blockchain compatible avec la Machine Virtuelle Ethereum (EVM) de couche 1 pour la donnée possédée par les utilisateurs, visant à créer un réseau distribué où les utilisateurs peuvent posséder, gagner et gouverner les modèles d’IA auxquels ils contribuent. Cette initiative repose sur le principe que les utilisateurs devraient avoir le contrôle de leurs données, qui sont souvent détenues par des plateformes centralisées malgré leur propriété légale.
Vous trouverez ci-dessous quelques caractéristiques clés de Vana :
Le flux de travail général est décrit ci-dessous:
Une fonctionnalité clé de Vana est l’introduction des DataDAOs qui permettent la décentralisation de la gouvernance. Chaque DLP dispose d’un DAO géré par les détenteurs de tokens du DLP, qui peuvent voter sur l’utilisation des données et la distribution des récompenses. Actuellement, plus de 300 DataDAOs fonctionnent sur le testnet de Vana. Le lancement imminent du mainnet permettra aux DataDAOs de collecter activement des données auprès de la communauté et d’améliorer la gouvernance des utilisateurs.
Exemples de DataDAO | Thème | Caractéristiques | |
---|---|---|---|
r/datadao | Données Reddit | Permet aux utilisateurs de connecter leur compte Reddit, contribuer des données pour gagner des points et créer un ensemble de données communautaire. Le token natif $RNAT est utilisé pour voter sur l’utilisation des données. A lancé le premier modèle d’IA on-chain détenu par les utilisateurs avec Vana et Ora, basé sur des ensembles de données Reddit pour développer un prototype de LLM. | |
Datapig | Stratégies d’investissement | Collecte les préférences de trading des utilisateurs et des données issues des plateformes DeFi pour les analyser. L’analyse des données assistée par IA fournit des insights de trading. Les résultats sont présentés sous forme de mèmes, GIFs et vidéos courtes pour une expérience plus engageante. | |
Kleo Network | Historique de navigation | Extension de navigateur qui s’intègre aux actions quotidiennes sur le web pour capturer le contenu des pages et les interactions. Les utilisateurs gagnent des Kleo XP points en fonction de l’intelligence et de la complexité de leur activité de navigation, tout en gardant le contrôle sur leurs données. | |
Finquarium | Prévisions financières | Les analystes partagent leurs prédictions sur divers actifs financiers. La qualité des prévisions est vérifiée via un suivi des performances. Les utilisateurs peuvent acheter l’accès aux insights avec des tokens $FINQ, tandis que les contributeurs sont récompensés. |
En fin de compte, en permettant aux utilisateurs de gagner des récompenses basées sur les données contribuant ainsi qu’en redonnant la propriété des données aux contributeurs, Vana améliore la transparence, l’intégrité et l’équité des données. Cela contribue également à résoudre plusieurs des problèmes liés à l’entraînement des modèles d’IA évoqués précédemment.
CARV Protocol est une couche modulaire d’identité et de données (IDL) qui facilite l’échange de données et la distribution de valeur dans les secteurs du jeu vidéo et de l’intelligence artificielle (IA). Il couvre l’ensemble du processus de gestion des données, y compris la vérification des données, l’authentification de l’identité, le stockage et le traitement des données, l’entraînement des modèles IA et la distribution des revenus.
CARV Protocol vise à résoudre le problème de la fragmentation des données dans le monde numérique, où les informations sont dispersées entre Web2, Web3 et plusieurs blockchains, limitant ainsi l’interopérabilité. De plus, il répond aux préoccupations concernant le manque de souveraineté et de protection des données personnelles.
CARV Protocol permet aux consommateurs de données (studios de jeux, entreprises d’IA) d’accéder à des données pour l’entraînement et l’analyse, tout en garantissant la confidentialité et le contrôle des contributeurs individuels (ex. : joueurs).
La couche d’identité et de données (IDL), est une infrastructure décentralisée de gestion des identités et des données dans l’écosystème Web3. Elle permet aux utilisateurs de contrôler et monétiser leurs identités numériques et leurs données. Cette infrastructure repose sur cinq couches :
Couches | Description |
---|---|
Couche d’identité | CARV ID, le cœur du protocole, est un système d’identité décentralisé permettant aux utilisateurs de créer et gérer leurs identités numériques de manière autonome. C’est un standard de token EIP-7231 qui lie les identités Web2 et Web3 des individus aux tokens non fongibles (NFT) et tokens Soulbound (SBT). |
Couche de stockage des données | Une solution de stockage flexible et évolutive avec diverses options pour des besoins d’efficacité des coûts et de persistance. |
Couche de calcul & d’entrainement | Permet le traitement et l’analyse des données pour l’entraînement des modèles IA. Il utilise des Trusted Execution Environments (TEE) et des Zero-Knowledge Proofs (ZK Proofs) pour assurer la confidentialité et la vérification des données. Cette couche permet aux entreprises d’IA d’accéder aux données dans un TEE, ce qui améliore la confidentialité. |
Couche d’exécution | Fonctionne dans un environnement multi-blockchain pour faciliter l’échange de données et de valeur. Cela inclut l’enregistrement des attestations, la supervision du consensus parmi les vérificateurs, puis la distribution des récompenses aux fournisseurs de données tout en facturant les consommateurs de données. |
Couche de vérification | Inclut des nœuds validateurs assurant la décentralisation du protocole. Ces nœuds valident les attestations générées par le TEE avant de les enregistrer sur la blockchain. |
CARV Play est le produit phare de CARV Protocol. Il permet aux joueurs de découvrir des jeux via la plateforme et d’agréger leurs identifiants et accomplissements dans différents jeux sous forme de tokens Soulbound (SBT), des NFTs non transférables. D’un autre côté, les développeurs et studios de jeux peuvent exploiter les données du protocole pour mieux comprendre leur audience et optimiser la fidélisation des joueurs (ex. : analyse des performances post-événement, ciblage des profils de joueurs).
Le protocole permet aux utilisateurs de posséder, contrôler et monétiser leurs données. Grâce à CARV Play, les utilisateurs peuvent bénéficier de leurs contributions au développement de jeux et à la génération de données, à la fois passivement et activement. Ils peuvent choisir de partager leurs données historiques avec des marques et des jeux pour gagner des revenus passifs et, en même temps, obtenir des récompenses par une participation active à des campagnes et activités de jeu (par exemple, des enquêtes et des événements sur CARV Play).
De plus, en exploitant les CARV ID et en encourageant les utilisateurs à lier leurs comptes, CARV Protocol permet aux utilisateurs d’interagir à travers les plateformes Web2 et Web3 avec une identité numérique unifiée, améliorant l’interopérabilité. Par exemple, les utilisateurs peuvent lier leurs identifiants de jeu (Steam, CARV Play), leurs données issues des réseaux sociaux (X, Discord) et leurs activités Web3 (MetaMask) dans un cadre unifié et choisir de partager leur empreinte numérique. Ces données peuvent ensuite être utilisées par les entreprises d’IA pour entraîner des modèles visant à proposer des services personnalisés ou par les annonceurs pour créer des publicités ciblées.
En trois ans depuis son lancement, CARV Protocol a accumulé environ 9,5 millions de joueurs inscrits, avec plus de trois millions de CARV IDs émis. Son adoption dans l’industrie du jeu vidéo ne cesse de croître, attirant plus de 30 % des jeux Web3. De plus, le protocole a établi des partenariats stratégiques avec le secteur de l’intelligence artificielle. À l’avenir, la feuille de route de CARV comprend l’amélioration de son infrastructure, y compris des séquenceurs décentralisés et le stockage de données (CARV DB).
La couche modulaire de CARV et ses mesures visant à préserver la confidentialité des données attirent naturellement les utilisateurs souhaitant générer un revenu passif grâce à leurs données. D’un autre côté, les entreprises d’IA et les plateformes ont un besoin croissant de données pour se développer, ce qui positionne CARV Protocol comme un acteur clé pour accompagner la croissance des secteurs du jeu Web3 et de l’IA.
Avec l’essor de l’intelligence artificielle, le besoin de volumes de données toujours plus diversifiés et importants ne cesse d’augmenter, rendant les données des utilisateurs de plus en plus précieuses. Contrairement aux solutions Web2 traditionnelles, qui reposent sur un modèle centralisé, les data chains Web3 encouragent la transparence et une répartition équitable de la valeur des données.
Vana et CARV Protocol sont tous deux des exemples de protocoles Web3 qui permettent aux utilisateurs de posséder et de monétiser leurs données. Les Pools de Liquidité de Données et les DataDAOs de Vana ont révolutionné la gouvernance des données, tandis que la couche d’identité et de données modulaires de CARV Protocol agrège les données et les rend accessibles aux studios de jeux et aux entreprises d’IA. Ces deux projets incarnent un changement majeur vers la décentralisation dans la gestion des données et le développement de l’IA, mettant en avant l’autonomisation des utilisateurs et la protection de la vie privée à l’ère numérique.
Consultez le rapport complet : Chaînes de données AI
Vous souhaitez en savoir plus ? Accédez à des rapports exclusifs en vous inscrivant comme membre privé, en rejoignant notre programme VIP Crypto.com Exchange, ou en collectionnant un NFT Loaded Lions.
Équipe Crypto.com Research and Insights
Recevez les actualités les plus récentes du marché, DeFi & NFT directement dans votre boîte mail :
Soyez le premier à découvrir nos nouvelles analyses :
Obtenez votre guide étape par étape pour ouvrirun compte sur Crypto.com
En cliquant sur le bouton Soumettre, vous reconnaissez avoir lu l'Avis de confidentialité de Crypto.com où nous expliquons comment nous utilisons et protégeons vos données personnelles.