Cadeias de dados de IA
À medida que a IA continua a crescer, ela precisa de mais dados gerados por usuários no treinamento de modelos, o que levanta preocupações sobre privacidade e controle de dados. Este relatório avalia o conceito de cadeia de dados de IA, com Vana e CARV Protocol como estudos de caso.

Disclaimer da Pesquisa
Disclaimer da Pesquisa e Insights da Crypto.com para relatórios de pesquisa
Sumário executivo
- Dados são essenciais para o desenvolvimento da inteligência artificial (IA). No entanto, existem problemas relacionados aos dados, incluindo qualidade de dados inconsistente, falta de transparência nas fontes de dados, problemas de privacidade e segurança de dados, bem como distribuição injusta de recompensas para os contribuidores de dados. A Web3 oferece soluções usando o registro digital imutável da blockchain para fornecer transparência. Além disso, a descentralização da Web3 melhora a segurança em áreas como governança e armazenamento.
- À medida que a IA continua a crescer, ela precisará de volumes maiores e mais diversos de dados gerados por usuários no treinamento de modelos. Isso levantou preocupações sobre a privacidade e o controle dos dados dos usuários.
- Existem vários projetos emergentes, incluindo Vana e CARV Protocol, que permitem aos usuários serem proprietários de seus próprios dados e obterem retornos por meio da ‘tokenização de dados‘.
- Vana é uma blockchain compatível com Ethereum Virtual Machine (EVM) Layer-1 para dados de usuários. Visa criar uma rede distribuída onde os usuários possam possuir, governar e ganhar com os modelos de IA aos quais contribuem.
- CARV visa construir a maior camada de identidade e dados modulares (IDL) que agrega dados e facilita o acesso para estúdios de jogos e empresas de IA. Desde 2022, CARV acumulou ~9,5 milhões de jogadores registrados, atraiu 30% dos jogos Web3 e promoveu parcerias estratégicas crescentes no setor de IA.
- Projetos emergentes na cadeia de dados de IA representam uma mudança significativa em direção à descentralização na gestão de dados e desenvolvimento de IA, enfatizando o empoderamento do usuário e a privacidade na era digital.
1. Introdução
Os dados são a força vital da inteligência artificial (IA), estabelecendo uma base crucial para que os algoritmos aprendam, gerem resultados e tomem decisões. No entanto, à medida que o setor de IA se tornou mais popular, alguns problemas foram descobertos nos processos de coleta e manuseio de dados:
- Qualidade dos Dados: Dados usados no treinamento de IA podem estar incompletos, mal organizados ou imprecisos, o que pode resultar em decisões erradas do modelo de IA. Por outro lado, a fragmentação dos dados também leva a problemas de qualidade de dados, pois os dados estão espalhados por vários sistemas e plataformas, resultando em repositórios de dados isolados e inconsistências.
- Falta de Transparência nas Fontes de Dados: Para que os usuários confiem nos modelos de IA, a capacidade de rastrear a fonte dos dados de treinamento é importante para explicar o algoritmo e aumentar a confiança nos resultados da IA.
- Privacidade e Segurança dos Dados: Os usuários frequentemente não possuem privacidade e controle sobre o uso e armazenamento de dados, onde os dados são coletados, usados ou potencialmente modificados por plataformas sem o consentimento dos usuários.
- Distribuição injusta de recompensas: Usuários geram dados a partir de suas atividades diárias e tráfego na web, mas as plataformas geralmente são as que monetizam os dados ou fazem acordos de licenciamento para “vender” os dados para treinamento.
Os problemas de dados mencionados acima não são novos. Vários projetos surgiram para resolver os problemas no treinamento de IA utilizando a tecnologia blockchain. Por exemplo, o Ocean Protocol foi projetado para destravar dados para IA fornecendo um mercado descentralizado onde proprietários de dados podem compartilhar e monetizar seus conjuntos de dados enquanto mantêm o controle sobre eles.
Além disso, vários projetos emergentes permitem que os usuários sejam os proprietários de seus próprios dados e obtenham retornos via “tokenização de dados”. Vana e CARV Protocol são dois exemplos, abordados abaixo. Também vimos um aumento na capitalização de mercado de setores, incluindo armazenamento descentralizado e big data de IA.
Problemas | Características da Web3 | Aplicações |
---|---|---|
Qualidade dos dados | Permitir que os dados permaneçam à prova de adulteração e validados | Verificar a autenticidade dos dados e garantir que os dados atendam a certos critérios antes de serem aceitos e usados no treinamento (ex.: Proof of Contribution da Vana) |
Falta de transparência na fonte de dados | O registro digital imutável da blockchain fornece transparência e rastreabilidade dos dados | Modelos de IA on-chain (por exemplo, Vana e Ora) trabalharam juntos para apoiar o lançamento do primeiro modelo de IA on-chain de propriedade do usuário usando conjuntos de dados do Reddit contribuídos por usuários para desenvolver um protótipo inicial de grande modelo de linguagem (LLM) |
Privacidade dos dados e segurança | Descentralização do armazenamento de dados e trilha de auditoria Governança de dados descentralizada | Uso de tecnologias como provas ZK e ambientes de execução confiáveis (TEEs) para verificar e validar dados sem revelar informações sensíveis. Governança de dados através de DAOs, onde os usuários podem votar no uso dos dados |
Distribuição injusta de recompensas | Facilitar a monetização permitindo o uso de dados pessoais para treinar IA | Usuários podem monetizar com base no que eles contribuem |
2. Vana
Vana, que se originou como um projeto de pesquisa em 2018, é uma blockchain compatível com a Máquina Virtual Ethereum (EVM) Layer-1 para dados pertencentes a usuários, que visa criar uma rede distribuída onde os usuários podem possuir, governar e gerar renda dos modelos de IA aos quais contribuem. Esta iniciativa é baseada na premissa de que os usuários devem ter controle sobre seus dados, que muitas vezes são mantidos por plataformas centralizadas, apesar de serem legalmente de propriedade deles.
2.1 Mecanismo
Abaixo estão alguns recursos-chave da Vana:
- Camada de liquidez de dados: Permite que os dados sejam validados, tokenizados e negociados como um ativo líquido. Ela hospeda pools de liquidez de dados (DLPs), que agregam dados com temas semelhantes (ex.: finanças, fitness, Reddit) em pools de liquidez descentralizados para consumidores de dados acessarem.
- Proof of Contribution: Um mecanismo que valida dados enquanto preserva a privacidade e garante que os dados adicionados aos DLPs são autênticos e de alta qualidade. Ele usa provas de Conhecimento Zero (ZK) para provar que os dados contribuídos atendem a certos critérios sem revelar o próprio conteúdo.
- Camada de portabilidade de dados: Uma camada de aplicação que permite que conjuntos de dados sejam compartilhados entre vários aplticativos descentralizados (dapps) e plataformas. Ela garante interoperabilidade, permitindo que os usuários mantenham o controle sobre os dados, governando como os dados são usados e compartilhados.
O fluxo de trabalho geral é descrito abaixo:
- Contribuintes de dados contribuem com dados para os DLPs. Subsequentemente, os dados são criptografados e armazenados off-chain em um local escolhido pelo DLP e representado por um URL.
- Os dados são validados através da Proof of Contribution. Após a validação, os colaboradores são recompensados com tokens VANA.
- Os dados são tokenizados, e consumidores de dados podem comprar acesso aos dados para várias aplicações (ex.: treinamento de modelos de IA) através da camada de portabilidade de dados.
2.2 DataDAO e exemplos
Uma característica chave na Vana é DataDAOs, o que permite descentralização na governança. Cada DLP possui um DAO governado por titulares de tokens DLP, que podem votar para decidir como os dados são usados e como as recompensas são distribuídas. Existem mais de 300 DataDAOs baseando-se na testnet da Vana. Espera-se que a Vana lance sua mainnet em breve, o que permitirá que os DataDAOs coletem ativamente dados da comunidade e melhorem a governança dos usuários.
Exemplos de DataDAO | Tema | Características | |
---|---|---|---|
r/datadao | Dados do Reddit | Permite que usuários conectem sua conta do Reddit, contribuam com dados para ganhar pontos e simultaneamente construam um conjunto de dados comunitário. O token nativo $RNAT é usado para a comunidade votar sobre o uso dos dados. Lançado pela primeira vez modelo de IA on-chain de propriedade do usuário junto com Vana e Ora — usando conjuntos de dados contribuídos pelos usuários do Reddit para desenvolver um protótipo inicial de LLM | |
Datapig | Estratégias de investimento | Coleta preferências de negociação dos usuários e dados de plataformas DeFi para análise. A análise de dados orientada por IA fornece insights de negociação aos traders. Os resultados da análise são apresentados em memes, GIFs e vídeos curtos para torná-los divertidos | |
Kleo Network | Histórico do navegador | Extensão de navegador que se integra às ações diárias na web para capturar conteúdos de páginas e interações. Os usuários podem ganhar pontos Kleo XP com base na inteligência e complexidade das atividades no navegador, enquanto mantêm o controle dos dados | |
Finquarium | Previsão financeira | Analistas compartilham previsões sobre qualquer ativo financeiro, que é verificado através do acompanhamento de desempenho para garantir qualidade e confiabilidade. Usuários podem comprar acesso aos insights usando tokens $FINQ, enquanto os contribuidores ganham recompensas |
Em suma, ao permitir que os usuários ganhem recompensas com base nos dados contribuídos, além de devolver a propriedade dos dados aos contribuintes, a Vana melhorou a transparência, integridade e equidade dos dados, o que também resolveu alguns dos pontos problemáticos no treinamento de modelos de IA mencionados acima.
3. CARV Protocol
Uma camada de identidade e dados modular (IDL), o Protocolo CARV facilita a troca de dados e distribuição de valor nos setores de jogos e IA. Abrange processos de fluxo de dados ponta a ponta, incluindo verificação de dados, autenticação de identidade, armazenamento, processamento, treinamento de modelos e distribuição de valor.
O CARV Protocol quer resolver o problema da fragmentação de dados no mundo digital atual, onde os dados estão espalhados pelo Web2 e Web3, bem como por várias blockchains, o que dificulta a interoperabilidade. Além disso, há uma falta de soberania de dados e proteção de privacidade sobre os dados do usuário.
O CARV Protocol fornece aos consumidores de dados (por exemplo, estúdios de jogos e empresas de IA) dados para treinamento e análise, enquanto preserva a privacidade e o controle dos contribuintes individuais de dados (por exemplo, jogadores).
3.1 Características principais
A camada de identidade e dados (IDL), uma estrutura para a gestão descentralizada de identidade e dados no ecossistema Web3, serve como a infraestrutura principal do CARV, permitindo aos usuários controlar e monetizar suas identidades e dados digitais. Sua estrutura de cinco camadas inclui:
Camadas | Descrição |
---|---|
Camada de identidade | CARV ID, o cerne do protocolo, é um sistema de identidade descentralizado que permite aos usuários estabelecer e gerenciar suas identidades digitais autonomamente. É um padrão de token EIP-7231 que vincula as identidades Web2 e Web3 dos indivíduos a tokens não-fungíveis (NFTs) e a soulbound tokens (SBTs). |
Camada de Armazenamento de Dados | Uma solução de armazenamento flexível e escalável com várias opções para eficiência de custos e necessidades de persistência. |
Camada de computação e treinamento | Processa e analisa dados para serem usados no treinamento de modelos de IA. Ela usa o ambiente de execução confiável (TEE) para oferecer atestações e provas ZK para verificação. Esta camada permite que empresas de IA acessem dados dentro de um TEE, o que melhora a privacidade. |
Camada de execução | Opera dentro de uma estrutura multichain e facilita a troca de dados e valores. Isso inclui o registro de atestações, supervisão do consenso entre verificadores e, posteriormente, a distribuição de recompensas para os provedores de dados enquanto cobra dos consumidores de dados. |
Camada de verificação | Consiste em nodes verificadores para garantir que o Protocolo CARV permaneça descentralizado. Nodes validam atestações geradas pelo TEE antes de registrá-las on-chain. |
3.2 Casos de uso
CARV Play é o principal produto do CARV Protocol, onde os jogadores não apenas descobrem jogos através da plataforma, mas também agregam suas credenciais e conquistas de jogos, que são representadas por NFTs intransferíveis, conhecidos como Soulbound Tokens. Por outro lado, desenvolvedores e estúdios de jogos podem acessar dados para adquirir e reter usuários (por exemplo, dados pós-evento ou perfis de jogadores direcionados).
O protocolo permite que os usuários possuam, controlem e monetizem seus dados. Através do CARV Play, os usuários podem se beneficiar de suas contribuições para o desenvolvimento de jogos e geração de dados, tanto passivamente quanto ativamente. Eles podem escolher compartilhar seus dados históricos com marcas e jogos para ganhar uma renda passiva e, ao mesmo tempo, ganhar recompensas pela participação ativa em campanhas e atividades de jogos (por exemplo, pesquisas e eventos no CARV Play).
Além disso, ao usar CARV IDs e encorajar os usuários a vincularem suas contas, o CARV Protocol permite que os usuários interajam em plataformas Web2 e Web3 com uma identidade digital unificada, aumentando a interoperabilidade. Por exemplo, os usuários podem vincular suas credenciais de jogos (Steam, CARV Play), dados de redes sociais (X, Discord) e atividades Web3 (MetaMask) em uma estrutura unificada e optar por compartilhar sua pegada digital. Esses dados podem então ser acessados por empresas de IA para treinamento a fim de desenvolver serviços personalizados para usuários ou por anunciantes para criar publicidade direcionada.
Nos três anos desde o seu lançamento, o CARV Protocol acumulou cerca de 9,5 milhões de jogadores registrados e mais de três milhões de CARV IDs mintados. Ele demonstrou maior adoção no setor de jogos ao atrair mais de 30% dos jogos Web3, bem como no setor de IA com parcerias estratégicas crescentes. No futuro, o roadmap do CARV inclui aprimorar sua infraestrutura, incluindo sequenciadores descentralizados e armazenamento de dados (CARV DB).
O IDL modular do CARV e as medidas aplicadas na preservação da privacidade dos dados naturalmente atraem usuários que desejam ganhar renda passiva com dados. Por outro lado, os dados são cada vez mais importantes para empresas e plataformas de IA crescerem, o que dá ao CARV Protocol o potencial de continuar capturando o crescimento nos jogos Web3 e IA.
4. Conclusão
À medida que a importância da IA continua a crescer, será necessário mais diversidade e maiores volumes de dados no treinamento, o que, por sua vez, aumenta o apelo dos dados dos usuários. Em contraste com as soluções de dados Web2 tradicionais, que tendem a ser centralizadas, as cadeias de dados Web3 promovem transparência e distribuição justa do valor dos dados.
Tanto a Vana quanto o CARV Protocol são exemplos de protocolos Web3 que permitem que os usuários possuam e monetizem seus dados. Os pools de liquidez de dados e DataDAOs da Vana revolucionaram a governança de dados, enquanto a camada modular de identidade e dados do CARV Protocol agrega dados e facilita o acesso para estúdios de jogos e empresas de IA. Ambos representam uma mudança significativa em direção à descentralização na gestão de dados e desenvolvimento de IA, enfatizando o empoderamento e a privacidade do usuário na era digital.
Leia o relatório completo: Cadeias de dados de IA
Quer saber mais? Acesse relatórios exclusivos cadastrando-se como um membro Private, aderindo ao nosso Programa VIP da Crypto.com Exchange ou colecionando umNFT Loaded Lions.
Autores
Equipe Crypto.com Research and Insights
Receba as últimas atualizações do mercado, DeFi & NFT diretamente na sua caixa de entrada:
Seja o primeiro a saber sobre novos insights:
Compartilhar com amigos
Artigos relacionados
Research Roundup Newsletter [March 2025]
Insights sobre gastos dos consumidores com cartão cripto 2024
Alpha Navigator: Quest for Alpha [March 2025]
Pronto para começar sua jornada cripto?
Receba o guia passo a passo para abriruma conta na Crypto.com
Ao clicar no botão Enviar, você reconhece que leu o Aviso de Privacidade da Crypto.com onde explicamos como usamos e protegemos seus dados pessoais.