
À medida que a IA continua a crescer, ela precisa de mais dados gerados por usuários no treinamento de modelos, o que levanta preocupações sobre privacidade e controle de dados. Este relatório avalia o conceito de cadeia de dados de IA, com Vana e CARV Protocol como estudos de caso.
Disclaimer da Pesquisa e Insights da Crypto.com para relatórios de pesquisa
Os dados são a força vital da inteligência artificial (IA), estabelecendo uma base crucial para que os algoritmos aprendam, gerem resultados e tomem decisões. No entanto, à medida que o setor de IA se tornou mais popular, alguns problemas foram descobertos nos processos de coleta e manuseio de dados:
Os problemas de dados mencionados acima não são novos. Vários projetos surgiram para resolver os problemas no treinamento de IA utilizando a tecnologia blockchain. Por exemplo, o Ocean Protocol foi projetado para destravar dados para IA fornecendo um mercado descentralizado onde proprietários de dados podem compartilhar e monetizar seus conjuntos de dados enquanto mantêm o controle sobre eles.
Além disso, vários projetos emergentes permitem que os usuários sejam os proprietários de seus próprios dados e obtenham retornos via “tokenização de dados”. Vana e CARV Protocol são dois exemplos, abordados abaixo. Também vimos um aumento na capitalização de mercado de setores, incluindo armazenamento descentralizado e big data de IA.
Problemas | Características da Web3 | Aplicações |
---|---|---|
Qualidade dos dados | Permitir que os dados permaneçam à prova de adulteração e validados | Verificar a autenticidade dos dados e garantir que os dados atendam a certos critérios antes de serem aceitos e usados no treinamento (ex.: Proof of Contribution da Vana) |
Falta de transparência na fonte de dados | O registro digital imutável da blockchain fornece transparência e rastreabilidade dos dados | Modelos de IA on-chain (por exemplo, Vana e Ora) trabalharam juntos para apoiar o lançamento do primeiro modelo de IA on-chain de propriedade do usuário usando conjuntos de dados do Reddit contribuídos por usuários para desenvolver um protótipo inicial de grande modelo de linguagem (LLM) |
Privacidade dos dados e segurança | Descentralização do armazenamento de dados e trilha de auditoria Governança de dados descentralizada | Uso de tecnologias como provas ZK e ambientes de execução confiáveis (TEEs) para verificar e validar dados sem revelar informações sensíveis. Governança de dados através de DAOs, onde os usuários podem votar no uso dos dados |
Distribuição injusta de recompensas | Facilitar a monetização permitindo o uso de dados pessoais para treinar IA | Usuários podem monetizar com base no que eles contribuem |
Vana, que se originou como um projeto de pesquisa em 2018, é uma blockchain compatível com a Máquina Virtual Ethereum (EVM) Layer-1 para dados pertencentes a usuários, que visa criar uma rede distribuída onde os usuários podem possuir, governar e gerar renda dos modelos de IA aos quais contribuem. Esta iniciativa é baseada na premissa de que os usuários devem ter controle sobre seus dados, que muitas vezes são mantidos por plataformas centralizadas, apesar de serem legalmente de propriedade deles.
Abaixo estão alguns recursos-chave da Vana:
O fluxo de trabalho geral é descrito abaixo:
Uma característica chave na Vana é DataDAOs, o que permite descentralização na governança. Cada DLP possui um DAO governado por titulares de tokens DLP, que podem votar para decidir como os dados são usados e como as recompensas são distribuídas. Existem mais de 300 DataDAOs baseando-se na testnet da Vana. Espera-se que a Vana lance sua mainnet em breve, o que permitirá que os DataDAOs coletem ativamente dados da comunidade e melhorem a governança dos usuários.
Exemplos de DataDAO | Tema | Características | |
---|---|---|---|
r/datadao | Dados do Reddit | Permite que usuários conectem sua conta do Reddit, contribuam com dados para ganhar pontos e simultaneamente construam um conjunto de dados comunitário. O token nativo $RNAT é usado para a comunidade votar sobre o uso dos dados. Lançado pela primeira vez modelo de IA on-chain de propriedade do usuário junto com Vana e Ora — usando conjuntos de dados contribuídos pelos usuários do Reddit para desenvolver um protótipo inicial de LLM | |
Datapig | Estratégias de investimento | Coleta preferências de negociação dos usuários e dados de plataformas DeFi para análise. A análise de dados orientada por IA fornece insights de negociação aos traders. Os resultados da análise são apresentados em memes, GIFs e vídeos curtos para torná-los divertidos | |
Kleo Network | Histórico do navegador | Extensão de navegador que se integra às ações diárias na web para capturar conteúdos de páginas e interações. Os usuários podem ganhar pontos Kleo XP com base na inteligência e complexidade das atividades no navegador, enquanto mantêm o controle dos dados | |
Finquarium | Previsão financeira | Analistas compartilham previsões sobre qualquer ativo financeiro, que é verificado através do acompanhamento de desempenho para garantir qualidade e confiabilidade. Usuários podem comprar acesso aos insights usando tokens $FINQ, enquanto os contribuidores ganham recompensas |
Em suma, ao permitir que os usuários ganhem recompensas com base nos dados contribuídos, além de devolver a propriedade dos dados aos contribuintes, a Vana melhorou a transparência, integridade e equidade dos dados, o que também resolveu alguns dos pontos problemáticos no treinamento de modelos de IA mencionados acima.
Uma camada de identidade e dados modular (IDL), o Protocolo CARV facilita a troca de dados e distribuição de valor nos setores de jogos e IA. Abrange processos de fluxo de dados ponta a ponta, incluindo verificação de dados, autenticação de identidade, armazenamento, processamento, treinamento de modelos e distribuição de valor.
O CARV Protocol quer resolver o problema da fragmentação de dados no mundo digital atual, onde os dados estão espalhados pelo Web2 e Web3, bem como por várias blockchains, o que dificulta a interoperabilidade. Além disso, há uma falta de soberania de dados e proteção de privacidade sobre os dados do usuário.
O CARV Protocol fornece aos consumidores de dados (por exemplo, estúdios de jogos e empresas de IA) dados para treinamento e análise, enquanto preserva a privacidade e o controle dos contribuintes individuais de dados (por exemplo, jogadores).
A camada de identidade e dados (IDL), uma estrutura para a gestão descentralizada de identidade e dados no ecossistema Web3, serve como a infraestrutura principal do CARV, permitindo aos usuários controlar e monetizar suas identidades e dados digitais. Sua estrutura de cinco camadas inclui:
Camadas | Descrição |
---|---|
Camada de identidade | CARV ID, o cerne do protocolo, é um sistema de identidade descentralizado que permite aos usuários estabelecer e gerenciar suas identidades digitais autonomamente. É um padrão de token EIP-7231 que vincula as identidades Web2 e Web3 dos indivíduos a tokens não-fungíveis (NFTs) e a soulbound tokens (SBTs). |
Camada de Armazenamento de Dados | Uma solução de armazenamento flexível e escalável com várias opções para eficiência de custos e necessidades de persistência. |
Camada de computação e treinamento | Processa e analisa dados para serem usados no treinamento de modelos de IA. Ela usa o ambiente de execução confiável (TEE) para oferecer atestações e provas ZK para verificação. Esta camada permite que empresas de IA acessem dados dentro de um TEE, o que melhora a privacidade. |
Camada de execução | Opera dentro de uma estrutura multichain e facilita a troca de dados e valores. Isso inclui o registro de atestações, supervisão do consenso entre verificadores e, posteriormente, a distribuição de recompensas para os provedores de dados enquanto cobra dos consumidores de dados. |
Camada de verificação | Consiste em nodes verificadores para garantir que o Protocolo CARV permaneça descentralizado. Nodes validam atestações geradas pelo TEE antes de registrá-las on-chain. |
CARV Play é o principal produto do CARV Protocol, onde os jogadores não apenas descobrem jogos através da plataforma, mas também agregam suas credenciais e conquistas de jogos, que são representadas por NFTs intransferíveis, conhecidos como Soulbound Tokens. Por outro lado, desenvolvedores e estúdios de jogos podem acessar dados para adquirir e reter usuários (por exemplo, dados pós-evento ou perfis de jogadores direcionados).
O protocolo permite que os usuários possuam, controlem e monetizem seus dados. Através do CARV Play, os usuários podem se beneficiar de suas contribuições para o desenvolvimento de jogos e geração de dados, tanto passivamente quanto ativamente. Eles podem escolher compartilhar seus dados históricos com marcas e jogos para ganhar uma renda passiva e, ao mesmo tempo, ganhar recompensas pela participação ativa em campanhas e atividades de jogos (por exemplo, pesquisas e eventos no CARV Play).
Além disso, ao usar CARV IDs e encorajar os usuários a vincularem suas contas, o CARV Protocol permite que os usuários interajam em plataformas Web2 e Web3 com uma identidade digital unificada, aumentando a interoperabilidade. Por exemplo, os usuários podem vincular suas credenciais de jogos (Steam, CARV Play), dados de redes sociais (X, Discord) e atividades Web3 (MetaMask) em uma estrutura unificada e optar por compartilhar sua pegada digital. Esses dados podem então ser acessados por empresas de IA para treinamento a fim de desenvolver serviços personalizados para usuários ou por anunciantes para criar publicidade direcionada.
Nos três anos desde o seu lançamento, o CARV Protocol acumulou cerca de 9,5 milhões de jogadores registrados e mais de três milhões de CARV IDs mintados. Ele demonstrou maior adoção no setor de jogos ao atrair mais de 30% dos jogos Web3, bem como no setor de IA com parcerias estratégicas crescentes. No futuro, o roadmap do CARV inclui aprimorar sua infraestrutura, incluindo sequenciadores descentralizados e armazenamento de dados (CARV DB).
O IDL modular do CARV e as medidas aplicadas na preservação da privacidade dos dados naturalmente atraem usuários que desejam ganhar renda passiva com dados. Por outro lado, os dados são cada vez mais importantes para empresas e plataformas de IA crescerem, o que dá ao CARV Protocol o potencial de continuar capturando o crescimento nos jogos Web3 e IA.
À medida que a importância da IA continua a crescer, será necessário mais diversidade e maiores volumes de dados no treinamento, o que, por sua vez, aumenta o apelo dos dados dos usuários. Em contraste com as soluções de dados Web2 tradicionais, que tendem a ser centralizadas, as cadeias de dados Web3 promovem transparência e distribuição justa do valor dos dados.
Tanto a Vana quanto o CARV Protocol são exemplos de protocolos Web3 que permitem que os usuários possuam e monetizem seus dados. Os pools de liquidez de dados e DataDAOs da Vana revolucionaram a governança de dados, enquanto a camada modular de identidade e dados do CARV Protocol agrega dados e facilita o acesso para estúdios de jogos e empresas de IA. Ambos representam uma mudança significativa em direção à descentralização na gestão de dados e desenvolvimento de IA, enfatizando o empoderamento e a privacidade do usuário na era digital.
Leia o relatório completo: Cadeias de dados de IA
Quer saber mais? Acesse relatórios exclusivos cadastrando-se como um membro Private, aderindo ao nosso Programa VIP da Crypto.com Exchange ou colecionando umNFT Loaded Lions.
Equipe Crypto.com Research and Insights
Receba as últimas atualizações do mercado, DeFi & NFT diretamente na sua caixa de entrada:
Seja o primeiro a saber sobre novos insights:
Receba o guia passo a passo para abriruma conta na Crypto.com
Ao clicar no botão Enviar, você reconhece que leu o Aviso de Privacidade da Crypto.com onde explicamos como usamos e protegemos seus dados pessoais.