Rantai Data AI
Seiring dengan makin berkembangnya AI, diperlukan lebih banyak data yang dihasilkan pengguna dalam pelatihan model, yang menimbulkan kekhawatiran akan privasi dan kontrol data. Laporan ini membahas konsep rantai data AI, dengan Vana dan CARV Protocol sebagai studi kasus.
Penafian Riset
Penafian Tim Riset dan Wawasan Crypto.com tentang laporan riset
Ringkasan Eksekutif
- Data adalah sumber utama pengembangan kecerdasan buatan (AI). Namun, ada beberapa masalah seputar data, seperti kualitas data yang tidak konsisten, sumber data yang tidak transparan, masalah privasi dan keamanan data, serta imbalan yang didistribusikan secara tidak adil kepada kontributor data. Demi transparansi, Web3 menyediakan solusi dengan menggunakan catatan digital imutabel (tidak terubahkan) pada blockchain. Selain itu, desentralisasi pada Web3 meningkatkan keamanan di area seperti tata kelola dan penyimpanan.
- Seiring dengan makin berkembangnya AI, diperlukan data yang lebih beragam dalam jumlah yang lebih besar yang dihasilkan pengguna dalam pelatihan model. Hal ini menimbulkan kekhawatiran akan privasi dan kontrol data pengguna.
- Ada beberapa proyek baru, termasuk Vana dan CARV Protocol, yang memungkinkan pengguna memiliki data sendiri dan memperoleh penghasilan melalui tokenisasi data.
- Vana adalah blockchain Layer-1 yang kompatibel dengan Mesin Virtual Ethereum (EVM) untuk data milik pengguna. Tujuannya untuk menciptakan jaringan terdistribusi tempat pengguna dapat memiliki, mengatur, dan menghasilkan pendapatan dari model AI tempat mereka berkontribusi.
- CARV bertujuan membangun lapisan identitas dan data (IDL) modular terbesar yang menggabungkan data agar mudah diakses oleh studio game dan perusahaan AI. Sejak 2022, CARV telah menggaet 9,5 juta pemain terdaftar, menarik 30% game Web3, dan mendorong kemitraan strategis di sektor AI yang terus berkembang.
- Proyek-proyek yang bermunculan dalam rantai data AI menunjukkan perubahan signifikan menuju desentralisasi dalam pengelolaan data dan pengembangan AI, yang menekankan pemberdayaan dan privasi pengguna pada era digital.
1. Pendahuluan
Data adalah sumber utama kecerdasan buatan (AI) dan merupakan fondasi yang sangat penting bagi algoritma untuk belajar, menghasilkan output, dan membuat keputusan. Namun, seiring dengan makin populernya sektor AI, ada beberapa masalah yang terungkap dalam proses pengumpulan dan penanganan data.
- Kualitas Data: Data yang digunakan dalam pelatihan AI mungkin tidak lengkap, tidak tertata, atau tidak akurat sehingga dapat menyebabkan model AI mengambil keputusan yang salah. Di sisi lain, fragmentasi data juga menimbulkan masalah kualitas data karena data tersebar di berbagai sistem dan platform sehingga menyebabkan repositori data terisolasi dan tidak konsisten.
- Sumber Data Tidak Transparan: Agar pengguna memercayai model AI, diperlukan kemampuan melacak sumber data pelatihan untuk menjelaskan algoritma dan meningkatkan kepercayaan pada output AI.
- Privasi dan Keamanan Data: Pengguna sering kali tidak memiliki privasi dan kontrol atas penggunaan dan penyimpanan data ketika data dikumpulkan, digunakan, atau mungkin dimodifikasi oleh platform tanpa persetujuan pengguna.
- Distribusi Imbalan Tidak Adil: Pengguna menghasilkan data dari aktivitas sehari-hari dan lalu lintas web, tetapi platform sering kali menjadi pihak yang memonetisasi data atau membuat kesepakatan lisensi untuk “menjual” data pelatihan.
Masalah data yang disebutkan di atas bukan hal baru; beberapa proyek bermunculan untuk memecahkan masalah dalam pelatihan AI dengan memanfaatkan teknologi blockchain. Ocean Protocol, misalnya, dirancang untuk membuka data bagi AI dengan menyediakan lokapasar terdesentralisasi tempat pemilik data dapat membagikan dan memonetisasi dataset mereka sambil tetap memegang kendali atas data tersebut.
Selain itu, beberapa proyek baru memungkinkan pengguna memiliki data sendiri dan memperoleh penghasilan melalui tokenisasi data. Vana dan CARV Protocol adalah dua contoh, yang akan kami bahas di bawah ini. Kami juga mengamati meningkatnya kapitalisasi pasar di berbagai sektor, termasuk penyimpanan terdesentralisasi dan big data AI.
Masalah | Karakteristik Web3 | Penerapan |
---|---|---|
Kualitas Data | Memungkinkan data tetap tervalidasi dan bebas dari gangguan | Memverifikasi keaslian data dan memastikan data memenuhi kriteria tertentu sebelum diterima dan digunakan dalam pelatihan (misalnya Proof of Contribution dari Vana) |
Sumber Data Tidak Transparan | Dengan catatan digital pada blockchain, yang imutabel (tidak terubahkan), data menjadi transparan dan dapat dilacak | Model AI on-chain (misalnya Vana dan Ora) bekerja sama mendukung peluncuran model AI on-chain pertama milik pengguna oleh DataDAO Reddit menggunakan dataset Reddit yang disumbangkan pengguna untuk mengembangkan prototipe awal model bahasa besar (LLM) |
Privasi dan Keamanan Data | Desentralisasi dalam penyimpanan data dan jejak audit tata kelola data terdesentralisasi | Penggunaan teknologi seperti bukti ZK dan trusted execution environment (TEE) untuk memverifikasi dan memvalidasi data tanpa mengungkapkan informasi sensitif tentang tata kelola data melalui DAO tempat pengguna dapat memberikan suara dalam penggunaan data |
Distribusi Imbalan Tidak Adil | Memfasilitasi monetisasi dengan mengizinkan penggunaan data pribadi untuk melatih AI | Pengguna dapat melakukan memonetisasi berdasarkan kontribusi mereka |
2. Vana
Vana, yang awalnya merupakan proyek penelitian pada 2018, adalah blockhain Layer-1 yang kompatibel dengan Mesin Virtual Ethereum (EVM) untuk data milik pengguna dengan tujuan menciptakan jaringan terdistribusi tempat pengguna dapat memiliki, memperoleh penghasilan, dan mengatur model AI tempat mereka berkontribusi. Inisiatif ini dibangun atas dasar bahwa pengguna harus memegang kendali atas data mereka, yang sering kali dipegang oleh platform terpusat meskipun secara hukum dimiliki oleh mereka.
2.1 Mekanisme
Berikut ini beberapa fitur utama Vana.
- Lapisan Likuiditas Data: Memungkinkan data divalidasi, ditokenisasi, dan diperjualbelikan seperti aset likuid. Lapisan ini berfungsi sebagai Pul Likuiditas Data (DLP), yang menggabungkan data dengan tema serupa (misalnya keuangan, kebugaran, Reddit) dalam pul likuiditas terdesentralisasi untuk diakses konsumen data.
- Proof-of-Contribution: Mekanisme yang memvalidasi data sekaligus menjaga privasi dan memastikan data yang ditambahkan ke DLP adalah asli dan berkualitas tinggi. Mekanisme ini menggunakan bukti Zero-Knowledge (ZK) untuk membuktikan bahwa kontribusi data memenuhi kriteria tertentu tanpa mengungkapkan kontennya.
- Lapisan Portabilitas Data: Lapisan aplikasi yang memungkinkan dataset dibagikan ke berbagai aplikasi terdesentralisasi (DApp) dan platform. Lapisan ini memastikan interoperabilitas sekaligus memungkinkan pengguna mempertahankan kendali atas data serta mengatur bagaimana data digunakan dan dibagikan.
Secara garis besar, alur kerjanya dapat dijelaskan sebagai berikut.
- Kontributor data memberikan data ke DLP. Selanjutnya, data dienkripsi dan disimpan secara off-chain di lokasi yang dipilih DLP berupa URL.
- Data divalidasi melalui Proof of Contribution. Setelah data divalidasi, kontributor mendapat imbalan berupa token VANA.
- Data ditokenisasi; konsumen data dapat membeli akses ke data tersebut untuk berbagai aplikasi (misalnya pelatihan model AI) melalui Lapisan Portabilitas Data.
2.2 DataDAO dan Beberapa Contoh
Fitur utama Vana adalah DataDAO, yang memungkinkan desentralisasi tata kelola. Setiap DLP memiliki DAO yang diatur oleh pemegang token DLP, yang dapat memberikan suara untuk memutuskan cara menggunakan data dan mendistribusikan imbalan. Ada lebih dari 300 DataDAO yang dibangun di testnet (jaringan uji) Vana. Vana diharapkan akan segera meluncurkan mainnet yang memungkinkan DataDAO secara aktif mengumpulkan data dari komunitas dan menyempurnakan tata kelola pengguna.
Contoh DataDAO | Tema | Fitur | |
---|---|---|---|
r/datadao | Data Reddit | Memungkinkan pengguna menghubungkan akun Reddit mereka, menyumbangkan data untuk mendapatkan poin, dan secara bersamaan membangun dataset milik komunitas. Token asli $RNAT digunakan komunitas untuk memberikan suara tentang penggunaan data, yang diluncurkan sebagai model AI on-chain pertama yang dimiliki pengguna bersama Vana dan Ora — menggunakan dataset Reddit sumbangan pengguna untuk mengembangkan prototipe awal LLM | |
Datapig | Strategi investasi | Mengumpulkan preferensi jual-beli pengguna dan data dari platform DeFi untuk melakukan analisis. Analisis data berbantuan AI memberikan wawasan perdagangan kepada trader. Hasil analisis disajikan dalam bentuk meme, GIF, dan video pendek agar menghibur | |
Kleo Network | Riwayat browser | Ekstensi browser yang terintegrasi dalam tindakan web sehari-hari untuk menangkap konten dan interaksi halaman. Pengguna bisa mendapatkan poin Kleo XP berdasarkan kecerdasan dan kompleksitas aktivitas browser sambil tetap menjaga kontrol data | |
Finquarium | Prediksi finansial | Analis membagikan prediksi tentang aset keuangan, yang terverifikasi melalui pelacakan kinerja untuk memastikan kualitas dan keandalannya. Pengguna dapat membeli akses ke wawasan menggunakan token $FINQ, sedangkan kontributor mendapatkan imbalan |
Pada hakikatnya, dengan memungkinkan pengguna menghasilkan imbalan berdasarkan data yang disumbangkan serta mengembalikan kepemilikan data kepada kontributor, Vana telah meningkatkan transparansi, integritas, dan keadilan data; juga telah mengatasi sejumlah kendala dalam pelatihan model AI sebagaimana disebutkan di atas.
3. CARV Protocol
Sebagai lapisan identitas dan data (IDL) modular, CARV Protocol memfasilitasi pertukaran data dan distribusi nilai di sektor game dan AI. Protokol ini mencakup proses aliran data secara menyeluruh (end-to-end), termasuk verifikasi data, autentikasi identitas, penyimpanan, pemrosesan, pelatihan model, dan distribusi nilai.
CARV Protocol ingin mengatasi masalah fragmentasi data di dunia digital dewasa ini, yang menghambat interoperabilitas karena datanya tersebar di Web2 dan Web3 serta beberapa blockchain. Selain itu, kedaulatan data dan pelindungan privasi atas data pengguna kurang memadai.
CARV Protocol menyediakan data pelatihan dan analisis untuk konsumen data (misalnya studio game dan perusahaan AI) sekaligus menjaga privasi dan kontrol terhadap kontributor data individu (misalnya gamer).
3.1 Fitur-Fitur Utama
Lapisan identitas dan data (IDL), kerangka kerja untuk manajemen identitas dan data terdesentralisasi dalam ekosistem Web3, berfungsi sebagai infrastruktur utama CARV yang memungkinkan pengguna mengontrol dan memonetisasi identitas dan data digital mereka. Berikut ini kerangka kerja kelima lapisan tersebut.
Lapisan | Keterangan |
---|---|
Lapisan Identitas | CARV ID, inti protokol, adalah sistem identitas terdesentralisasi yang memungkinkan pengguna menyiapkan dan mengelola identitas digital secara mandiri. Ini adalah standar token EIP-7231 yang mengikat identitas Web2 dan Web3 individu ke token nonfungibel (NFT) dan token Soulbound (SBT). |
Lapisan Penyimpanan Data | Solusi penyimpanan yang fleksibel dan terskalakan dengan berbagai pilihan untuk penghematan biaya dan kebutuhan akan keberlanjutan. |
Lapisan Komputasi dan Pelatihan | Memproses dan menganalisis data yang akan digunakan dalam pelatihan model AI. Lapisan ini menggunakan trusted execution environment (TEE) yang menfasilitasi pengesahan dan verifikasi bukti ZK. Dengan lapisan ini, perusahaan AI dapat mengakses data dalam TEE untuk meningkatkan privasi. |
Lapisan Eksekusi | Beroperasi dalam kerangka kerja multirantai serta memfasilitasi pertukaran data dan nilai. Ini termasuk mencatat pengesahan, mengawasi konsensus di antara para verifikator, dan selanjutnya mendistribusikan imbalan kepada penyedia data, serta mengenakan biaya kepada konsumen data. |
Lapisan Verifikasi | Lapisan ini terdiri atas node verifikator yang memastikan CARV Protocol tetap terdesentralisasi. Node memvalidasi pengesahan yang dihasilkan TEE sebelum dicatat secara on-chain. |
3.2 Kasus Penggunaan
CARV Play adalah produk utama CARV Protocol, di sini gamer tidak hanya menemukan permainan melalui platform, tetapi juga menggabungkan kredensial dan capaian game mereka dalam berbagai game berupa NFT yang tidak dapat dipindahtangankan, yang dikenal sebagai Token Soulbound. Di sisi lain, pengembang dan studio game dapat mengakses wawasan data untuk menggaet dan mempertahankan pengguna (misalnya data pasca-acara atau profil gamer yang ditargetkan).
Protokol ini memungkinkan pengguna memiliki, mengontrol, dan memonetisasi data. Melalui CARV Play, pengguna mendapatkan manfaat atas kontribusi mereka dalam pengembangan game dan pembuatan data, baik secara pasif maupun aktif. Mereka dapat memilih membagikan data historis berikut merek dan game untuk menghasilkan pendapatan pasif sekaligus mendapatkan reward melalui partisipasi aktif dalam berbagai kampanye dan aktivitas permainan (misalnya survei dan acara di CARV Play).
Selain itu, dengan memanfaatkan CARV ID dan mendorong pengguna untuk menghubungkan akun mereka, CARV Protocol memungkinkan pengguna berinteraksi di berbagai platform Web2 dan Web3 dengan identitas digital terpadu serta meningkatkan interoperabilitas. Misalnya, pengguna dapat menghubungkan kredensial game mereka (Steam, CARV Play), data media sosial (X, Discord), dan aktivitas Web3 (MetaMask) dalam kerangka terpadu, serta memilih untuk membagikan jejak digital mereka. Selanjutnya, data ini dapat diakses oleh perusahaan pelatihan AI untuk mengembangkan personalisasi layanan bagi pengguna atau oleh pengiklan untuk membuat target iklan.
Dalam tiga tahun sejak diluncurkan, CARV Protocol telah menggaet sekitar 9,5 juta pemain terdaftar dengan lebih dari tiga juta CARV ID yang sudah dicetak. Protokol ini telah menunjukkan peningkatan adopsi di sektor game dengan menarik lebih dari 30% game Web3, juga di sektor AI dengan kemitraan strategis yang terus berkembang. Nantinya, peta jalan CARV akan mencakup penyempurnaan infrastruktur, termasuk pengurutan dan penyimpanan data (CARV DB) terdesentralisasi.
IDL modular CARV dan langkah-langkah yang diterapkan dalam menjaga privasi data secara alami menarik bagi pengguna yang ingin menghasilkan pendapatan pasif dari data. Di sisi lain, data makin diperlukan perusahaan AI dan platform agar berkembang sehingga CARV Protocol dapat terus memanfaatkan potensi pertumbuhan game Web3 dan AI.
4. Simpulan
Seiring dengan makin pentingnya AI, diperlukan data yang lebih beragam dalam jumlah lebih besar untuk pelatihan, yang pada gilirannya akan meningkatkan daya tarik data pengguna. Berbeda dengan solusi data Web2 tradisional, yang cenderung terpusat, rantai data Web3 meningkatkan transparansi dan melakukan distribusi nilai data secara lebih adil.
Vana dan CARV Protocol adalah contoh protokol Web3 yang memungkinkan pengguna memiliki dan memonetisasi data. Pul Likuiditas Data dan DataDAO Vana telah merevolusi tata kelola data sementara lapisan identitas dan data modular CARV Protocol menggabungkan data agar mudah diakses oleh studio game dan perusahaan AI. Keduanya menunjukkan perubahan signifikan menuju desentralisasi dalam pengelolaan data dan pengembangan AI yang menekankan pemberdayaan dan privasi pengguna pada era digital.
Baca laporan selengkapnya: Rantai Data AI
Ingin tahu lebih lanjut? Akses berbagai laporan eksklusif dengan mendaftar sebagai anggota Privat, mengikuti Program VIP Crypto.com Exchange, atau mengoleksi NFT Loaded Lions.
Penulis
Tim Riset dan Wawasan Crypto.com
Dapatkan info pasar, DeFi, dan NFT terkini yang dikirim ke kotak masuk Anda:
Jadilah orang pertama yang menyimak wawasan terbaru:
Bagikan ke Teman
Artikel Terkait
Research Roundup Newsletter [March 2025]
Wawasan Belanja Konsumen Kartu Kripto 2024
Alpha Navigator: Quest for Alpha [March 2025]
Siap memulai perjalanan kripto Anda?
Dapatkan panduan langkah demi langkah untuk menyiapkanakun Crypto.com
Dengan mengeklik tombol Kirim, saya menyatakan telah membaca Pemberitahuan Privasi Crypto.com tempat kami menjelaskan cara kami menggunakan dan melindungi data pribadi Anda.