Projetos Web3 com conceito de IA tornam-se alvos de atração de capital nos mercados primário e secundário.
As oportunidades do Web3 na indústria de IA manifestam-se em: usar incentivos distribuídos para coordenar o suprimento potencial na cauda longa ------ através de dados, armazenamento e computação; ao mesmo tempo, estabelecer um modelo de código aberto e um mercado descentralizado para Agentes de IA.
A IA na indústria Web3 tem como principais áreas de atuação a finança em cadeia (pagamentos em criptomoeda, transações, análise de dados) e o suporte ao desenvolvimento.
A utilidade do AI+Web3 manifesta-se na complementaridade entre os dois: o Web3 promete combater a centralização da AI, enquanto a AI promete ajudar o Web3 a expandir-se.
Introdução
Nos últimos dois anos, o desenvolvimento da IA parece ter sido acelerado, e o efeito borboleta provocado pelo Chatgpt não apenas abriu um novo mundo de inteligência artificial generativa, mas também gerou uma onda no Web3 do outro lado.
Sob a influência do conceito de IA, o aumento do financiamento no mercado de criptomoedas, que está mais lento, é evidente. Segundo estatísticas da mídia, apenas no primeiro semestre de 2024, um total de 64 projetos Web3+IA concluíram financiamento, sendo que o sistema operacional baseado em inteligência artificial Zyber365 alcançou o montante máximo de financiamento de 100 milhões de dólares na rodada A.
O mercado secundário está mais próspero, dados de um determinado site de agregação de criptomoedas mostram que, em pouco mais de um ano, o valor total de mercado da área de IA já alcançou 48,5 bilhões de dólares, com um volume de negociação de 24 horas próximo a 8,6 bilhões de dólares; os benefícios trazidos pelos avanços nas principais tecnologias de IA são evidentes, após o lançamento do modelo de texto para vídeo Sora da OpenAI, o preço médio do setor de IA aumentou em 151%; o efeito da IA também se espalhou para uma das áreas de captação de recursos em criptomoedas, os Memes: o primeiro conceito de MemeCoin de Agente de IA ------ GOAT rapidamente se tornou popular e alcançou uma valorização de 1,4 bilhões de dólares, gerando com sucesso uma onda de Memes de IA.
A pesquisa e os tópicos sobre AI+Web3 também estão bastante em alta, desde AI+Depin até AI Memecoin e, atualmente, AI Agent e AI DAO, a emoção de FOMO já não consegue acompanhar a velocidade da nova troca de narrativas.
AI+Web3, esta combinação de termos repleta de dinheiro quente, oportunidades e fantasias futuras, não pode deixar de ser vista como um casamento arranjado pelo capital; parece que é difícil distinguir sob este manto esplêndido se é o campo dos especuladores ou o crepúsculo da explosão do amanhecer?
Para responder a esta questão, uma reflexão crucial para ambos os lados é: ficará melhor com o outro? Será que se pode beneficiar dos padrões do outro? Neste artigo, também tentamos nos colocar nas costas dos pioneiros para examinar este padrão: como pode o Web3 desempenhar um papel em cada etapa da pilha de tecnologia de IA e o que a IA pode trazer de novo ao Web3?
Parte.1 Quais são as oportunidades do Web3 sob a pilha de IA?
Antes de abordar este tema, precisamos entender a pilha tecnológica dos grandes modelos de IA:
Usando uma linguagem mais simples para descrever todo o processo: o "grande modelo" é como o cérebro humano, em uma fase inicial, esse cérebro pertence a um bebê que acabou de chegar ao mundo, precisando observar e absorver uma enorme quantidade de informações do ambiente para entender este mundo, essa é a fase de "coleta" de dados; como os computadores não possuem a visão, audição e outros sentidos humanos, antes do treinamento, as grandes quantidades de informações não rotuladas do exterior precisam ser convertidas por meio de "pré-processamento" em um formato de informação que o computador possa entender e utilizar.
Após a entrada de dados, a IA construiu um modelo com capacidade de compreensão e previsão através do "treinamento", que pode ser visto como o processo em que um bebê gradualmente compreende e aprende sobre o mundo exterior. Os parâmetros do modelo são como as habilidades linguísticas de um bebê que estão constantemente sendo ajustadas durante o processo de aprendizagem. Quando o conteúdo aprendido começa a ser especializado, ou quando há interação com pessoas que fornecem feedback e correções, entra-se na fase de "ajuste fino" do grande modelo.
As crianças, à medida que crescem e aprendem a falar, podem entender o significado e expressar seus sentimentos e pensamentos em novas conversas. Essa fase é semelhante ao "raciocínio" dos grandes modelos de IA, onde o modelo pode prever e analisar novas entradas de linguagem e texto. Os bebês expressam sentimentos, descrevem objetos e resolvem vários problemas por meio da habilidade linguística, o que também é semelhante ao uso de grandes modelos de IA após a conclusão do treinamento em tarefas específicas, como classificação de imagens, reconhecimento de voz, entre outras.
E o Agente de IA está mais próximo da próxima forma do grande modelo ------ capaz de executar tarefas de forma independente e perseguir objetivos complexos, não apenas possui capacidade de raciocínio, mas também pode lembrar, planejar e interagir com o mundo usando ferramentas.
Atualmente, em resposta às dificuldades da IA em várias pilhas, o Web3 formou, de forma preliminar, um ecossistema interconectado e multifacetado, que abrange todas as fases do processo de modelo de IA.
Uma, Camada básica: Airbnb de poder computacional e dados
Poder de Cálculo
Atualmente, um dos maiores custos da IA é a potência computacional e a energia necessárias para treinar e inferir modelos.
Um exemplo é que o LLAMA3 da Meta precisa de 16.000 H100GPU produzidos pela NVIDIA (que é uma unidade de processamento gráfico de topo projetada para cargas de trabalho de inteligência artificial e computação de alto desempenho) para completar o treinamento em 30 dias. O preço unitário da versão de 80GB varia entre 30.000 a 40.000 dólares, o que requer um investimento em hardware de computação (GPU + chip de rede) de 400 a 700 milhões de dólares, enquanto o treinamento mensal consome 1,6 mil milhões de kilowatt-hora, com despesas de energia quase de 20 milhões de dólares por mês.
A descompressão do poder computacional de IA é precisamente uma das primeiras áreas de interseção entre o Web3 e a IA ------ DePin (Rede de Infraestrutura Física Descentralizada). Atualmente, um site de dados DePin já listou mais de 1400 projetos, entre os quais os projetos representativos de compartilhamento de poder computacional GPU incluem io.net, Aethir, Akash, Render Network, entre outros.
A lógica principal é a seguinte: a plataforma permite que indivíduos ou entidades com recursos de GPU ociosos contribuam com sua capacidade de computação de forma descentralizada e sem permissão, através de um mercado online de compradores e vendedores semelhante ao Uber ou ao Airbnb, aumentando a taxa de utilização dos recursos de GPU que não estão sendo plenamente utilizados. Os usuários finais também obtêm, assim, recursos de computação eficientes a um custo mais baixo; ao mesmo tempo, o mecanismo de staking garante que, se ocorrerem violações do mecanismo de controle de qualidade ou interrupções na rede, os provedores de recursos sofrerão as devidas penalizações.
As suas características são:
Reunir recursos de GPU ociosos: os fornecedores são principalmente operadores de centros de dados independentes de médio e pequeno porte, mineradoras de criptomoedas, etc., com recursos de computação excedentes, e o mecanismo de consenso para hardware de mineração é PoS, como máquinas de mineração FileCoin e ETH. Atualmente, também existem projetos dedicados a iniciar dispositivos com barreiras mais baixas, como o exolab, que utiliza MacBook, iPhone, iPad e outros dispositivos locais para estabelecer uma rede de computação para a inferência de grandes modelos.
Enfrentando o mercado de longa cauda da capacidade de cálculo de IA:
a. "Do ponto de vista técnico", o mercado de poder computacional descentralizado é mais adequado para etapas de inferência. O treinamento depende mais da capacidade de processamento de dados proporcionada por grandes clusters de GPUs, enquanto a inferência requer um desempenho de computação em GPU relativamente baixo, como a Aethir, que se concentra em trabalhos de renderização de baixa latência e aplicações de inferência de IA.
b. No que diz respeito à «demanda», os pequenos e médios utilizadores de capacidade computacional não treinarão os seus próprios grandes modelos, mas apenas optarão por otimizar e ajustar os poucos grandes modelos de topo. Estes cenários são naturalmente adequados para recursos computacionais ociosos distribuídos.
Propriedade descentralizada: O significado técnico da blockchain reside no fato de que os proprietários de recursos mantêm sempre o controle sobre os mesmos, ajustando-se de forma flexível às necessidades e ao mesmo tempo obtendo lucros.
Dados
Os dados são a base da IA. Sem dados, o cálculo é como uma erva-flutuante, completamente inútil, e a relação entre dados e modelos é como diz o velho ditado: "Garbage in, Garbage out". A quantidade de dados e a qualidade da entrada determinam a qualidade da saída do modelo final. Para o treinamento dos atuais modelos de IA, os dados determinam a capacidade linguística, a capacidade de compreensão, e até mesmo os valores e a humanização do modelo. Atualmente, as dificuldades na demanda por dados de IA concentram-se nas seguintes quatro áreas:
Fome de dados: o treinamento de modelos de IA depende de uma grande quantidade de dados de entrada. Dados públicos mostram que o número de parâmetros utilizados pela OpenAI para treinar o GPT-4 atingiu o nível de trilhões.
Qualidade dos dados: Com a integração da IA em vários setores, a atualidade dos dados, a diversidade dos dados, a especialização dos dados verticais e a incorporação de novas fontes de dados, como o sentimento nas redes sociais, impõem novos requisitos à sua qualidade.
Questões de privacidade e conformidade: Atualmente, vários países e empresas estão gradualmente percebendo a importância de conjuntos de dados de alta qualidade e estão impondo restrições à coleta de conjuntos de dados.
Custos elevados de processamento de dados: grande volume de dados e processos complexos. Dados públicos mostram que mais de 30% dos custos de pesquisa e desenvolvimento das empresas de IA são destinados à coleta e processamento de dados básicos.
Atualmente, as soluções web3 manifestam-se nas seguintes quatro áreas:
Coleta de dados: A disponibilidade de dados do mundo real que podem ser coletados gratuitamente está rapidamente se esgotando, e os gastos das empresas de IA com dados estão aumentando a cada ano. No entanto, ao mesmo tempo, esses gastos não estão retornando aos verdadeiros contribuidores de dados, enquanto as plataformas desfrutam inteiramente da criação de valor trazida pelos dados, como o Reddit, que gerou uma receita total de 203 milhões de dólares através de acordos de licenciamento de dados com empresas de IA.
Permitir que os usuários que realmente contribuem participem na criação de valor gerado pelos dados, assim como obter dados mais privados e valiosos de forma econômica através de redes distribuídas e mecanismos de incentivo, é a visão do Web3.
Grass é uma camada e rede de dados descentralizada, onde os usuários podem contribuir com largura de banda ociosa e tráfego de retransmissão ao executar nós Grass, a fim de capturar dados em tempo real de toda a Internet e receber recompensas em tokens;
Vana introduziu um conceito único de piscina de liquidez de dados (DLP), onde os usuários podem carregar seus dados pessoais (como histórico de compras, hábitos de navegação, atividades em redes sociais, etc.) para uma DLP específica e escolher de forma flexível se autorizam ou não o uso desses dados por terceiros específicos;
No PublicAI, os usuários podem usar #AI 或#Web3 como etiqueta de classificação no X e @PublicAI para realizar a coleta de dados.
Pré-processamento de dados: No processo de tratamento de dados da IA, devido ao fato de os dados coletados geralmente serem ruidosos e conterem erros, é necessário limpá-los e convertê-los em um formato utilizável antes de treinar o modelo, envolvendo tarefas repetitivas de padronização, filtragem e tratamento de valores ausentes. Esta fase é um dos poucos momentos manuais na indústria de IA, tendo gerado a profissão de anotador de dados. À medida que as exigências de qualidade dos dados aumentam para os modelos, o nível de exigência para os anotadores de dados também aumenta, e essa tarefa é naturalmente adequada para o mecanismo de incentivos descentralizados do Web3.
Atualmente, a Grass e a OpenLayer estão considerando a adição da rotulagem de dados a esta etapa crucial.
A Synesis propôs o conceito de "Train2earn", enfatizando a qualidade dos dados, permitindo que os usuários obtenham recompensas ao fornecer dados rotulados, comentários ou outras formas de input.
O projeto de marcação de dados Sapien gamifica as tarefas de marcação e permite que os usuários apostem pontos para ganhar mais pontos.
Privacidade e segurança dos dados: É importante esclarecer que privacidade e segurança dos dados são dois conceitos diferentes. A privacidade dos dados envolve o tratamento de dados sensíveis, enquanto a segurança dos dados protege as informações contra acesso, destruição e roubo não autorizados. Assim, as vantagens das tecnologias de privacidade do Web3 e os potenciais cenários de aplicação se manifestam em duas áreas: (1) Treinamento de dados sensíveis; (2) Colaboração de dados: vários proprietários de dados podem participar juntos do treinamento de IA, sem precisar compartilhar seus dados originais.
As tecnologias de privacidade mais comuns no Web3 atualmente incluem:
Ambiente de Execução Confiável ( TEE ), como Super Protocol;
Criptografia homomórfica completa (FHE), por exemplo, BasedAI, Fhenix.io ou Inco Network;
Tecnologias de conhecimento zero (zk), como o Reclaim Protocol que utiliza a tecnologia zkTLS, geram provas de conhecimento zero para o tráfego HTTPS, permitindo que os usuários importem com segurança dados de atividades, reputação e identidade de sites externos, sem expor informações sensíveis.
No entanto, atualmente este campo ainda está em estágio inicial, a maioria dos projetos ainda está em exploração, e um dos dilemas atuais é que os custos de computação são muito altos, alguns exemplos são:
zkML框
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
8 Curtidas
Recompensa
8
7
Compartilhar
Comentário
0/400
NestedFox
· 9h atrás
Já está a bombar? Agora todos os projetos estão a incorporar IA.
Ver originalResponder0
TokenToaster
· 9h atrás
É apenas uma especulação por imitação.
Ver originalResponder0
CryptoSurvivor
· 10h atrás
Esta onda está segura. Faça mais moedas relacionadas a IA.
Ver originalResponder0
GateUser-cff9c776
· 10h atrás
web3 ainda quer salvar a IA? A descentralização de Schrödinger
Ver originalResponder0
DaoGovernanceOfficer
· 10h atrás
*suspiro* empiricamente falando, isso é apenas teatro de descentralização 2.0
Ver originalResponder0
GasFeeWhisperer
· 10h atrás
O mundo crypto realmente está em todo o lado.
Ver originalResponder0
ShibaOnTheRun
· 10h atrás
É tão tentador, quem consegue resistir à sedução do dinheiro?
AI+Web3融合:explorar novas oportunidades de Poder de computação e dados descentralizados
AI+Web3: Torres e Praças
TL;DR
Projetos Web3 com conceito de IA tornam-se alvos de atração de capital nos mercados primário e secundário.
As oportunidades do Web3 na indústria de IA manifestam-se em: usar incentivos distribuídos para coordenar o suprimento potencial na cauda longa ------ através de dados, armazenamento e computação; ao mesmo tempo, estabelecer um modelo de código aberto e um mercado descentralizado para Agentes de IA.
A IA na indústria Web3 tem como principais áreas de atuação a finança em cadeia (pagamentos em criptomoeda, transações, análise de dados) e o suporte ao desenvolvimento.
A utilidade do AI+Web3 manifesta-se na complementaridade entre os dois: o Web3 promete combater a centralização da AI, enquanto a AI promete ajudar o Web3 a expandir-se.
Introdução
Nos últimos dois anos, o desenvolvimento da IA parece ter sido acelerado, e o efeito borboleta provocado pelo Chatgpt não apenas abriu um novo mundo de inteligência artificial generativa, mas também gerou uma onda no Web3 do outro lado.
Sob a influência do conceito de IA, o aumento do financiamento no mercado de criptomoedas, que está mais lento, é evidente. Segundo estatísticas da mídia, apenas no primeiro semestre de 2024, um total de 64 projetos Web3+IA concluíram financiamento, sendo que o sistema operacional baseado em inteligência artificial Zyber365 alcançou o montante máximo de financiamento de 100 milhões de dólares na rodada A.
O mercado secundário está mais próspero, dados de um determinado site de agregação de criptomoedas mostram que, em pouco mais de um ano, o valor total de mercado da área de IA já alcançou 48,5 bilhões de dólares, com um volume de negociação de 24 horas próximo a 8,6 bilhões de dólares; os benefícios trazidos pelos avanços nas principais tecnologias de IA são evidentes, após o lançamento do modelo de texto para vídeo Sora da OpenAI, o preço médio do setor de IA aumentou em 151%; o efeito da IA também se espalhou para uma das áreas de captação de recursos em criptomoedas, os Memes: o primeiro conceito de MemeCoin de Agente de IA ------ GOAT rapidamente se tornou popular e alcançou uma valorização de 1,4 bilhões de dólares, gerando com sucesso uma onda de Memes de IA.
A pesquisa e os tópicos sobre AI+Web3 também estão bastante em alta, desde AI+Depin até AI Memecoin e, atualmente, AI Agent e AI DAO, a emoção de FOMO já não consegue acompanhar a velocidade da nova troca de narrativas.
AI+Web3, esta combinação de termos repleta de dinheiro quente, oportunidades e fantasias futuras, não pode deixar de ser vista como um casamento arranjado pelo capital; parece que é difícil distinguir sob este manto esplêndido se é o campo dos especuladores ou o crepúsculo da explosão do amanhecer?
Para responder a esta questão, uma reflexão crucial para ambos os lados é: ficará melhor com o outro? Será que se pode beneficiar dos padrões do outro? Neste artigo, também tentamos nos colocar nas costas dos pioneiros para examinar este padrão: como pode o Web3 desempenhar um papel em cada etapa da pilha de tecnologia de IA e o que a IA pode trazer de novo ao Web3?
Parte.1 Quais são as oportunidades do Web3 sob a pilha de IA?
Antes de abordar este tema, precisamos entender a pilha tecnológica dos grandes modelos de IA:
Usando uma linguagem mais simples para descrever todo o processo: o "grande modelo" é como o cérebro humano, em uma fase inicial, esse cérebro pertence a um bebê que acabou de chegar ao mundo, precisando observar e absorver uma enorme quantidade de informações do ambiente para entender este mundo, essa é a fase de "coleta" de dados; como os computadores não possuem a visão, audição e outros sentidos humanos, antes do treinamento, as grandes quantidades de informações não rotuladas do exterior precisam ser convertidas por meio de "pré-processamento" em um formato de informação que o computador possa entender e utilizar.
Após a entrada de dados, a IA construiu um modelo com capacidade de compreensão e previsão através do "treinamento", que pode ser visto como o processo em que um bebê gradualmente compreende e aprende sobre o mundo exterior. Os parâmetros do modelo são como as habilidades linguísticas de um bebê que estão constantemente sendo ajustadas durante o processo de aprendizagem. Quando o conteúdo aprendido começa a ser especializado, ou quando há interação com pessoas que fornecem feedback e correções, entra-se na fase de "ajuste fino" do grande modelo.
As crianças, à medida que crescem e aprendem a falar, podem entender o significado e expressar seus sentimentos e pensamentos em novas conversas. Essa fase é semelhante ao "raciocínio" dos grandes modelos de IA, onde o modelo pode prever e analisar novas entradas de linguagem e texto. Os bebês expressam sentimentos, descrevem objetos e resolvem vários problemas por meio da habilidade linguística, o que também é semelhante ao uso de grandes modelos de IA após a conclusão do treinamento em tarefas específicas, como classificação de imagens, reconhecimento de voz, entre outras.
E o Agente de IA está mais próximo da próxima forma do grande modelo ------ capaz de executar tarefas de forma independente e perseguir objetivos complexos, não apenas possui capacidade de raciocínio, mas também pode lembrar, planejar e interagir com o mundo usando ferramentas.
Atualmente, em resposta às dificuldades da IA em várias pilhas, o Web3 formou, de forma preliminar, um ecossistema interconectado e multifacetado, que abrange todas as fases do processo de modelo de IA.
Uma, Camada básica: Airbnb de poder computacional e dados
Poder de Cálculo
Atualmente, um dos maiores custos da IA é a potência computacional e a energia necessárias para treinar e inferir modelos.
Um exemplo é que o LLAMA3 da Meta precisa de 16.000 H100GPU produzidos pela NVIDIA (que é uma unidade de processamento gráfico de topo projetada para cargas de trabalho de inteligência artificial e computação de alto desempenho) para completar o treinamento em 30 dias. O preço unitário da versão de 80GB varia entre 30.000 a 40.000 dólares, o que requer um investimento em hardware de computação (GPU + chip de rede) de 400 a 700 milhões de dólares, enquanto o treinamento mensal consome 1,6 mil milhões de kilowatt-hora, com despesas de energia quase de 20 milhões de dólares por mês.
A descompressão do poder computacional de IA é precisamente uma das primeiras áreas de interseção entre o Web3 e a IA ------ DePin (Rede de Infraestrutura Física Descentralizada). Atualmente, um site de dados DePin já listou mais de 1400 projetos, entre os quais os projetos representativos de compartilhamento de poder computacional GPU incluem io.net, Aethir, Akash, Render Network, entre outros.
A lógica principal é a seguinte: a plataforma permite que indivíduos ou entidades com recursos de GPU ociosos contribuam com sua capacidade de computação de forma descentralizada e sem permissão, através de um mercado online de compradores e vendedores semelhante ao Uber ou ao Airbnb, aumentando a taxa de utilização dos recursos de GPU que não estão sendo plenamente utilizados. Os usuários finais também obtêm, assim, recursos de computação eficientes a um custo mais baixo; ao mesmo tempo, o mecanismo de staking garante que, se ocorrerem violações do mecanismo de controle de qualidade ou interrupções na rede, os provedores de recursos sofrerão as devidas penalizações.
As suas características são:
Reunir recursos de GPU ociosos: os fornecedores são principalmente operadores de centros de dados independentes de médio e pequeno porte, mineradoras de criptomoedas, etc., com recursos de computação excedentes, e o mecanismo de consenso para hardware de mineração é PoS, como máquinas de mineração FileCoin e ETH. Atualmente, também existem projetos dedicados a iniciar dispositivos com barreiras mais baixas, como o exolab, que utiliza MacBook, iPhone, iPad e outros dispositivos locais para estabelecer uma rede de computação para a inferência de grandes modelos.
Enfrentando o mercado de longa cauda da capacidade de cálculo de IA:
a. "Do ponto de vista técnico", o mercado de poder computacional descentralizado é mais adequado para etapas de inferência. O treinamento depende mais da capacidade de processamento de dados proporcionada por grandes clusters de GPUs, enquanto a inferência requer um desempenho de computação em GPU relativamente baixo, como a Aethir, que se concentra em trabalhos de renderização de baixa latência e aplicações de inferência de IA.
b. No que diz respeito à «demanda», os pequenos e médios utilizadores de capacidade computacional não treinarão os seus próprios grandes modelos, mas apenas optarão por otimizar e ajustar os poucos grandes modelos de topo. Estes cenários são naturalmente adequados para recursos computacionais ociosos distribuídos.
Dados
Os dados são a base da IA. Sem dados, o cálculo é como uma erva-flutuante, completamente inútil, e a relação entre dados e modelos é como diz o velho ditado: "Garbage in, Garbage out". A quantidade de dados e a qualidade da entrada determinam a qualidade da saída do modelo final. Para o treinamento dos atuais modelos de IA, os dados determinam a capacidade linguística, a capacidade de compreensão, e até mesmo os valores e a humanização do modelo. Atualmente, as dificuldades na demanda por dados de IA concentram-se nas seguintes quatro áreas:
Fome de dados: o treinamento de modelos de IA depende de uma grande quantidade de dados de entrada. Dados públicos mostram que o número de parâmetros utilizados pela OpenAI para treinar o GPT-4 atingiu o nível de trilhões.
Qualidade dos dados: Com a integração da IA em vários setores, a atualidade dos dados, a diversidade dos dados, a especialização dos dados verticais e a incorporação de novas fontes de dados, como o sentimento nas redes sociais, impõem novos requisitos à sua qualidade.
Questões de privacidade e conformidade: Atualmente, vários países e empresas estão gradualmente percebendo a importância de conjuntos de dados de alta qualidade e estão impondo restrições à coleta de conjuntos de dados.
Custos elevados de processamento de dados: grande volume de dados e processos complexos. Dados públicos mostram que mais de 30% dos custos de pesquisa e desenvolvimento das empresas de IA são destinados à coleta e processamento de dados básicos.
Atualmente, as soluções web3 manifestam-se nas seguintes quatro áreas:
Permitir que os usuários que realmente contribuem participem na criação de valor gerado pelos dados, assim como obter dados mais privados e valiosos de forma econômica através de redes distribuídas e mecanismos de incentivo, é a visão do Web3.
Grass é uma camada e rede de dados descentralizada, onde os usuários podem contribuir com largura de banda ociosa e tráfego de retransmissão ao executar nós Grass, a fim de capturar dados em tempo real de toda a Internet e receber recompensas em tokens;
Vana introduziu um conceito único de piscina de liquidez de dados (DLP), onde os usuários podem carregar seus dados pessoais (como histórico de compras, hábitos de navegação, atividades em redes sociais, etc.) para uma DLP específica e escolher de forma flexível se autorizam ou não o uso desses dados por terceiros específicos;
No PublicAI, os usuários podem usar #AI 或#Web3 como etiqueta de classificação no X e @PublicAI para realizar a coleta de dados.
Atualmente, a Grass e a OpenLayer estão considerando a adição da rotulagem de dados a esta etapa crucial.
A Synesis propôs o conceito de "Train2earn", enfatizando a qualidade dos dados, permitindo que os usuários obtenham recompensas ao fornecer dados rotulados, comentários ou outras formas de input.
O projeto de marcação de dados Sapien gamifica as tarefas de marcação e permite que os usuários apostem pontos para ganhar mais pontos.
As tecnologias de privacidade mais comuns no Web3 atualmente incluem:
Ambiente de Execução Confiável ( TEE ), como Super Protocol;
Criptografia homomórfica completa (FHE), por exemplo, BasedAI, Fhenix.io ou Inco Network;
Tecnologias de conhecimento zero (zk), como o Reclaim Protocol que utiliza a tecnologia zkTLS, geram provas de conhecimento zero para o tráfego HTTPS, permitindo que os usuários importem com segurança dados de atividades, reputação e identidade de sites externos, sem expor informações sensíveis.
No entanto, atualmente este campo ainda está em estágio inicial, a maioria dos projetos ainda está em exploração, e um dos dilemas atuais é que os custos de computação são muito altos, alguns exemplos são: