O potencial da pista de dados de IA e a ascensão do Web3 DataFi
Na era em que o mundo compete para construir os melhores modelos básicos, a capacidade de computação e a arquitetura do modelo são, sem dúvida, importantes, mas a verdadeira defesa é o conjunto de dados de treinamento. O evento mais marcante do mês no círculo da IA foi o impressionante desempenho da Meta, que formou uma luxuosa equipe de IA composta principalmente por talentos de pesquisa chineses. O líder é Alexander Wang, que tem apenas 28 anos e fundou a Scale AI. A Scale AI atualmente é avaliada em 29 bilhões de dólares, fornecendo serviços de dados para várias gigantes da IA, incluindo o exército dos EUA, OpenAI, Anthropic e Meta.
A razão pela qual a Scale AI se destacou entre as muitas unicórnios é que ela percebeu cedo a importância dos dados na indústria de IA. Poder de computação, modelos e dados são os três pilares dos modelos de IA. Se compararmos um grande modelo a uma pessoa, então o modelo é o corpo, o poder de computação é a comida e os dados são o conhecimento e a informação.
Com o rápido desenvolvimento dos LLM, o foco da indústria tem mudado gradualmente dos modelos para o poder computacional, e atualmente a maioria dos modelos já estabeleceu o transformer como estrutura. Os principais gigantes estão ou construindo seus próprios clusters de supercomputação, ou assinando contratos de longo prazo com fornecedores de serviços em nuvem. Após resolverem as necessidades básicas de poder computacional, a importância dos dados tem se tornado cada vez mais evidente.
A Scale AI não se dedica apenas à exploração de dados existentes, mas também está a olhar para um negócio de geração de dados a longo prazo. A empresa está a tentar fornecer dados de treino de melhor qualidade para modelos de IA através de equipas de especialistas humanos de diferentes áreas.
O treinamento de modelos é dividido em duas fases: pré-treinamento e ajuste fino. O pré-treinamento é semelhante ao processo de uma criança aprendendo a falar, necessitando de uma grande quantidade de textos, códigos e outras informações coletadas da internet. O ajuste fino é como a educação escolar, com objetivos e direções claros. Consequentemente, os dados necessários também são divididos em duas categorias: uma que não requer muita manipulação, e outra que precisa de um design e seleção refinados para desenvolver habilidades específicas do modelo.
Com o aumento das capacidades dos modelos, vários conjuntos de dados de treinamento mais refinados e especializados se tornarão fatores-chave na capacidade dos modelos. A longo prazo, os dados de IA também representam uma pista com efeito bola de neve; à medida que o trabalho inicial se acumula, os ativos de dados terão a capacidade de gerar juros compostos, tornando-se cada vez mais valiosos com o tempo.
Web3 DataFi: O solo ideal para dados de IA
Comparado às empresas de dados tradicionais, o Web3 possui vantagens naturais no campo dos dados de IA, resultando no surgimento do novo conceito DataFi. As vantagens do Web3 DataFi manifestam-se principalmente nos seguintes aspectos:
Os contratos inteligentes garantem a soberania dos dados, segurança e privacidade
A arquitetura distribuída atrai a mão de obra mais adequada em todo o mundo
Mecanismos claros de incentivo e liquidação em blockchain
Construir um mercado de dados eficiente e aberto em um só lugar
Para os utilizadores comuns, DataFi é o projeto de IA descentralizada mais fácil de participar. Os utilizadores não precisam de um investimento em hardware caro ou de um background técnico especializado, apenas têm de participar através de tarefas simples, como fornecer dados, avaliar saídas de modelos, etc.
Projetos potenciais de DataFi Web3
Atualmente, vários projetos DataFi já obtiveram financiamento considerável, demonstrando um enorme potencial:
Sahara AI: dedicado a construir uma infraestrutura de IA descentralizada e um mercado de negociação
Yupp: Plataforma de feedback de modelos de IA, os usuários podem avaliar a qualidade de saída de diferentes modelos.
Vana: Transformar os dados pessoais dos usuários em ativos digitais monetizáveis
Chainbase: Focado em dados on-chain, cobre mais de 200 blockchains
Sapien: Transformar o conhecimento humano em dados de treino de IA de alta qualidade
Prisma X: Camada de coordenação aberta para robôs, focada na coleta de dados físicos
Masa: o principal projeto de sub-rede do ecossistema Bittensor, que oferece acesso a dados em tempo real.
Irys: Focado em armazenamento e computação de dados programáveis
ORO: Capacitar as pessoas comuns a participar na contribuição de IA
Gata: camada de dados descentralizada, que oferece várias ferramentas de coleta e processamento de dados
Embora esses projetos atualmente tenham barreiras baixas, as vantagens da plataforma se formarão rapidamente com a acumulação de usuários e a adesão ao ecossistema. No início, deve-se dar ênfase às medidas de incentivo e à experiência do usuário, a fim de atrair um número suficiente de usuários. Ao mesmo tempo, os promotores do projeto precisam considerar como gerenciar a mão de obra e garantir a qualidade dos dados, evitando a situação em que moedas ruins expulsam as boas.
Além disso, aumentar a transparência e acelerar o processo de descentralização também são desafios importantes enfrentados por esses projetos. A adoção em larga escala do DataFi requer a atração simultânea de usuários individuais e clientes empresariais mainstream, formando um ciclo ecológico completo.
DataFi representa o processo pelo qual a inteligência humana cultiva a inteligência das máquinas ao longo do tempo, enquanto garante, através de contratos inteligentes, os rendimentos do trabalho humano. Para aqueles que estão entusiasmados com a era da IA e que mantêm os ideais da blockchain, participar no DataFi é, sem dúvida, uma escolha sábia que acompanha a tendência.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
5 gostos
Recompensa
5
3
Republicar
Partilhar
Comentar
0/400
GateUser-40edb63b
· 6h atrás
28 anos e 29 bilhões, se você tem capacidade, não seja jovem.
Ver originalResponder0
StablecoinEnjoyer
· 6h atrás
Os dados são rei, ainda depende de talentos asiáticos.
Ver originalResponder0
BearMarketHustler
· 6h atrás
dados são a alma da IA, quem ainda se importa com Poder de computação?
Web3 DataFi: Análise de novas oportunidades e projetos potenciais na pista de dados de IA
O potencial da pista de dados de IA e a ascensão do Web3 DataFi
Na era em que o mundo compete para construir os melhores modelos básicos, a capacidade de computação e a arquitetura do modelo são, sem dúvida, importantes, mas a verdadeira defesa é o conjunto de dados de treinamento. O evento mais marcante do mês no círculo da IA foi o impressionante desempenho da Meta, que formou uma luxuosa equipe de IA composta principalmente por talentos de pesquisa chineses. O líder é Alexander Wang, que tem apenas 28 anos e fundou a Scale AI. A Scale AI atualmente é avaliada em 29 bilhões de dólares, fornecendo serviços de dados para várias gigantes da IA, incluindo o exército dos EUA, OpenAI, Anthropic e Meta.
A razão pela qual a Scale AI se destacou entre as muitas unicórnios é que ela percebeu cedo a importância dos dados na indústria de IA. Poder de computação, modelos e dados são os três pilares dos modelos de IA. Se compararmos um grande modelo a uma pessoa, então o modelo é o corpo, o poder de computação é a comida e os dados são o conhecimento e a informação.
Com o rápido desenvolvimento dos LLM, o foco da indústria tem mudado gradualmente dos modelos para o poder computacional, e atualmente a maioria dos modelos já estabeleceu o transformer como estrutura. Os principais gigantes estão ou construindo seus próprios clusters de supercomputação, ou assinando contratos de longo prazo com fornecedores de serviços em nuvem. Após resolverem as necessidades básicas de poder computacional, a importância dos dados tem se tornado cada vez mais evidente.
A Scale AI não se dedica apenas à exploração de dados existentes, mas também está a olhar para um negócio de geração de dados a longo prazo. A empresa está a tentar fornecer dados de treino de melhor qualidade para modelos de IA através de equipas de especialistas humanos de diferentes áreas.
O treinamento de modelos é dividido em duas fases: pré-treinamento e ajuste fino. O pré-treinamento é semelhante ao processo de uma criança aprendendo a falar, necessitando de uma grande quantidade de textos, códigos e outras informações coletadas da internet. O ajuste fino é como a educação escolar, com objetivos e direções claros. Consequentemente, os dados necessários também são divididos em duas categorias: uma que não requer muita manipulação, e outra que precisa de um design e seleção refinados para desenvolver habilidades específicas do modelo.
Com o aumento das capacidades dos modelos, vários conjuntos de dados de treinamento mais refinados e especializados se tornarão fatores-chave na capacidade dos modelos. A longo prazo, os dados de IA também representam uma pista com efeito bola de neve; à medida que o trabalho inicial se acumula, os ativos de dados terão a capacidade de gerar juros compostos, tornando-se cada vez mais valiosos com o tempo.
Web3 DataFi: O solo ideal para dados de IA
Comparado às empresas de dados tradicionais, o Web3 possui vantagens naturais no campo dos dados de IA, resultando no surgimento do novo conceito DataFi. As vantagens do Web3 DataFi manifestam-se principalmente nos seguintes aspectos:
Para os utilizadores comuns, DataFi é o projeto de IA descentralizada mais fácil de participar. Os utilizadores não precisam de um investimento em hardware caro ou de um background técnico especializado, apenas têm de participar através de tarefas simples, como fornecer dados, avaliar saídas de modelos, etc.
Projetos potenciais de DataFi Web3
Atualmente, vários projetos DataFi já obtiveram financiamento considerável, demonstrando um enorme potencial:
Embora esses projetos atualmente tenham barreiras baixas, as vantagens da plataforma se formarão rapidamente com a acumulação de usuários e a adesão ao ecossistema. No início, deve-se dar ênfase às medidas de incentivo e à experiência do usuário, a fim de atrair um número suficiente de usuários. Ao mesmo tempo, os promotores do projeto precisam considerar como gerenciar a mão de obra e garantir a qualidade dos dados, evitando a situação em que moedas ruins expulsam as boas.
Além disso, aumentar a transparência e acelerar o processo de descentralização também são desafios importantes enfrentados por esses projetos. A adoção em larga escala do DataFi requer a atração simultânea de usuários individuais e clientes empresariais mainstream, formando um ciclo ecológico completo.
DataFi representa o processo pelo qual a inteligência humana cultiva a inteligência das máquinas ao longo do tempo, enquanto garante, através de contratos inteligentes, os rendimentos do trabalho humano. Para aqueles que estão entusiasmados com a era da IA e que mantêm os ideais da blockchain, participar no DataFi é, sem dúvida, uma escolha sábia que acompanha a tendência.