Evolución de la tecnología de indexación de datos en la cadena de bloques: de nodos originales a servicios de datos de cadena completa impulsados por IA
1. Introducción
Desde el inicio de las primeras aplicaciones descentralizadas en 2017, hasta ahora, donde florecen diversas aplicaciones financieras, de juegos y sociales en diferentes cadenas de bloques, ¿hemos pensado alguna vez en las fuentes de los diversos datos que utilizan estas aplicaciones en sus interacciones?
En 2024, la IA y Web3 se convierten en temas de actualidad. En el campo de la inteligencia artificial, los datos son como la fuente de vida para su crecimiento y evolución. Así como las plantas necesitan luz solar y agua para crecer fuertes, los sistemas de IA también dependen de grandes volúmenes de datos para "aprender" y "pensar" continuamente. Sin datos, incluso los algoritmos de IA más sofisticados no pueden desplegar la inteligencia y eficacia que se espera de ellos.
Este artículo analizará en profundidad la evolución del índice de datos de la cadena de bloques en el proceso de desarrollo de la industria desde la perspectiva de la accesibilidad de los datos de la cadena de bloques, y comparará los protocolos de índice de datos tradicionales con los nuevos protocolos de servicios de datos de la cadena de bloques, explorando especialmente las similitudes y diferencias en las características de los servicios de datos y la arquitectura de productos de los nuevos protocolos combinados con la tecnología de IA.
2. La complejidad y simplicidad del índice de datos: del nodo de la cadena de bloques a la base de datos de la cadena completa
2.1 Fuente de datos: Nodo de la cadena de bloques
La cadena de bloques se describe como un libro de contabilidad descentralizado. Los nodos de la cadena de bloques son la base de toda la red, responsables de registrar, almacenar y propagar todos los datos de transacciones en la cadena. Cada nodo tiene una copia completa de los datos de la cadena de bloques, asegurando la característica de descentralización de la red. Sin embargo, para los usuarios comunes, construir y mantener un nodo no es sencillo, ya que requiere habilidades técnicas especializadas y costos elevados.
Para resolver este problema, surgieron los proveedores de nodos de llamadas a procedimientos remotos (RPC). Estos proveedores son responsables de los costos y la gestión de los nodos, proporcionando datos a través de los puntos finales RPC. Los usuarios pueden acceder a los datos de la cadena de bloques sin necesidad de construir sus propios nodos. Aunque los puntos finales RPC públicos son gratuitos, tienen limitaciones de velocidad. Los puntos finales RPC privados ofrecen un mejor rendimiento, pero son ineficaces para consultas de datos complejas. La interfaz API estandarizada de los proveedores de nodos proporciona a los usuarios una barrera de entrada más baja para acceder a los datos en la cadena.
2.2 Análisis de datos: de datos prototipo a datos utilizables
Los datos obtenidos de los nodos de la cadena de bloques a menudo son datos en bruto que han sido procesados mediante cifrado y codificación. Aunque estos datos mantienen la integridad y seguridad de la cadena de bloques, su complejidad aumenta la dificultad de análisis de datos. Para los usuarios comunes o desarrolladores, manejar directamente estos datos prototípicos requiere una gran cantidad de conocimientos técnicos y recursos computacionales.
El proceso de análisis de datos se vuelve especialmente importante en este contexto. Al convertir datos prototipo complejos en un formato más comprensible y manejable, los usuarios pueden entender y utilizar estos datos de manera más intuitiva. El éxito o fracaso del análisis de datos determina directamente la eficiencia y efectividad de las aplicaciones de datos en la cadena de bloques, siendo un paso clave en todo el proceso de indexación de datos.
2.3 La evolución de los indexadores de datos
Con el aumento de la cantidad de datos de la cadena de bloques, la demanda de indexadores está en constante crecimiento. Los indexadores juegan un papel importante en la organización de los datos en la cadena y en su envío a la base de datos para facilitar las consultas. El funcionamiento de los indexadores consiste en indexar los datos de la cadena de bloques y hacerlos disponibles en cualquier momento a través de un lenguaje de consulta similar a SQL. Al proporcionar una interfaz de consulta unificada, los indexadores permiten a los desarrolladores recuperar rápidamente y con precisión la información necesaria utilizando un lenguaje de consulta estandarizado.
Diferentes tipos de indexadores optimizan la recuperación de datos de diversas maneras:
Indexador de nodo completo: extrae datos directamente de nodos completos de la cadena de bloques, asegurando que los datos sean completos y precisos, pero requiere una gran capacidad de almacenamiento y procesamiento.
Indexador ligero: se basa en nodos completos para obtener datos específicos según sea necesario, reduciendo los requisitos de almacenamiento pero puede aumentar el tiempo de consulta.
Indexador dedicado: optimiza la recuperación para ciertos tipos de datos o cadenas de bloques específicas en casos de uso concretos.
Agregador de índices: extrae datos de múltiples cadenas de bloques y fuentes, incluyendo información fuera de la cadena, y proporciona una interfaz de consulta unificada.
Actualmente, los protocolos de indexadores más utilizados no solo soportan la indexación de múltiples cadenas, sino que también han personalizado marcos de análisis de datos para las diferentes necesidades de datos de las aplicaciones.
La aparición de los indexadores ha mejorado significativamente la eficiencia de indexación y consulta de datos. En comparación con los puntos finales RPC tradicionales, los indexadores pueden indexar grandes volúmenes de datos de manera eficiente y admitir consultas de alta velocidad. Estos indexadores permiten a los usuarios realizar consultas complejas, filtrar datos fácilmente y analizar después de la extracción. Además, algunos indexadores también admiten la agregación de fuentes de datos de múltiples cadenas de bloques. Al ejecutarse de manera distribuida en múltiples nodos, los indexadores no solo proporcionan mayor seguridad y rendimiento, sino que también reducen el riesgo de interrupciones y tiempos de inactividad que pueden resultar de proveedores RPC centralizados.
2.4 Base de datos de toda la cadena: alineación prioritaria al flujo
El uso de nodos de índice para consultar datos generalmente significa que la API se convierte en el único portal para digerir datos en la cadena de bloques. Sin embargo, cuando los proyectos entran en la fase de expansión, a menudo se necesitan fuentes de datos más flexibles. A medida que las demandas de las aplicaciones se vuelven más complejas, los indexadores de datos primarios y su formato de índice estandarizado se vuelven cada vez más difíciles de satisfacer para las necesidades de consulta cada vez más diversas.
En la arquitectura moderna de tuberías de datos, el enfoque "prioridad de flujo" se ha convertido en una solución para abordar las limitaciones del procesamiento por lotes tradicional, permitiendo la ingestión, procesamiento y análisis de datos en tiempo real. El desarrollo de proveedores de servicios de datos de cadena de bloques también avanza en la dirección de construir flujos de datos de cadena de bloques, y los proveedores de servicios de indexación tradicionales han comenzado a lanzar productos que obtienen datos de cadena de bloques en tiempo real de manera de flujo de datos.
Estos servicios están diseñados para abordar la necesidad de analizar transacciones de la cadena de bloques en tiempo real y proporcionar una capacidad de consulta más completa. Al redefinir los desafíos de los datos en la cadena desde la perspectiva de los modernos canales de datos, podemos ver el manejo, almacenamiento y el potencial total de los datos en la cadena desde una nueva perspectiva.
3. ¿IA + Base de datos? Comparación profunda del protocolo de índice de datos
3.1 The Graph
La red The Graph implementa servicios de indexación y consulta de datos multichain a través de una red de nodos descentralizados, facilitando a los desarrolladores la indexación de datos de la cadena de bloques y la construcción de aplicaciones descentralizadas. Su principal modelo de producto es el mercado de ejecución de consultas de datos y el mercado de caché de indexación de datos.
Un subgrafo es una estructura de datos fundamental en la red The Graph, que define cómo extraer y convertir datos de la cadena de bloques en un formato que se puede consultar. Cualquiera puede crear un subgrafo, y múltiples aplicaciones pueden reutilizar estos subgrafos.
La red The Graph está compuesta por cuatro roles clave: indexadores, curadores, delegadores y desarrolladores, que juntos proporcionan soporte de datos para aplicaciones web3.
Actualmente, The Graph ha cambiado a un servicio de alojamiento de subgráficos completamente descentralizado, donde los incentivos económicos circulantes entre diferentes partes garantizan el funcionamiento del sistema.
Los productos de The Graph también están evolucionando rápidamente en la ola de la IA. Las herramientas AutoAgora, Allocation Optimizer y AgentC desarrolladas por Semiotic Labs mejoran el rendimiento del ecosistema en varios aspectos.
3.2 Chainbase
Chainbase es una red de datos de cadena completa que integra todos los datos de la cadena de bloques en una plataforma. Sus características únicas incluyen:
Lago de datos en tiempo real
Doble arquitectura de cadena
Estándar de formato de datos innovador
Modelo del mundo cripto
Estas funciones hacen que Chainbase se destaque en el protocolo de indexación de la cadena de bloques, con un enfoque especial en la accesibilidad de los datos en tiempo real, formatos de datos innovadores y la creación de modelos más inteligentes para mejorar la comprensión a través de la combinación de datos on-chain y off-chain.
El modelo de IA Theia de Chainbase es un punto destacado clave que lo diferencia de otros protocolos de servicios de datos. Theia se basa en el modelo DORA desarrollado por NVIDIA, combinando datos en cadena y fuera de cadena junto con actividades temporales y espaciales, para aprender y analizar patrones criptográficos y responder a través de inferencia causal.
3.3 Espacio y Tiempo
Space and Time (SxT) tiene como objetivo crear una capa de computación verificable, ampliando las pruebas de conocimiento cero sobre un almacén de datos descentralizado, para proporcionar un procesamiento de datos confiable para contratos inteligentes, modelos de lenguaje grande y empresas.
SxT ha introducido la tecnología Proof of SQL, que es una técnica innovadora de prueba de conocimiento cero, asegurando que las consultas SQL ejecutadas en un almacén de datos descentralizado sean a prueba de manipulaciones y verificables. Este enfoque transforma el consumo de recursos asociado con la indexación repetida de los mismos datos por múltiples nodos bajo el mecanismo de consenso, mejorando el rendimiento general del sistema.
SxT también colabora estrechamente con el laboratorio de innovación conjunta de Microsoft AI para acelerar el desarrollo de herramientas de IA generativa, facilitando a los usuarios el acceso a los datos de la Cadena de bloques a través del procesamiento de lenguaje natural.
Conclusión y perspectivas
La tecnología de indexación de datos de la cadena de bloques ha evolucionado desde las fuentes de datos de nodo iniciales, pasando por el desarrollo de la解析 de datos y el indexador, hasta llegar a los servicios de datos de toda la cadena potenciados por la IA, experimentando un proceso de mejora gradual. Esta evolución continua de la tecnología no solo ha aumentado la eficiencia y precisión del acceso a los datos, sino que también ha brindado a los usuarios una experiencia de inteligencia sin precedentes.
Con el continuo desarrollo de nuevas tecnologías como la inteligencia artificial y las pruebas de conocimiento cero, los servicios de datos de la cadena de bloques se volverán aún más inteligentes y seguros. Los servicios de datos de la cadena de bloques seguirán desempeñando un papel importante como infraestructura en el futuro, proporcionando un fuerte apoyo para el progreso y la innovación en la industria.
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
12 me gusta
Recompensa
12
5
Compartir
Comentar
0/400
RektCoaster
· hace13h
No tengo dinero para comerciar con criptomonedas, solo puedo acostarme y ver el espectáculo.
Ver originalesResponder0
SybilAttackVictim
· hace13h
Además de datos, solo hay datos.
Ver originalesResponder0
PortfolioAlert
· hace13h
¿Qué hay que decir sobre el índice? Los datos son la raíz.
Ver originalesResponder0
SleepyValidator
· hace13h
Bloquea lo que sea, solo escanea los datos y listo
Ver originalesResponder0
SorryRugPulled
· hace13h
¿De verdad piensas que la IA es una solución mágica?
Evolución del índice de datos de la cadena de bloques: de nodos a servicios de cadena completos impulsados por IA
Evolución de la tecnología de indexación de datos en la cadena de bloques: de nodos originales a servicios de datos de cadena completa impulsados por IA
1. Introducción
Desde el inicio de las primeras aplicaciones descentralizadas en 2017, hasta ahora, donde florecen diversas aplicaciones financieras, de juegos y sociales en diferentes cadenas de bloques, ¿hemos pensado alguna vez en las fuentes de los diversos datos que utilizan estas aplicaciones en sus interacciones?
En 2024, la IA y Web3 se convierten en temas de actualidad. En el campo de la inteligencia artificial, los datos son como la fuente de vida para su crecimiento y evolución. Así como las plantas necesitan luz solar y agua para crecer fuertes, los sistemas de IA también dependen de grandes volúmenes de datos para "aprender" y "pensar" continuamente. Sin datos, incluso los algoritmos de IA más sofisticados no pueden desplegar la inteligencia y eficacia que se espera de ellos.
Este artículo analizará en profundidad la evolución del índice de datos de la cadena de bloques en el proceso de desarrollo de la industria desde la perspectiva de la accesibilidad de los datos de la cadena de bloques, y comparará los protocolos de índice de datos tradicionales con los nuevos protocolos de servicios de datos de la cadena de bloques, explorando especialmente las similitudes y diferencias en las características de los servicios de datos y la arquitectura de productos de los nuevos protocolos combinados con la tecnología de IA.
2. La complejidad y simplicidad del índice de datos: del nodo de la cadena de bloques a la base de datos de la cadena completa
2.1 Fuente de datos: Nodo de la cadena de bloques
La cadena de bloques se describe como un libro de contabilidad descentralizado. Los nodos de la cadena de bloques son la base de toda la red, responsables de registrar, almacenar y propagar todos los datos de transacciones en la cadena. Cada nodo tiene una copia completa de los datos de la cadena de bloques, asegurando la característica de descentralización de la red. Sin embargo, para los usuarios comunes, construir y mantener un nodo no es sencillo, ya que requiere habilidades técnicas especializadas y costos elevados.
Para resolver este problema, surgieron los proveedores de nodos de llamadas a procedimientos remotos (RPC). Estos proveedores son responsables de los costos y la gestión de los nodos, proporcionando datos a través de los puntos finales RPC. Los usuarios pueden acceder a los datos de la cadena de bloques sin necesidad de construir sus propios nodos. Aunque los puntos finales RPC públicos son gratuitos, tienen limitaciones de velocidad. Los puntos finales RPC privados ofrecen un mejor rendimiento, pero son ineficaces para consultas de datos complejas. La interfaz API estandarizada de los proveedores de nodos proporciona a los usuarios una barrera de entrada más baja para acceder a los datos en la cadena.
2.2 Análisis de datos: de datos prototipo a datos utilizables
Los datos obtenidos de los nodos de la cadena de bloques a menudo son datos en bruto que han sido procesados mediante cifrado y codificación. Aunque estos datos mantienen la integridad y seguridad de la cadena de bloques, su complejidad aumenta la dificultad de análisis de datos. Para los usuarios comunes o desarrolladores, manejar directamente estos datos prototípicos requiere una gran cantidad de conocimientos técnicos y recursos computacionales.
El proceso de análisis de datos se vuelve especialmente importante en este contexto. Al convertir datos prototipo complejos en un formato más comprensible y manejable, los usuarios pueden entender y utilizar estos datos de manera más intuitiva. El éxito o fracaso del análisis de datos determina directamente la eficiencia y efectividad de las aplicaciones de datos en la cadena de bloques, siendo un paso clave en todo el proceso de indexación de datos.
2.3 La evolución de los indexadores de datos
Con el aumento de la cantidad de datos de la cadena de bloques, la demanda de indexadores está en constante crecimiento. Los indexadores juegan un papel importante en la organización de los datos en la cadena y en su envío a la base de datos para facilitar las consultas. El funcionamiento de los indexadores consiste en indexar los datos de la cadena de bloques y hacerlos disponibles en cualquier momento a través de un lenguaje de consulta similar a SQL. Al proporcionar una interfaz de consulta unificada, los indexadores permiten a los desarrolladores recuperar rápidamente y con precisión la información necesaria utilizando un lenguaje de consulta estandarizado.
Diferentes tipos de indexadores optimizan la recuperación de datos de diversas maneras:
Actualmente, los protocolos de indexadores más utilizados no solo soportan la indexación de múltiples cadenas, sino que también han personalizado marcos de análisis de datos para las diferentes necesidades de datos de las aplicaciones.
La aparición de los indexadores ha mejorado significativamente la eficiencia de indexación y consulta de datos. En comparación con los puntos finales RPC tradicionales, los indexadores pueden indexar grandes volúmenes de datos de manera eficiente y admitir consultas de alta velocidad. Estos indexadores permiten a los usuarios realizar consultas complejas, filtrar datos fácilmente y analizar después de la extracción. Además, algunos indexadores también admiten la agregación de fuentes de datos de múltiples cadenas de bloques. Al ejecutarse de manera distribuida en múltiples nodos, los indexadores no solo proporcionan mayor seguridad y rendimiento, sino que también reducen el riesgo de interrupciones y tiempos de inactividad que pueden resultar de proveedores RPC centralizados.
2.4 Base de datos de toda la cadena: alineación prioritaria al flujo
El uso de nodos de índice para consultar datos generalmente significa que la API se convierte en el único portal para digerir datos en la cadena de bloques. Sin embargo, cuando los proyectos entran en la fase de expansión, a menudo se necesitan fuentes de datos más flexibles. A medida que las demandas de las aplicaciones se vuelven más complejas, los indexadores de datos primarios y su formato de índice estandarizado se vuelven cada vez más difíciles de satisfacer para las necesidades de consulta cada vez más diversas.
En la arquitectura moderna de tuberías de datos, el enfoque "prioridad de flujo" se ha convertido en una solución para abordar las limitaciones del procesamiento por lotes tradicional, permitiendo la ingestión, procesamiento y análisis de datos en tiempo real. El desarrollo de proveedores de servicios de datos de cadena de bloques también avanza en la dirección de construir flujos de datos de cadena de bloques, y los proveedores de servicios de indexación tradicionales han comenzado a lanzar productos que obtienen datos de cadena de bloques en tiempo real de manera de flujo de datos.
Estos servicios están diseñados para abordar la necesidad de analizar transacciones de la cadena de bloques en tiempo real y proporcionar una capacidad de consulta más completa. Al redefinir los desafíos de los datos en la cadena desde la perspectiva de los modernos canales de datos, podemos ver el manejo, almacenamiento y el potencial total de los datos en la cadena desde una nueva perspectiva.
3. ¿IA + Base de datos? Comparación profunda del protocolo de índice de datos
3.1 The Graph
La red The Graph implementa servicios de indexación y consulta de datos multichain a través de una red de nodos descentralizados, facilitando a los desarrolladores la indexación de datos de la cadena de bloques y la construcción de aplicaciones descentralizadas. Su principal modelo de producto es el mercado de ejecución de consultas de datos y el mercado de caché de indexación de datos.
Un subgrafo es una estructura de datos fundamental en la red The Graph, que define cómo extraer y convertir datos de la cadena de bloques en un formato que se puede consultar. Cualquiera puede crear un subgrafo, y múltiples aplicaciones pueden reutilizar estos subgrafos.
La red The Graph está compuesta por cuatro roles clave: indexadores, curadores, delegadores y desarrolladores, que juntos proporcionan soporte de datos para aplicaciones web3.
Actualmente, The Graph ha cambiado a un servicio de alojamiento de subgráficos completamente descentralizado, donde los incentivos económicos circulantes entre diferentes partes garantizan el funcionamiento del sistema.
Los productos de The Graph también están evolucionando rápidamente en la ola de la IA. Las herramientas AutoAgora, Allocation Optimizer y AgentC desarrolladas por Semiotic Labs mejoran el rendimiento del ecosistema en varios aspectos.
3.2 Chainbase
Chainbase es una red de datos de cadena completa que integra todos los datos de la cadena de bloques en una plataforma. Sus características únicas incluyen:
Estas funciones hacen que Chainbase se destaque en el protocolo de indexación de la cadena de bloques, con un enfoque especial en la accesibilidad de los datos en tiempo real, formatos de datos innovadores y la creación de modelos más inteligentes para mejorar la comprensión a través de la combinación de datos on-chain y off-chain.
El modelo de IA Theia de Chainbase es un punto destacado clave que lo diferencia de otros protocolos de servicios de datos. Theia se basa en el modelo DORA desarrollado por NVIDIA, combinando datos en cadena y fuera de cadena junto con actividades temporales y espaciales, para aprender y analizar patrones criptográficos y responder a través de inferencia causal.
3.3 Espacio y Tiempo
Space and Time (SxT) tiene como objetivo crear una capa de computación verificable, ampliando las pruebas de conocimiento cero sobre un almacén de datos descentralizado, para proporcionar un procesamiento de datos confiable para contratos inteligentes, modelos de lenguaje grande y empresas.
SxT ha introducido la tecnología Proof of SQL, que es una técnica innovadora de prueba de conocimiento cero, asegurando que las consultas SQL ejecutadas en un almacén de datos descentralizado sean a prueba de manipulaciones y verificables. Este enfoque transforma el consumo de recursos asociado con la indexación repetida de los mismos datos por múltiples nodos bajo el mecanismo de consenso, mejorando el rendimiento general del sistema.
SxT también colabora estrechamente con el laboratorio de innovación conjunta de Microsoft AI para acelerar el desarrollo de herramientas de IA generativa, facilitando a los usuarios el acceso a los datos de la Cadena de bloques a través del procesamiento de lenguaje natural.
Conclusión y perspectivas
La tecnología de indexación de datos de la cadena de bloques ha evolucionado desde las fuentes de datos de nodo iniciales, pasando por el desarrollo de la解析 de datos y el indexador, hasta llegar a los servicios de datos de toda la cadena potenciados por la IA, experimentando un proceso de mejora gradual. Esta evolución continua de la tecnología no solo ha aumentado la eficiencia y precisión del acceso a los datos, sino que también ha brindado a los usuarios una experiencia de inteligencia sin precedentes.
Con el continuo desarrollo de nuevas tecnologías como la inteligencia artificial y las pruebas de conocimiento cero, los servicios de datos de la cadena de bloques se volverán aún más inteligentes y seguros. Los servicios de datos de la cadena de bloques seguirán desempeñando un papel importante como infraestructura en el futuro, proporcionando un fuerte apoyo para el progreso y la innovación en la industria.