Envío de datos con Vector
- ClickStack gestionado
- ClickStack de código abierto
La siguiente guía asume que ya ha creado un servicio de Managed ClickStack y ha anotado las credenciales del servicio. Si no lo ha hecho, siga la guía de Getting Started para Managed ClickStack hasta que se le indique configurar Vector.Cree una tabla para sus datos. Debe coincidir con el esquema de salida de estos. El ejemplo siguiente parte de una estructura clásica de Nginx. Ajústela según sus datos, siguiendo las buenas prácticas de esquema. Le recomendamos encarecidamente que se familiarice con el concepto de claves primarias y que seleccione su clave primaria según las directrices descritas aquí.Por defecto, recomendamos usar el formato
Crear una base de datos y una tabla
Vector requiere que la tabla y el esquema estén definidos antes de la ingestión de datos.Primero, cree una base de datos. Puede hacerlo desde la consola de ClickHouse Cloud.En el ejemplo siguiente, usamoslogs:Clave primaria de NginxLa clave primaria anterior asume patrones de acceso típicos en la UI de ClickStack para los logs de Nginx, pero puede ser necesario ajustarla según su carga de trabajo en entornos de producción.
Añade el sink de ClickHouse a la configuración de Vector
Modifica la configuración de Vector para incluir el sink de ClickHouse y actualiza el campoinputs para que reciba eventos de tus canalizaciones existentes.Esta configuración asume que tu pipeline previo de Vector ya ha preparado los datos para ajustarse al schema objetivo de ClickHouse, es decir, que los campos ya se han parseado, tienen los nombres correctos y los tipos adecuados para la inserción. Consulta el ejemplo de Nginx a continuación para ver una ilustración completa de cómo parsear y normalizar líneas de log sin procesar en un schema adecuado para ClickStack.json_each_row, que codifica cada evento como un único objeto JSON por fila. Este es el formato predeterminado y recomendado para ClickStack al ingestar datos JSON, y debe preferirse a formatos alternativos, como los objetos JSON codificados como cadenas.El sink de ClickHouse también admite codificación Arrow stream (actualmente en beta). Esto puede ofrecer un mayor rendimiento, pero conlleva restricciones importantes: la base de datos y la tabla deben ser estáticas, ya que el esquema se obtiene una sola vez al iniciar, y no se admite el enrutamiento dinámico. Por este motivo, la codificación Arrow es más adecuada para canalizaciones de ingestión fijas y bien definidas.Recomendamos revisar las opciones de configuración disponibles del sink en la documentación de Vector:El ejemplo anterior usa el usuario
default para Managed ClickStack. Para implementaciones de producción, recomendamos crear un usuario de ingestión dedicado con los permisos y límites adecuados.Accede a la UI de ClickStack
Accede a tu servicio Managed ClickStack y selecciona “ClickStack” en el menú de la izquierda. Si ya has completado el onboarding, se abrirá la UI de ClickStack en una pestaña nueva y se te autenticará automáticamente. Si no, puedes completar el onboarding y seleccionar “Launch ClickStack” una vez que hayas elegido Vector como fuente de entrada.Crear un origen de datos
Crea un origen de datos para logs. Si no existe ningún origen de datos, se te pedirá que crees uno al iniciar sesión por primera vez. De lo contrario, ve a configuración del equipo y añade un nuevo origen de datos.La configuración anterior asume un esquema de estilo Nginx con una columnatime_local usada como timestamp. Siempre que sea posible, esta debería ser la columna de timestamp declarada en la clave primaria. Esta columna es obligatoria.También recomendamos actualizar Default SELECT para definir explícitamente qué columnas se devuelven en la vista de logs. Si hay campos adicionales disponibles, como el nombre del servicio, el nivel de log o una columna body, también se pueden configurar. La columna de visualización del timestamp también se puede sobrescribir si es distinta de la columna usada en la clave primaria de la tabla y configurada anteriormente.En el ejemplo anterior, no existe una columna Body en los datos. En su lugar, se define mediante una expresión SQL que reconstruye una línea de log de Nginx a partir de los campos disponibles.Para ver otras opciones posibles, consulta la referencia de configuración.Explora los datos
Ve a la vista de logs para explorar los datos y empezar a usar ClickStack.Conjunto de datos de ejemplo con Vector
- ClickStack gestionado
- ClickStack Open Source
La siguiente guía asume que ya ha creado un servicio de Managed ClickStack y ha guardado las credenciales del servicio. Si aún no lo ha hecho, siga la guía de Getting Started para Managed ClickStack hasta que se le indique configurar Vector.Cree una tabla para sus datos.Esto reconstruye la línea de registro a partir de los campos estructurados.Para ver otras opciones posibles, consulta la referencia de configuración.
Instalación de Vector
Antes de continuar, asegúrese de que Vector esté instalado en el sistema donde planea ejecutar su pipeline de ingestión. Siga la guía oficial de instalación de Vector para instalar un binario precompilado o un paquete adecuado para su entorno:Una vez instalado, verifique que el binariovector esté disponible en su PATH antes de continuar con los pasos de configuración que se indican a continuación.Puede instalarlo en la misma instancia que su OTel collector de ClickStack.Siga las prácticas recomendadas de arquitectura y seguridad al poner Vector en producción.Descargar los datos de ejemplo
Si desea experimentar con un conjunto de datos de muestra, descargue el siguiente ejemplo de Nginx.Estos datos se han recopilado de una instancia de Nginx configurada para generar logs en formato JSON, lo que facilita su análisis. Para ver la configuración de Nginx para estos logs, consulta “Monitoring Nginx Logs with ClickStack”.
Crear una base de datos y una tabla
Vector requiere que se definan una tabla y un esquema antes de la ingestión de datos.Primero, cree una base de datos. Esto puede hacerse desde la consola de ClickHouse Cloud.Cree una base de datoslogs:Clave primaria de NginxLa clave primaria anterior se basa en patrones de acceso típicos en la UI de ClickStack para los logs de Nginx, pero puede ser necesario ajustarla en función de la carga de trabajo en entornos de producción.
Copiar la configuración de Vector
Copia la configuración de Vector y crea un archivonginx.yaml, donde debes establecer CLICKHOUSE_ENDPOINT y CLICKHOUSE_PASSWORD.El ejemplo anterior usa el usuario
default para Managed ClickStack. Para despliegues en producción, recomendamos crear un usuario de ingestión específico con los permisos y límites adecuados.Iniciar Vector
Inicie Vector con el siguiente comando y cree primero el directorio de datos para registrar los offsets de archivo.Ve a la UI de ClickStack
Ve a tu servicio de Managed ClickStack y selecciona “ClickStack” en el menú de la izquierda. Si ya has completado el onboarding, se abrirá la UI de ClickStack en una pestaña nueva y se te autenticará automáticamente. Si no, puedes completar el onboarding y seleccionar “Launch ClickStack” una vez que hayas elegido Vector como fuente de entrada.Crear un origen de datos
Crea un origen de datos de logs. Si no existe ningún origen de datos, se te pedirá que crees uno al iniciar sesión por primera vez. De lo contrario, ve a configuración del equipo y añade un nuevo origen de datos.La configuración asume el esquema de Nginx, con una columnatime_local utilizada como timestamp. Esta es la columna de timestamp declarada en la clave primaria. Esta columna es obligatoria.También hemos especificado como selección predeterminada time_local, remote_addr, status, request, lo que define qué columnas se devuelven en la vista de logs.En el ejemplo anterior, no existe una columna Body en los datos. En su lugar, se define como la expresión SQL:Explora los datos
Ve a la vista de búsqueda de20 de octubre de 2025 para explorar los datos y empezar a usar ClickStack.