[db.]table que coinciden con la expresión expr. Solo está disponible para la familia *MergeTree de motores de tabla.
Ejemplos
La eliminación ligera no elimina los datos inmediatamente
DELETE esperan a que se complete el marcado de las filas como eliminadas antes de devolver el control. Esto puede llevar mucho tiempo si la cantidad de datos es grande. Como alternativa, puede ejecutarse de forma asíncrona en segundo plano mediante la configuración lightweight_deletes_sync. Si está deshabilitada, la sentencia DELETE devolverá el control inmediatamente, pero los datos pueden seguir siendo visibles para las consultas hasta que finalice la mutación en segundo plano.
La mutación no elimina físicamente las filas que se han marcado como eliminadas; esto solo ocurrirá durante la siguiente fusión. Como resultado, es posible que, durante un período no especificado, los datos no se eliminen realmente del almacenamiento y solo queden marcados como eliminados.
Si necesita garantizar que sus datos se eliminen del almacenamiento en un plazo predecible, considere usar la configuración de tabla min_age_to_force_merge_seconds. O bien, puede usar el comando ALTER TABLE … DELETE. Tenga en cuenta que eliminar datos mediante ALTER TABLE ... DELETE puede consumir una cantidad significativa de recursos, ya que vuelve a crear todas las partes afectadas.
Eliminar grandes cantidades de datos
TRUNCATE TABLE.
Si prevé eliminaciones frecuentes, considere usar una clave de particionamiento personalizada. Después, puede usar el comando ALTER TABLE ... DROP PARTITION para eliminar rápidamente todas las filas asociadas a esa partición.
Limitaciones de la eliminación ligera
Eliminaciones ligeras con proyecciones
DELETE no funciona en tablas con proyecciones. Esto se debe a que las filas de una proyección pueden verse afectadas por una operación DELETE. Sin embargo, existe una configuración de MergeTree, lightweight_mutation_projection_mode, para cambiar este comportamiento.
Consideraciones de rendimiento al usar la eliminación ligera
- Una condición
WHEREcompleja en una consultaDELETE. - Si la cola de mutaciones está llena de muchas otras mutaciones, esto puede provocar problemas de rendimiento, ya que todas las mutaciones de una tabla se ejecutan secuencialmente.
- La tabla afectada tiene un número muy elevado de partes de datos.
- Tener muchos datos en partes compactas. En una parte compacta, todas las columnas se almacenan en un único archivo.
Permisos para DELETE
DELETE requiere el privilegio ALTER DELETE. Para habilitar sentencias DELETE en una tabla específica para un usuario concreto, ejecute el siguiente comando:
Cómo funciona internamente la eliminación ligera con DELETE en ClickHouse
-
Se aplica una “máscara” a las filas afectadas
Cuando se ejecuta una consulta
DELETE FROM table ..., ClickHouse guarda una máscara en la que cada fila queda marcada como “existente” o “eliminada”. Esas filas “eliminadas” se omiten en las consultas posteriores. Sin embargo, las filas no se eliminan físicamente hasta más adelante, durante las fusiones posteriores. Escribir esta máscara es mucho más ligero que lo que hace una consultaALTER TABLE ... DELETE. La máscara se implementa como una columna oculta del sistema,_row_exists, que almacenaTruepara todas las filas visibles yFalsepara las eliminadas. Esta columna solo está presente en una parte si se eliminaron algunas filas de esa parte. No existe cuando una parte tiene todos los valores iguales aTrue. -
Las consultas
SELECTse transforman para incluir la máscara Cuando se usa una columna enmascarada en una consulta, la consultaSELECT ... FROM table WHERE conditionse amplía internamente con el predicado sobre_row_existsy se transforma en:En tiempo de ejecución, se lee la columna_row_existspara determinar qué filas no deben devolverse. Si hay muchas filas eliminadas, ClickHouse puede determinar qué gránulos se pueden omitir por completo al leer el resto de las columnas. -
Las consultas
DELETEse transforman en consultasALTER TABLE ... UPDATEDELETE FROM table WHERE conditionse traduce en una mutaciónALTER TABLE table UPDATE _row_exists = 0 WHERE condition. Internamente, esta mutación se ejecuta en dos pasos:-
Se ejecuta un comando
SELECT count() FROM table WHERE conditionpara cada parte individual a fin de determinar si esa parte está afectada. -
A partir de los comandos anteriores, las partes afectadas se mutan y se crean hardlinks para las partes no afectadas. En el caso de las partes wide, se actualiza la columna
_row_existsde cada fila y los archivos del resto de columnas se enlazan mediante hardlinks. En el caso de las partes compactas, todas las columnas se vuelven a escribir porque se almacenan juntas en un solo archivo.
DELETEligero mejora el rendimiento frente al método tradicionalALTER TABLE ... DELETE, porque no vuelve a escribir todos los archivos de columnas de las partes afectadas. -
Se ejecuta un comando