Congreso Testing Day Ve 2023
Automatizando pruebas de calidad de datos
Usando great expectations en python explicar cómo se debe aplicar pruebas de migración de datos de manera automatizada.
Luis Carlos Marín Campos
Summary of «Automating Data Quality Tests» by Luis Carlos Marín Campos
In the talk «Automating Data Quality Tests» Luis Carlos Marín Campos introduces the world of Data Testing and how to automate it. He explores key concepts like Data Lake, Data Warehouse, and ETL (Extract, Transform, Load), fundamental to understanding the flow of data in an organization.
Data Lake and Data Warehouse
The Start and the Destination The Data Lake is a massive repository of raw data, where information from various sources is accumulated in its original format. In contrast, the Data Warehouse stores structured and processed data, ready for analysis and decision-making. ETL is the bridge between both, extracting data from the Data Lake, transforming it according to business rules, and loading it into the Data Warehouse.
ETL Testing
Ensuring the Quality of Data Flow ETL Testing verifies that the ETL process works correctly. This involves checking that data is extracted, transformed, and loaded without errors, that the formats are as expected, that the transformations are applied according to business rules, and that the data count is accurate.
Great Expectations
Simplified Automation The Great Expectations tool facilitates the automation of data quality tests. It allows you to define «expectations» (expectations) about the data, which are essentially test cases. These expectations can verify formats, values, counts, and transformations. Great Expectations generates detailed reports on the results of the tests.
user story and Practical Laboratory Marín Campos presents a real user story to illustrate how to apply Data Testing. An administrator of a bank web portal needs to generate a monthly report of balances for customers. The speaker demonstrates how to use Great Expectations to verify that the report meets the Acceptance criteria defined in the user story.
Key Takeaways
- Data Testing is crucial to ensure data quality and ensure that reports and analysis are accurate and reliable.
- Automation of Data Testing with tools like Great Expectations simplifies the process and allows errors to be detected early and efficiently.
This summary provides an overview of the key concepts and methodology presented in the talk. The use of examples and analogies facilitates the understanding of technical terms, making the topic accessible to testing professionals with different levels of experience.
Únete a las actividades que realizaremos
Resumen de «Automatizando pruebas de calidad de datos» por Luis Carlos Marín Campos
En la charla «Automatizando pruebas de calidad de datos», Luis Carlos Marín Campos introduce al mundo del Data Testing y cómo automatizarlo. Explora conceptos clave como Data Lake, Data Warehouse y ETL (Extraer, Transformar, Cargar), fundamentales para comprender el flujo de datos en una organización.
Data Lake y Data Warehouse: El inicio y el destino
El Data Lake es un repositorio masivo de datos sin procesar, donde se acumula información de diversas fuentes en su formato original. En contraste, el Data Warehouse almacena datos estructurados y procesados, listos para análisis y toma de decisiones. La ETL es el puente entre ambos, extrayendo datos del Data Lake, transformándolos según reglas de negocio y cargándolos en el Data Warehouse.
ETL Testing: Asegurando la calidad del flujo de datos
El ETL Testing verifica que el proceso de ETL funcione correctamente. Esto implica comprobar que los datos se extraen, transforman y cargan sin errores, que los formatos son los esperados, que las transformaciones se aplican según las reglas de negocio y que el conteo de datos es preciso.
Great Expectations: Automatización simplificada
La herramienta Great Expectations facilita la automatización de pruebas de calidad de datos. Permite definir «expectations» (expectativas) sobre los datos, que son esencialmente casos de prueba. Estas expectations pueden verificar formatos, valores, conteos y transformaciones. Great Expectations genera reportes detallados sobre los resultados de las pruebas.
Historia de usuario y laboratorio práctico
Marín Campos presenta una historia de usuario real para ilustrar cómo aplicar el Data Testing. Un administrador de un portal web bancario necesita generar un reporte mensual de balances para los clientes. El ponente demuestra cómo utilizar Great Expectations para verificar que el reporte cumple con los criterios de aceptación definidos en la historia de usuario.
El Data Testing es crucial para asegurar la calidad de los datos y garantizar que los reportes y análisis sean precisos y confiables.
La automatización del Data Testing con herramientas como Great Expectations simplifica el proceso y permite detectar errores de manera temprana y eficiente.
Este resumen proporciona una visión general de los conceptos clave y la metodología presentada en la charla. El uso de ejemplos y analogías facilita la comprensión de términos técnicos, haciendo que el tema sea accesible para profesionales de testing con diferentes niveles de experiencia.
Únete a las actividades que realizaremos
Luis Carlos Marín Campos
Testing Coach | SR QA/QC Automation Testing | Selenium | Serenity BDD | Robot framework | Java | Python | Cucumber | ETL Testing| Performance Testing | Lead Team| Embracing new challenges 🚀