Job Role: Google Cloud Platform Data Engineer
Location: Detroit, MI
Hire-type: Contract
Experience: 3โ6 yearsย |ย Detroit, MI (mandatory) โ Remote up to 50% travelย
Python
Google Cloud Platform Native
BigQuery
ETL / ELT Pipelines
Data Modeling
SQL
ABOUT THE ROLE
As a Google Cloud Platform Data Engineer at DataFactZ you will design, build, and maintain cloud-native data pipelines and data warehouse solutions on Google Cloud. Working closely with data architects and analytics teams, you will deliver reliable ingestion, transformation, and serving pipelines that power enterprise reporting, analytics, and data products โ handling structured and semi-structured data at scale using Python and Google Cloud Platform-native tooling.
ย
KEY RESPONSIBILITIES
โขย ย ย ย ย ย Build and maintain Python-based ETL/ELT pipelines for ingesting and transforming structured (BigQuery, Cloud SQL, Spanner) and semi-structured (JSON, Avro, Parquet, CSV) data on Google Cloud Platform
โขย ย ย ย ย ย Develop batch and streaming data pipelines using Dataflow (Apache Beam) and Dataproc (PySpark) for large-scale data processing workloads
โขย ย ย ย ย ย Implement data models in BigQuery including star schema, snowflake, and flat wide-table designs with appropriate partitioning and clustering
โขย ย ย ย ย ย Write complex BigQuery SQL transformations, stored procedures, and scheduled queries for data warehouse population and aggregation layers
โขย ย ย ย ย ย Build and maintain dbt models for transformation layer development, testing, and documentation within BigQuery
โขย ย ย ย ย ย Orchestrate multi-step pipeline workflows using Cloud Composer (Airflow), handling dependencies, retries, and alerting
โขย ย ย ย ย ย Ingest data from diverse sources including APIs, relational databases (Cloud SQL, AlloyDB), flat files, and streaming topics (Pub/Sub)
โขย ย ย ย ย ย Monitor pipeline health, optimize query performance and costs in BigQuery, debug failures, and support production deployments
โขย ย ย ย ย ย Write unit tests, maintain technical documentation, and participate in architecture and code reviews
ย
REQUIRED SKILLS
โขย ย ย ย ย ย Python:ย Strong proficiency for data pipeline development including pandas, PySpark, Apache Beam, and Google Cloud Platform client library usage
โขย ย ย ย ย ย Google Cloud Platform services:ย Hands-on experience with BigQuery, Cloud Storage, Dataflow or Dataproc, Pub/Sub, Cloud Composer, and Cloud SQL
โขย ย ย ย ย ย Data modeling:ย Practical experience implementing dimensional models (star/snowflake schema) and understanding of data warehousing concepts
โขย ย ย ย ย ย SQL:ย Strong BigQuery SQL skills including window functions, nested/repeated fields, partitioning, clustering, and performance tuning
โขย ย ย ย ย ย ETL/ELT pipelines:ย Experience building batch and streaming data pipelines for structured and semi-structured datasets
โขย ย ย ย ย ย Data formats:ย Proficiency working with Parquet, Avro, JSON, and CSV in distributed processing contexts
โขย ย ย ย ย ย Version control:ย Proficient with Git and collaborative development workflows
ย
PREFERRED
โขย ย ย ย ย ย Google Cloud Platform Professional Data Engineer certification
โขย ย ย ย ย ย Experience with dbt for BigQuery transformation layer development
โขย ย ย ย ย ย Familiarity with data quality frameworks:ย Great Expectations, dbt tests, or custom validation pipelines
โขย ย ย ย ย ย Exposure to data catalog and lineage tooling:ย Google Cloud Platform Dataplex or Data Catalog
โขย ย ย ย ย ย Experience with analytical or BI tooling:ย Looker, Looker Studio, or Tableau connected to BigQuery