Position#1
Job Title: Senior AWS AI / Data Engineer
Location: Detroit, MIย
Hire Type: Long-term contract
ย
Experience: 7+ yearsย |ย Detroit, MI (mandatory) โ Remote up to 50% travel |ย
ย
Agentic AI
LLMs
Python
AWS Native
Data Pipelines
Structured + Unstructured Data
ย
ABOUT THE ROLE
As a Senior AWS AI/Data Engineer at DataFactZ you will architect and deliver enterprise-grade AI and data pipeline solutions for large-scale client engagements. You will lead the design of agentic AI systems, LLM-powered applications, and high-throughput data pipelines on AWS โ translating complex business problems into production-ready solutions while mentoring junior engineers.
ย
KEY RESPONSIBILITIES
โขย ย ย ย ย ย Design and build end-to-end data pipelines for ingesting, transforming, and serving structured (SQL, Redshift, Parquet) and unstructured (PDFs, emails, documents, images) data on AWS
โขย ย ย ย ย ย Architect agentic AI systems using LLMs with tool use, memory, and multi-step reasoning via Amazon Bedrock, OpenAI, or Anthropic Claude
โขย ย ย ย ย ย Build multi-agent orchestration workflows using LangChain, LlamaIndex, CrewAI, or AutoGen for enterprise automation
โขย ย ย ย ย ย Design RAG pipelines connecting structured and unstructured data sources to LLMs via vector databases (Pinecone, OpenSearch, pgvector)
โขย ย ย ย ย ย Lead AWS data architecture across S3, Glue, Lambda, EMR, Athena, Step Functions, and Redshift
โขย ย ย ย ย ย Develop prompt engineering strategies and fine-tuning approaches for domain-specific LLM customization
โขย ย ย ย ย ย Mentor junior engineers, lead code reviews, and drive engineering best practices
โขย ย ย ย ย ย Engage client stakeholders to scope AI/data use cases, define success metrics, and deliver on commitments
ย
REQUIRED SKILLS
โขย ย ย ย ย Python:ย Advanced proficiency for data engineering, pipeline orchestration, and AI integrations
โขย ย ย ย ย AWS services:ย Deep hands-on experience with S3, Glue, Lambda, EMR, Athena, Step Functions, Redshift, and Bedrock
โขย ย ย ย ย LLMs & Agentic AI:ย Production experience building LLM-powered agents, tool-calling workflows, and multi-agent systems
โขย ย ย ย ย Data pipelines:ย Batch and real-time ETL/ELT for large-scale structured and unstructured datasets
โขย ย ย ย ย RAG & vector search:ย Building retrieval-augmented generation systems with embedding pipelines and semantic search
โขย ย ย ย ย System design:ย Architecting scalable, secure, cost-efficient cloud-native data and AI systems
โขย ย ย ย ย Leadership:ย Proven ability to lead technical workstreams and communicate designs to senior stakeholders
ย
PREFERRED
โขย ย ย ย ย ย AWS certifications:ย Solutions Architect, Data Analytics, or Machine Learning Specialty
โขย ย ย ย ย Document intelligence:ย AWS Textract or custom document parsing pipelines
โขย ย ย ย ย Multi-modal AI:ย Experience with vision or document-aware models
ย
ย