Engineering Manager, ML Data
Seoul (Hybrid) • Full-time
- KOREAN: BUSINESS
 - Machine Learning
 - Data Engineering
 - AI
 
[한국어 JD는 하단에 있습니다]
Who We Are
Join us in setting the global standard for video understanding AI! At Twelve Labs, we build the world’s most advanced video-focused AI models that power search, analysis, summarization, and insight generation from massive video data.
Our models are used by the world’s largest sports leagues to instantly identify highlights from hours of footage, delivering highly personalized viewing experiences. In Korea, national control centers use Twelve Labs to efficiently search CCTV footage for rapid crisis response. Leading broadcasters and studios around the world rely on our models to create content for billions of viewers.
Twelve Labs is a deep tech startup with offices in San Francisco and Seoul. We have been named one of CB Insights’ Top 100 AI Startups for four consecutive years. Backed by top-tier investors including NVIDIA, NEA, Index Ventures, Databricks, and Snowflake, we have raised over $110 million USD to date. Our models are the only AI models developed in Korea available through Amazon Bedrock. We are building innovative products with exceptional teammates and growing alongside our global customers.
At Twelve Labs, we work around a few core values:
- Honesty and self-reflection about ourselves and our team
 - Perseverance and humility in the face of failure and feedback
 - Continuous learning to elevate our collective capability
 
A genuine passion for tackling challenging problems together
If you enjoy growing through collaboration and solving complex problems — the opportunity is here at Twelve Labs.
About the Team
The ML Data Team at Twelve Labs believes that “data determines model performance.” We build high-quality datasets end-to-end for training and evaluating multimodal AI models.
We collect, filter, process, and label diverse data types — including video, image, and audio — and work cross-functionally to design datasets that unlock new model capabilities. We also create evaluation datasets that reflect real user experiences. To achieve all this efficiently, we develop and continuously improve our own internal data tools.
Through this carefully designed data pipeline, the ML Data Team plays a central role in developing Twelve Labs’ world-leading video understanding models.
About the Role
The Engineering Manager, ML Data is a key leader responsible for building and leading a world-class team and developing large-scale data infrastructure for AI model training.
This role involves team leadership, technical architecture design, hiring and mentoring engineers, strengthening project execution, and developing the high-quality data ecosystem that supports Twelve Labs’ research and products.
In This Role, You Will
- 
Build and lead a strong technical team
Define and execute the mission and technical strategy for the ML Data Engineering team. Lead hiring, establish high standards for engineering excellence, and foster a culture of mentorship, collaboration, and continuous improvement.
 - 
Design and operate multimodal ML data engines
Architect and manage pipelines that collect, refine, and label petabyte-scale video, image, and audio datasets for AI model training. Build automated dataset generation systems and high-precision preprocessing engines for VLM/LLM training.
 - 
Design and manage large-scale ML data infrastructure
Develop scalable and reliable infrastructure capable of handling massive datasets.
 - 
Develop and execute data strategies
Collaborate closely with PMs, Research, Infrastructure, and Product teams to align data strategy with company vision, set priorities, and drive execution.
 
You May Be a Good Fit If You Have
- 4+ years of experience leading teams of 6 or more data or engineering professionals
 - 8+ years of software engineering experience with strong technical leadership skills
 - Proven track record of hiring, onboarding, and mentoring data or ML engineers
 - Practical experience designing and operating large-scale data systems
 
Preferred Qualifications
- Successfully hired and led 5+ senior engineers with proven team performance
 - Experience leading the design and launch of AI/ML-based products from the ground up
 - Hands-on experience scaling ML systems or data infrastructure to petabyte (PB) levels
 - Experience designing and operating Python-based data platforms and distributed processing systems (e.g., Spark, Kafka)
 
Hiring Process
Application Review -> Recruiter Call (30 min, remote) -> Coding Test -> Hiring Manager Interview (30 min, remote) -> Technical Interview (120 min, onsite) -> Leadership Interview (60 min, remote) -> Final Round Interview (30 min, remote) -> Reference Check -> Offer Discussion & Final Decision
Benefits & Perks
- Global team working with international B2B clients
 - Hybrid work culture combining autonomy and collaboration
 - MacBook and ₩700,000 home-office setup support (renewed every 3 years)
 - ₩600,000 monthly corporate card allowance for meals, transport, and personal work needs
 - Fully stocked office snack bar (snacks, coffee, fresh food)
 - Two-week winter break every year
 - Annual health check-up support
 - English education program support
 
Who We Are
영상 이해 AI의 글로벌 기준을 함께 만들어 갈 인재를 찾습니다! 트웰브랩스는 방대한 영상 데이터를 효과적으로 처리하여, 영상에 특화된 검색, 분석, 요약, 인사이트 생성 기능을 제공하는 세계 최고 수준의 영상 특화 AI 모델을 만들고 있습니다.
세계 최대 스포츠 리그에서는 트웰브랩스 모델을 활용해 방대한 경기 영상 속에서 빠르고 정확하게 하이라이트를 선별하여 초개인화된 시청 경험을 제공하고 있습니다. 국내 통합관제센터에서는 위기 상황에 신속히 대응하기 위해 트웰브랩스와 함께 CCTV 영상을 효율적으로 탐색하고 있으며, 전 세계 주요 방송사와 스튜디오들은 수십억 명의 시청자를 위한 콘텐츠 제작에 트웰브랩스 모델을 활용하고 있습니다.
트웰브랩스는 샌프란시스코와 서울에 오피스를 둔 Deep Tech 스타트업으로, 4년 연속 CB Insights 선정 세계 100대 AI 스타트업에 이름을 올렸습니다. NVIDIA, NEA, Index Ventures, Databricks, Snowflake 등 세계적인 VC와 기업들로부터 총 1억 1천만 달러 이상의 투자를 유치했으며, 한국에서 개발된 AI 모델 중 유일하게 Amazon Bedrock을 통해 서비스됩니다. 우리는 탁월한 동료들과 혁신적인 제품을 만들고 전 세계 고객들과 함께 성장하고 있습니다.
트웰브랩스는 다음과 같은 핵심 가치를 중심으로 일합니다.
- 나와 팀에 대해 정직하고 성찰할 수 있는 태도
 - 실패와 피드백을 두려워하지 않는 끈기와 겸손
 - 끊임없는 학습을 통해 팀의 역량을 함께 높여 가는 자세
 
도전적인 문제를 함께 해결하며 성장하는 과정을 즐기는 분이라면, 그 기회가 여기 트웰브랩스에 있습니다.
About the team
트웰브랩스 ML 데이터 팀은 ‘데이터가 AI 모델의 성능을 결정한다’라는 믿음을 바탕으로, 멀티모달 AI 모델의 학습과 평가에 필요한 고품질 데이터를 End-to-End로 구축합니다. 영상, 이미지, 오디오 등 다양한 멀티모달 데이터를 수집하고, 필터링·가공·라벨링 하는 것은 물론, 다양한 팀과 협업하여 새로운 모델 능력을 끌어낼 수 있는 학습 데이터를 설계합니다. 더불어, 실제 사용자 경험을 반영한 평가 데이터 셋도 함께 만들어 나갑니다. 또한, 이 모든 과정을 효율적으로 수행하기 위해 내부 툴을 직접 개발하고 지속적으로 개선합니다.
ML 데이터 팀은 이렇게 정교하게 설계된 데이터 파이프라인을 통해 트웰브랩스의 세계 최고 수준의 영상 이해 모델 개발에 핵심적인 역할을 하고 있습니다.
About the Role
ML 데이터 팀의 엔지니어링 매니저는 뛰어난 팀을 구성하고 이끌며, AI 모델 학습을 위한 대규모 데이터 인프라를 함께 만들어가는 핵심적인 리더입니다. 이 포지션은 팀 운영, 기술 아키텍처 설계, 엔지니어 채용 및 멘토링, 프로젝트 실행력 강화 등 다양한 역할을 수행하며, 트웰브랩스의 제품과 연구를 뒷받침하는 고품질 데이터 생태계를 만들어 갑니다.
In this Role, You Will
- 
팀 빌딩 및 기술 문화 구축
ML 데이터 엔지니어링 팀을 리드하며, 팀의 미션과 기술 전략을 정의하고 실행합니다. 팀의 채용 계획 수립 및 실행을 통해 우수한 인재를 유치하고, 코드 리뷰와 기술 멘토링을 통해 높은 수준의 엔지니어링 문화를 만들어 갑니다.
 - 
멀티모달 ML 데이터 엔진 설계 및 운영
AI 모델 학습을 위한 페타바이트(PB) 규모의 비디오, 이미지, 오디오 데이터를 수집·정제·라벨링 하는 파이프라인을 설계하고 운영합니다. 또한, VLM/LLM 학습용 데이터 셋 자동 생성 시스템 및 고정밀 전처리 엔진을 구축합니다.
 - 
멀티모달 ML 데이터 인프라 설계 및 운영
대규모 데이터를 안정적으로 처리할 수 있는 확장 가능한 데이터 인프라를 설계하고 운영합니다.
 - 
데이터 전략 수립 및 실행
PM, 리서치, 인프라, 제품 등 다양한 조직과 긴밀히 협업하여, 회사의 비전과 일치하는 데이터 전략을 수립하고 우선 순위를 조정하며 실행합니다.
 
You may be a good fit if you have
- 6명 이상의 데이터 혹은 엔지니어링 팀을 4년 이상 리드한 경험이 있으신 분
 - 8년 이상의 소프트웨어 엔지니어링 경력과 함께 뛰어난 기술 리더십을 보유하신 분
 - 데이터 혹은 ML 엔지니어의 채용, 온보딩, 멘토링을 통해 팀의 성장을 이끈 경험이 있으신 분
 - 대규모 데이터 시스템을 설계 및 운영해 본 실질적인 경험이 있으신 분
 
Preferred Qualifications:
- 5명 이상의 시니어 엔지니어를 성공적으로 채용하고 성과를 낸 경험이 있으신 분
 - AI/ML 기반의 핵심 제품을 처음부터 설계하고 출시까지 리딩한 경험이 있으신 분
 - ML 시스템 또는 데이터 인프라를 페타바이트(PB) 규모로 확장해 본 경험이 있으신 분
 - Python 기반의 데이터 플랫폼 및 분산 처리 시스템(Spark, Kafka 등)을 실무에서 설계·운영해 본 경험이 있으신 분
 
Hiring Process
서류 검토 → 리크루터 콜(비대면/30분) → 코딩 테스트 → Hiring Manager 인터뷰(비대면/30분) → 기술 인터뷰 (대면/120분) → Leadership 인터뷰(비대면/60분) → Final Round 인터뷰(비대면/30분) → 레퍼런스 체크 → 처우 협의 및 최종 합격
Benefits and Perks
- 글로벌 B2B 고객과 함께 성장하는 Global Team
 - 자율성과 협업을 모두 갖춘 하이브리드 근무
 - 전 직원에게 맥북 및 70만 원 상당 재택근무 장비 지원, 3년 주기로 최신 장비 교체
 - 식사·교통비 등 자유롭게 사용할 수 있는 월 60만 원 한도 법인카드 제공
 - 사무실 내 스낵바(간식, 커피, 신선식품 제공)
 - 연말 2주간 겨울방학 운영
 - 연 1회 건강검진 지원
 - 영어교육 프로그램 지원