Data Platform Engineer
부문
Korea
직군
Tech/Product
경력사항
경력 무관
고용형태
정규직
근무지
서울 오피스서울특별시 강남구 선릉로 561

리얼월드(RLWRLD)는 로봇이 ​인간처럼 ​세상을 ​인식하고 사고하며 ​행동할 수 있게 만드는 ​로보틱스 ​파운데이션 모델(Robotics ​Foundation Model)을 개발하는 ​Physical AI ​선도 ​기업입니다.


AI와 로보틱스 ​분야에서 ​축적한 ​깊은 연구 역량, ​일본·한국 ​및 글로벌 산업 ​파트너와의 ​긴밀한 ​데이터 협력 네트워크를 ​기반으로, 고자유도 ​로봇 ​손의 정밀한 ​조작을 가능케 ​하는 ​RFM(Robotics Foundation Model)을 ​빠르게 발전시키고 ​있습니다. 또한, 글로벌 유수의 연구자 그룹 및 로봇·센서 솔루션 파트너들과의 협력을 통해 제조, 물류, 서비스 등 다양한 산업 현장에서 실질적인 시장 적용이 가능한 모델을 개발하고 있습니다.


2024년 말, 국내외 유수의 VC 및 대기업으로부터 약 210억 원의 시드 투자를 유치하며 대한민국 스타트업 역사상 최대 규모의 시드 투자를 기록한 리얼월드에는 AI·로보틱스 기술과 비즈니스 분야에서 혁신을 선도하고자 하는 뛰어난 인재들이 속속 합류하고 있습니다.




[언론 보도]

https://n.news.naver.com/article/020/0003628474

https://techcrunch.com/2025/04/14/rlwrld-raises-14-4m-to-build-foundation-model-for-robotics/

https://www.nikkei.com/article/DGXZQOUC1464S0U5A410C2000000/

https://n.news.naver.com/mnews/article/092/0002378605?sid=105



조직 소개

RLWRLD의 프로덕트 조직은 RLWRLD의 모든 프로덕트를 개발하는 부서로, 기획·개발·연구 전반을 책임지고 있습니다.


주요 역할로는 RLWRLD의 근간이 되는 Robotics Foundation Model 개발을 비롯해 해당 모델을 API/SDK 형태로 제공하는 일까지 포함합니다. 이와 더불어 데이터 수집·정제·가공을 위한 텔레오퍼레이션 및 데이터 파이프라인, 모델 학습을 위한 Training System, 모델의 기능과 성능을 검증하는 Benchmark, 로봇을 실제로 제어하는 Robot Control System, 그리고 GPU 등 인프라 자원을 균형 있게 제공하는 Infra System까지 폭넓은 프로덕트를 개발하고 있습니다.


조직은 Research Engineer와 Software Engineer 등으로 구성되어 있으며, 모델 개발과 소프트웨어 개발 중 어느 영역에 더 집중하느냐의 차이만 있을 뿐 각 역할 간의 경계는 비교적 유연하게 운영되고 있습니다. 특히 Robotics Foundation Model 개발을 위해 Academy Researcher들과 긴밀하게 협업하며 공동 연구를 진행하고, Robot Hands 및 Sensor 개발 파트너들과의 협업은 물론, 사내에서는 Business Developer와도 밀접하게 협력하고 있습니다.



포지션명

Data Platform Engineer



포지션 개요

로보틱스 AI 개발에서 데이터 파이프라인은 단순한 지원 시스템이 아니라, 모델 실험 속도와 학습 안정성을 결정하는 핵심 인프라입니다.


이 역할은 로봇에서 생성되는 대규모 멀티모달 데이터를 수집부터 전처리, 저장, 로딩, 학습에 이르기까지 하나의 흐름으로 자동화하고 최적화하는 작업을 수행하며, 로보틱스 모델 연구자와 엔지니어가 데이터 병목 없이 실험에 집중할 수 있도록 전체 개발 생산성을 실질적으로 높이는 시스템을 구축합니다.


멀티모달 데이터를 안정적으로 흐르게 만들고 로보틱스 개발의 속도를 끌어올릴 수 있는, 열정을 가진 뛰어난 분들의 합류를 기다립니다.




주요 업무

  • 학습 데이터 파이프라인 구축 및 성능 개선
  • 학습 데이터 수집부터 로딩까지의 End-to-End 데이터 파이프라인 설계
  • 데이터 오프로딩(offload) 이후 모델/엔지니어링 팀이 즉시 활용할 수 있도록 처리 지연 최소화
  • 대규모 데이터 처리 병목 분석 및 throughput / latency 최적화
  • 대규모 데이터 수집 및 전처리 자동화
  • 카메라, Depth, IMU, joint state, force/torque 등 멀티모달 로봇 센서 데이터 수집 파이프라인 구축
  • 노이즈 제거, 시간 정렬, 동기화, 형식 변환 등 전처리 작업의 자동화 및 병렬화
  • 데이터 재처리를 고려한 idempotent한 전처리 구조 설계
  • 데이터 저장소 설계 및 최적화
  • 대용량 시계열(time-series) 및 구조화 데이터를 위한 스토리지 아키텍처 설계
  • Parquet, MCAP, protobuf 등 로봇 로그 포맷을 고려한 스키마 및 파티셔닝 전략 수립
  • 학습/분석/백테스트 워크로드를 고려한 저장 비용·성능 최적화
  • 데이터 로딩 및 학습 연동 최적화
  • 모델 학습 시 I/O 병목을 최소화하는 데이터 로딩 구조 설계
  • 샘플링 전략, sharding, caching 등을 활용한 대규모 학습 데이터 접근 최적화
  • 분산 학습 환경(GPU/멀티노드)에서의 데이터 로딩 안정성 확보
  • 데이터 파이프라인 통합 및 자동화
  • 로봇 테스트 및 시뮬레이션 파이프라인과 데이터 시스템 통합
  • CI/CD 환경과 연동된 자동 데이터 처리·검증 워크플로우 구축
  • 데이터 품질 체크, 처리 실패 감지 및 자동 복구 로직 구현
  • 모니터링 및 운영 안정성 확보
  • 데이터 처리량, 지연 시간, 실패율 등에 대한 모니터링 시스템 구축
  • 파이프라인 장애 발생 시 원인 분석 및 신속한 대응 체계 마련
  • 장기 운영을 고려한 관측성(observability) 및 알림 체계 설계



자격 요건

  • 프로그래밍 및 데이터 처리 역량
  • Python 기반 데이터 처리 경험 (Pandas, Polars, PySpark 등)
  • 대규모 데이터셋을 다룬 경험 및 성능 최적화 능력
  • SQL/NoSQL 데이터베이스 설계, 인덱싱, 쿼리 튜닝 이해
  • 데이터 엔지니어링 및 인프라 경험
  • 대규모 데이터 파이프라인 또는 데이터 플랫폼 구축·운영 경험
  • 분산 파일 시스템 및 오브젝트 스토리지(HDFS, AWS S3 등) 활용 경험
  • 컨테이너 기반 환경(Docker 등)에서의 데이터 시스템 운영 경험
  • 자동화 및 운영 역량
  • ETL 파이프라인 자동화 및 배치/스트리밍 처리 경험
  • Jenkins, GitLab CI 등 CI/CD 환경에서의 데이터 워크플로우 운영 경험
  • 데이터 파이프라인 테스트 자동화 및 모니터링 경험



우대 사항

  • ML/DL 및 MLOps 경험
  • 머신러닝/딥러닝 학습 파이프라인에서의 데이터 요구사항 이해
  • 대규모 학습 데이터 관리 및 재현 가능한 실험 환경 구축 경험
  • 자동화된 재학습, 데이터 버저닝, 실험 추적 경험
  • 로보틱스 센서 데이터 처리 이해
  • RGB/Depth 카메라, IMU, joint state 등 로봇 센서 데이터 특성 이해
  • ROS/Rosbag 또는 유사한 로봇 데이터 포맷 처리 경험
  • 성능 및 시스템 최적화 경험
  • 고성능 I/O, 병렬 처리, 캐시 설계 경험
  • GPU 학습 환경에서의 데이터 로딩 병목 해결 경험



근무 조건

  • 근무장소 : 서울 강남구 선릉로 561 (역삼동, 루비나빌딩)
  • 근무기간 : 정규직
  • 수습 기간 안내
  • 입사 시 3개월의 수습 기간이 적용됩니다.
  • 수습 기간 동안 근무 태도와 역량 평가를 진행하며, 평가 결과에 따라 수습 기간이 연장되거나 채용이 취소될 수 있습니다.



지원 방법

  • 제출서류 :
  • 이력서 (한글 또는 영문)
  • (선택) 본인의 역량을 보여줄 수 있는 포트폴리오, 연구자료, 프로젝트 자료 등 추가 제출 가능
  • 지원 마감: 상시 모집 (채용 시 마감)



전형 절차

  • 서류 전형 > 1차 인터뷰 > 2차 인터뷰 > 3차 인터뷰 > 최종 합격
  • 서류 전형 합격 시 개별적으로 연락이 진행될 예정입니다.
  • 절차 상 필요한 경우 커피챗·코딩테스트가 포함될 수 있습니다.



근무 환경 및 지원

  • 유연근무제: 출퇴근 시간을 자율적으로 조정해 각자의 리듬에 맞게 일합니다.
  • 업무 장비·소프트웨어 지원: 직무에 맞는 업무 장비와 필요한 소프트웨어를 지원합니다.
  • 기본 편의시설 운영: 사내 스낵바와 커피 머신을 운영하고 있습니다.
  • 명절 및 생일 선물: 명절과 생일에는 소정의 선물을 전합니다.
  • 건강검진 지원: 정기적인 건강검진으로 건강 관리를 돕습니다.
공유하기
Data Platform Engineer

리얼월드(RLWRLD)는 로봇이 ​인간처럼 ​세상을 ​인식하고 사고하며 ​행동할 수 있게 만드는 ​로보틱스 ​파운데이션 모델(Robotics ​Foundation Model)을 개발하는 ​Physical AI ​선도 ​기업입니다.


AI와 로보틱스 ​분야에서 ​축적한 ​깊은 연구 역량, ​일본·한국 ​및 글로벌 산업 ​파트너와의 ​긴밀한 ​데이터 협력 네트워크를 ​기반으로, 고자유도 ​로봇 ​손의 정밀한 ​조작을 가능케 ​하는 ​RFM(Robotics Foundation Model)을 ​빠르게 발전시키고 ​있습니다. 또한, 글로벌 유수의 연구자 그룹 및 로봇·센서 솔루션 파트너들과의 협력을 통해 제조, 물류, 서비스 등 다양한 산업 현장에서 실질적인 시장 적용이 가능한 모델을 개발하고 있습니다.


2024년 말, 국내외 유수의 VC 및 대기업으로부터 약 210억 원의 시드 투자를 유치하며 대한민국 스타트업 역사상 최대 규모의 시드 투자를 기록한 리얼월드에는 AI·로보틱스 기술과 비즈니스 분야에서 혁신을 선도하고자 하는 뛰어난 인재들이 속속 합류하고 있습니다.




[언론 보도]

https://n.news.naver.com/article/020/0003628474

https://techcrunch.com/2025/04/14/rlwrld-raises-14-4m-to-build-foundation-model-for-robotics/

https://www.nikkei.com/article/DGXZQOUC1464S0U5A410C2000000/

https://n.news.naver.com/mnews/article/092/0002378605?sid=105



조직 소개

RLWRLD의 프로덕트 조직은 RLWRLD의 모든 프로덕트를 개발하는 부서로, 기획·개발·연구 전반을 책임지고 있습니다.


주요 역할로는 RLWRLD의 근간이 되는 Robotics Foundation Model 개발을 비롯해 해당 모델을 API/SDK 형태로 제공하는 일까지 포함합니다. 이와 더불어 데이터 수집·정제·가공을 위한 텔레오퍼레이션 및 데이터 파이프라인, 모델 학습을 위한 Training System, 모델의 기능과 성능을 검증하는 Benchmark, 로봇을 실제로 제어하는 Robot Control System, 그리고 GPU 등 인프라 자원을 균형 있게 제공하는 Infra System까지 폭넓은 프로덕트를 개발하고 있습니다.


조직은 Research Engineer와 Software Engineer 등으로 구성되어 있으며, 모델 개발과 소프트웨어 개발 중 어느 영역에 더 집중하느냐의 차이만 있을 뿐 각 역할 간의 경계는 비교적 유연하게 운영되고 있습니다. 특히 Robotics Foundation Model 개발을 위해 Academy Researcher들과 긴밀하게 협업하며 공동 연구를 진행하고, Robot Hands 및 Sensor 개발 파트너들과의 협업은 물론, 사내에서는 Business Developer와도 밀접하게 협력하고 있습니다.



포지션명

Data Platform Engineer



포지션 개요

로보틱스 AI 개발에서 데이터 파이프라인은 단순한 지원 시스템이 아니라, 모델 실험 속도와 학습 안정성을 결정하는 핵심 인프라입니다.


이 역할은 로봇에서 생성되는 대규모 멀티모달 데이터를 수집부터 전처리, 저장, 로딩, 학습에 이르기까지 하나의 흐름으로 자동화하고 최적화하는 작업을 수행하며, 로보틱스 모델 연구자와 엔지니어가 데이터 병목 없이 실험에 집중할 수 있도록 전체 개발 생산성을 실질적으로 높이는 시스템을 구축합니다.


멀티모달 데이터를 안정적으로 흐르게 만들고 로보틱스 개발의 속도를 끌어올릴 수 있는, 열정을 가진 뛰어난 분들의 합류를 기다립니다.




주요 업무

  • 학습 데이터 파이프라인 구축 및 성능 개선
  • 학습 데이터 수집부터 로딩까지의 End-to-End 데이터 파이프라인 설계
  • 데이터 오프로딩(offload) 이후 모델/엔지니어링 팀이 즉시 활용할 수 있도록 처리 지연 최소화
  • 대규모 데이터 처리 병목 분석 및 throughput / latency 최적화
  • 대규모 데이터 수집 및 전처리 자동화
  • 카메라, Depth, IMU, joint state, force/torque 등 멀티모달 로봇 센서 데이터 수집 파이프라인 구축
  • 노이즈 제거, 시간 정렬, 동기화, 형식 변환 등 전처리 작업의 자동화 및 병렬화
  • 데이터 재처리를 고려한 idempotent한 전처리 구조 설계
  • 데이터 저장소 설계 및 최적화
  • 대용량 시계열(time-series) 및 구조화 데이터를 위한 스토리지 아키텍처 설계
  • Parquet, MCAP, protobuf 등 로봇 로그 포맷을 고려한 스키마 및 파티셔닝 전략 수립
  • 학습/분석/백테스트 워크로드를 고려한 저장 비용·성능 최적화
  • 데이터 로딩 및 학습 연동 최적화
  • 모델 학습 시 I/O 병목을 최소화하는 데이터 로딩 구조 설계
  • 샘플링 전략, sharding, caching 등을 활용한 대규모 학습 데이터 접근 최적화
  • 분산 학습 환경(GPU/멀티노드)에서의 데이터 로딩 안정성 확보
  • 데이터 파이프라인 통합 및 자동화
  • 로봇 테스트 및 시뮬레이션 파이프라인과 데이터 시스템 통합
  • CI/CD 환경과 연동된 자동 데이터 처리·검증 워크플로우 구축
  • 데이터 품질 체크, 처리 실패 감지 및 자동 복구 로직 구현
  • 모니터링 및 운영 안정성 확보
  • 데이터 처리량, 지연 시간, 실패율 등에 대한 모니터링 시스템 구축
  • 파이프라인 장애 발생 시 원인 분석 및 신속한 대응 체계 마련
  • 장기 운영을 고려한 관측성(observability) 및 알림 체계 설계



자격 요건

  • 프로그래밍 및 데이터 처리 역량
  • Python 기반 데이터 처리 경험 (Pandas, Polars, PySpark 등)
  • 대규모 데이터셋을 다룬 경험 및 성능 최적화 능력
  • SQL/NoSQL 데이터베이스 설계, 인덱싱, 쿼리 튜닝 이해
  • 데이터 엔지니어링 및 인프라 경험
  • 대규모 데이터 파이프라인 또는 데이터 플랫폼 구축·운영 경험
  • 분산 파일 시스템 및 오브젝트 스토리지(HDFS, AWS S3 등) 활용 경험
  • 컨테이너 기반 환경(Docker 등)에서의 데이터 시스템 운영 경험
  • 자동화 및 운영 역량
  • ETL 파이프라인 자동화 및 배치/스트리밍 처리 경험
  • Jenkins, GitLab CI 등 CI/CD 환경에서의 데이터 워크플로우 운영 경험
  • 데이터 파이프라인 테스트 자동화 및 모니터링 경험



우대 사항

  • ML/DL 및 MLOps 경험
  • 머신러닝/딥러닝 학습 파이프라인에서의 데이터 요구사항 이해
  • 대규모 학습 데이터 관리 및 재현 가능한 실험 환경 구축 경험
  • 자동화된 재학습, 데이터 버저닝, 실험 추적 경험
  • 로보틱스 센서 데이터 처리 이해
  • RGB/Depth 카메라, IMU, joint state 등 로봇 센서 데이터 특성 이해
  • ROS/Rosbag 또는 유사한 로봇 데이터 포맷 처리 경험
  • 성능 및 시스템 최적화 경험
  • 고성능 I/O, 병렬 처리, 캐시 설계 경험
  • GPU 학습 환경에서의 데이터 로딩 병목 해결 경험



근무 조건

  • 근무장소 : 서울 강남구 선릉로 561 (역삼동, 루비나빌딩)
  • 근무기간 : 정규직
  • 수습 기간 안내
  • 입사 시 3개월의 수습 기간이 적용됩니다.
  • 수습 기간 동안 근무 태도와 역량 평가를 진행하며, 평가 결과에 따라 수습 기간이 연장되거나 채용이 취소될 수 있습니다.



지원 방법

  • 제출서류 :
  • 이력서 (한글 또는 영문)
  • (선택) 본인의 역량을 보여줄 수 있는 포트폴리오, 연구자료, 프로젝트 자료 등 추가 제출 가능
  • 지원 마감: 상시 모집 (채용 시 마감)



전형 절차

  • 서류 전형 > 1차 인터뷰 > 2차 인터뷰 > 3차 인터뷰 > 최종 합격
  • 서류 전형 합격 시 개별적으로 연락이 진행될 예정입니다.
  • 절차 상 필요한 경우 커피챗·코딩테스트가 포함될 수 있습니다.



근무 환경 및 지원

  • 유연근무제: 출퇴근 시간을 자율적으로 조정해 각자의 리듬에 맞게 일합니다.
  • 업무 장비·소프트웨어 지원: 직무에 맞는 업무 장비와 필요한 소프트웨어를 지원합니다.
  • 기본 편의시설 운영: 사내 스낵바와 커피 머신을 운영하고 있습니다.
  • 명절 및 생일 선물: 명절과 생일에는 소정의 선물을 전합니다.
  • 건강검진 지원: 정기적인 건강검진으로 건강 관리를 돕습니다.