• 다양한 대형 언어/멀티모달 모델을 개발하고 학습, 경량화 등의 작업 수행
• (대규모 클러스터 아키텍처 및 인프라 소프트웨어 동작 방식을 고려하여) 초거대 AI 모델을 위한 각종 학습/경량화/추론 기술을 개발하고 모델에 적용, 그리고 해당 기술을 인프라 소프트웨어에서 일반화/자동화 가능한 형태로 개선
• 모델 학습/추론 과정에서 일어나는 다양한 계산 성능, 통신 및 메모리 용량 문제를 분석하고 해결책 제시
• 최신 AI 연구 동향을 지속적으로 파악하고 모레 소프트웨어의 개선 방안 제시
경력 및 자격요건
자격 요건
• 컴퓨터공학 혹은 AI 관련 전공 학부 졸업 후 머신 러닝 엔지니어로서의 2년 이상의 경력; 혹은 AI 관련 분야의 석사 졸업
• AI 관련 논문을 읽고 이해하며 필요 시 PyTorch로 구현할 역량이 있으신 분
• AI 모델 학습 과정 및 결과에 대해 논리적이고 정량적으로 분석할 역량이 있으신 분
우대 사항
• AI 관련 분야의 박사 졸업
• 머신 러닝 엔지니어로서의 4년 이상의 경력
• 주요 학술대회에 논문 게재 이력(예: AAAI, ACL, CVPR, ECCV, ICCV, ICML, NeurIPS) 및 기타 연구 경력
• (대규모) GPU 클러스터에서 인공신경망 모델을 학습시킨 경험, 특히 대형 언어 모델 혹은 멀티모달 모델을 학습시킨 경험
• PyTorch/TensorFlow 등의 AI 프레임워크 및 내부 구조에 대한 지식
• 컴퓨터 아키텍처와 시스템에 대한 이해
• GPU 시스템의 소프트웨어 환경(GPU 드라이버부터 AI 프레임워크까지)을 직접 구성한 경험