3. Music
Text-to-Music, Waveform Generation, Symbolic Music Generation
Music Source Separation, Inpainting, Genre Conditioning
위의 세 가지 영역 중 하나 이상에 대해 다음 업무를 진행합니다.
모델 학습을 위한 데이터 파이프라인(데이터 수집, 전처리, 피처 엔지니어링) 구축
오픈 소스 모델을 다양한 기법(Fine-tuning, Continual Pre-training)을 통해 개량하여 자체 모델 개발
개발한 모델 평가에 최적화된 자체 벤치마크 개발
개발한 모델을 실제 서비스를 통해 배포(추론 최적화, 모델 경량화, 서빙 등)
경력 및 자격요건
[자격요건]
세 영역(Speech, Singing Voice, Music) 중 하나 이상에 대해 다음의 역량을 갖추어야 합니다.
- 4년 이상의 머신러닝 또는 딥러닝 모델 개발 경력(석사 이상 혹은 그에 준하는 경력), 또는 관- 련 전공 학위 소지자,
- PyTorch를 비롯한 주요 딥러닝 프레임워크에 능숙하고, 분산 학습 환경을 구축하고 운용할 수 있는 역량을 갖춘 분
- 오디오 도메인 전반에 대한 깊은 이해를 바탕으로, Raw waveform, Spectrogram 등 다양한 표현 형태의 오디오 데이터를 효과적으로 수집·전처리·가공할 수 있는 역량을 갖춘 분
- 오픈 소스 혹은 자체 제작 AI 모델에 대해 데이터 수집부터 전처리, 훈련(Fine-tuning, Continual Pre-Training), Post-training(SFT, DPO, RLHF), 평가, 배포까지 전체 사이클을 경험해 보신 분
- Transformer, Diffusion 등 최신 딥러닝 아키텍처에 대한 깊은 이해를 바탕으로, 모델 설계 및 구조 개선이 가능한 분
우대사항
- AI와 사용자 간의 자연스러운 대화 경험을 만드는 데 관심이 있으신 분
- Speech-to-Speech 모델 학습 경험이 있으신 분
- 최신 논문을 읽고, 구현체가 제공되지 않은 경우에도 빠르고 정확하게 모델을 재현할 수 있는 능력을 지닌 분
- 텍스트, 이미지, 음성 등 다중 모달리티를 활용한 AI 모델 개발 경험이 있는 분
- 모델 배포 자동화 및 유지보수를 위한 MLOps 경험이나 관심이 있으신 분
- AWS 등 클라우드 환경에서 학습, 배포를 경험해보신 분
- 음악을 사랑하고, 음악 프로덕션 혹은 오디오 시그널 처리 분야 유관 경력을 가지신 분