- 각종 인공신경망 레이어 및 텐서 연산들을 OpenCL, CUDA 등으로 구현하고 최적화
- 텐서 연산과 다양한 가속기에 대한 성능 예측 및 분석 모델 개발
- 다양한 GPU 아키텍처를 대상으로 최적의 커널 코드를 생성, 선택하기 위한 코드 생성기와 오토 튜너 개발
- AI 애플리케이션에 특화된 GPU의 구성 요소들(행렬 곱셈 유닛, GPU 간 고속 인터커넥션 등)을 활용
- GPU 간의 효율적인 통신 라이브러리 개발, 이는 서로 다른 노드에 위치한 GPU 사이의 통신을 포함
경력 및 자격요건
- 컴퓨터공학 혹은 관련 전공 학부 졸업, 혹은 이와 동등한 경력이 있으신 분
- C++ 및 개발 가능하신 분
- OpenCL 혹은 CUDA 개발 경험과 GPU 아키텍처에 대한 지식
- 컴퓨터 시스템에 대한 깊은 이해
# 우대 사항
- 전문연구요원 지원 우대
- 컴퓨터 시스템 혹은 관련 분야 석/박사 졸업
- 각종 AI/HPC 애플리케이션을 GPU에서 병렬화/최적화해 본 경험 및 관련 논문 개제 이력
- MPI, NCCL 등을 사용해 GPU 클러스터에서 동작하는 프로그램을 개발해 본 경험
- C++ 기반의 대규모 소프트웨어 개발에 참여한 이력
- 딥 러닝에 대한 기본적인 지식, 인공신경망 모델을 직접 구현해 본 경험
- 주요 학술대회에 논문 게재 이력(예: ASPLOS, HPDC, ISCA, Micro, PACT, PLDI, PPoPP, SC) 및 기타 연구 경력