ㅇ LLM을 위한 데이터 파이프라인(데이터 수집, 전처리, 피처 엔지니어링) 구축
ㅇ 오픈 소스 대규모 언어 모델을 다양한 기법(Fine-tuning, Continual Pre-training)을 통해 개량하여 자체 대화 모델 개발
ㅇ 자체 개발 모델을 실제 서비스를 통해 배포(추론 최적화, 모델 경량화, 서빙 등)
ㅇ 대화 모델 평가에 최적화된 자체 벤치마크 개발
경력 및 자격요건
ㅇ 4년 이상의 머신러닝 또는 딥러닝 모델 개발 경력(석사 이상 혹은 그에 준하는 경력), 또는 관련 전공 학위 소지자
ㅇ 오픈 소스 혹은 자체 제작 대규모 언어 모델(LLM)을 데이터 수집부터 전처리, 훈련(Fine-tuning, Continual Pre-Training), Post-training(SFT, DPO, RLHF), 평가, 배포까지 전체 사이클을 경험해 보신 분
ㅇ 다양한 도메인과 ML 모델의 학습부터 배포까지 전체 프로세스 엔지니어링 역량을 갖춘 분
ㅇ 공개 벤치마크 데이터셋을 활용하여 다양한 모델링 기법을 통해 테스트 성능을 최적화해 본 경험이 있는 분
ㅇ (우대사항) AI 기술 연구와 더불어 AI와 사용자 간의 자연스러운 대화 경험을 만드는 데 관심이 있으신 분
ㅇ (우대사항) AWS 등 클라우드 환경에서 학습, 배포를 경험해보신 분
ㅇ (우대사항) 모델 배포 자동화 및 유지보수를 위한 MLOps 경험이나 관심이 있으신 분
ㅇ (우대사항) 논문을 읽고, 구현체가 제공되지 않은 경우에도 빠르고 정확하게 모델을 재현할 수 있는 능력을 지닌 분
ㅇ (우대사항) 텍스트, 이미지, 음성 등 다중 모달리티를 활용한 AI 모델 개발 경험이 있는 분
ㅇ (우대사항) LLM 관련 오픈소스 프레임워크(transformers, LLaMA Factory, Axolotl, vllm, ollama 등) 활용 경험이 있거나, PyTorch를 이용한 모델 학습/배포 파이프라인 개발 경험이 있는 분
기타
ㅇ 원서 마감후 1차(서류) 합격자에 한하여 개별연락
ㅇ 해외여행에 결격 사유가 없는 자
ㅇ 이력서에 연락처, 희망연봉 게재