[NetsPresso] AI Engineer
About
? 우리 팀을 소개합니다.
NetsPresso Platform 팀은 Nota AI의 AI 모델 경량화 및 최적화 기술을 기반으로, 연구/개발한 기술을 실제 제품으로 구현하여 사용자에게 제공하는 NetsPresso 제품 전반의 핵심 플랫폼과 소프트웨어를 설계·구현하는 조직입니다.
Model Representation, Quantization, Graph Optimization, SW Engineering 파트와 함께 Model Engineering 파트는 NetsPresso의 최적화 기술이 실제 다양한 AI 모델과 디바이스 환경에서 안정적으로 활용될 수 있도록 연결하는 역할을 담당합니다.
• 다양한 AI 모델을 실제 디바이스에 맞게 최적화하고
• 이를 반복적·자동화된 방식으로 수행할 수 있도록 Agent 기반 실험 및 시나리오 자동화를 구축하며
• 고객사 및 신규 기술 요구를 분석해 NetsPresso Core 기술 발전 방향을 제안합니다.
• 연구와 엔지니어링의 중간 지점에서, 기술을 실전으로 연결하는 팀입니다.
? 해당 포지션으로 합류하신다면
‘이 LLM을 모바일에서 돌릴 수 있을까?’
’수백 개 모델 최적화, 매번 수작업 말고 자동으로 빠르게 할 순 없을까?’
NetsPresso Model Engineering 파트는 이런 질문에 직접 답을 만듭니다. NetsPresso IR, Graph Optimization, Quantization 등 최적화 엔진을 사용하여 논문 속의 모델 또는 고객이 만든 모델을 고객의 디바이스에서 실제로 돌아가는 모델로 만듭니다.
? 팀의 메세지
새로운 AI 모델과 디바이스 환경에 대한 높은 관심과, 아이디어를 실제로 동작하는 결과물로 구현해내는 실행력이 중요합니다. 단순한 실험이나 분석에 그치지 않고, NetsPresso 서비스와 직접 연결되는 모델 최적화·엔지니어링 기술을 구현하는 포지션입니다. 다양한 모델과 디바이스, 자동화 시나리오가 유기적으로 연결되어 있는 만큼, 팀 내에서의 활발한 소통과 주도적인 문제 해결 태도를 무엇보다 중요하게 생각합니다. 다양한 모델과 디바이스의 제약을 깊이 있게 파고들고, 협업을 통해 함께 성장하며 실제 사용 가능한 기술을 만들어가고 싶은 분이라면 이 팀에서 분명 의미 있는 성과를 낼 수 있을 것입니다.
Responsibilities
• AI 모델 디바이스 최적화 및 관리
- NetsPresso의 경량화·최적화 모듈을 활용하여 다양한 AI 모델을 타겟 디바이스에 맞게 최적화
- Computer Vision, Generative AI(LLM, VLM 등) 모델 대상 성능·정확도·메모리 중심 튜닝
- 디바이스별 최적화 모델 관리 및 실험 결과 정리
• Agent 기반 최적화 자동화 및 시나리오 구축
- 수동 설정에 의존하지 않는 Agent 기반 모델 최적화 실험 구조 설계
- 디바이스 특성에 맞는 자동화된 최적화 시나리오 구현 및 개선
• 고객사 모델 지원 및 기술 조사
- 고객사 디바이스 환경에 맞춘 모델 최적화 및 기술 지원
- 신규 AI 모델, 디바이스, 최적화 기법에 대한 기술 조사
- 실전 적용 관점에서 NetsPresso 기술의 개선 방향 도출 및 제안
Requirements
• AI/ML 등 관련 분야 석사 학위 이상 (또는 이에 준하는 실무 경력)
• Python 기반 소프트웨어 개발 능력 및 협업 경험
- 가독성 있는 코드 작성, Git 기반 버전 관리
• PyTorch 등 딥러닝 프레임워크 기반 모델 개발/디버깅 경험
• AI 모델의 Inference & Deployment & Optimization 실무 경험
- 추론 엔진(e.g. ONNX Runtime 등), 서빙(e.g. TorchServe 등),
- 최적화(e.g. Quantization 등) 도구 중 1개 이상 실사용
• Inference 파이프라인 설계 및 성능(정확도/지연/메모리) 분석 역량
• 반복 가능한 작업을 자동화 가능한 구조로 전환하려는 문제 해결 마인드
• 해외 여행에 결격 사유가 없는 분
Preferred
• 복잡한 실험 결과를 문서화하고 공유한 경험
• 모델 최적화·경량화 관련 경험 (Quantization, Pruning, Graph Optimization 등)
• CPU/GPU/NPU 등 다양한 디바이스 최적화 경험
• 모델 변환/배포 도구 사용 경험 (ExecuTorch, ONNX, TFLite, TensorRT 등)
• ML 파이프라인 자동화(CI/CD, 실험 관리) 경험
• Agent/AutoML 기반 자동화 시스템 구축 경험
• 고객사 기술 지원 또는 PoC 수행 경험
Benefits
지원 전, 확인해주세요! ?
•해당 공고는 상시 채용으로, 채용 완료 시 조기 마감될 수 있습니다.
•이력서 내 연봉 정보 등 민감한 개인 정보가 기재되어 있다면, 해당 서류는 검토되지 않을 수 있습니다.
•제출해 주신 내용 중 허위 사실이 있을 경우 채용이 취소될 수 있습니다.
•채용 전 레퍼런스 체크가 있음을 알려드립니다.
•최종 인터뷰 합격 시 별도로 처우를 협의합니다.
•입사 후 시용기간이 있으며, 이에 대한 처우는 차등을 두지 않음을 알려드립니다.
•국가보훈대상자 및 장애인은 관련 법규에 의거하여 우대합니다.
•장애인 고용 촉진을 위한 행정적 절차 확인이 필요한 경우, 장애인 등록증 사본을 기타 서류 란에 선택적•으로 제출하실 수 있습니다. 제출 여부는 전형 평가에 어떠한 영향도 미치지 않습니다.
•R&D 모든 포지션에서 전문연구요원, 산업기능요원으로 근무가 가능합니다. (단, 산업기능요원 현역 신규 편입의 경우 불가능)