岗位职责:
1.负责ai infra存储方向性能分析,探索推理框架kv
ca
che与存储系统的深度集成,优化大模型推理性能;
2.推动存储与大模型加速相关的生态建设,包括接口标准化和系统间互操作性,
设计和实施ai infra中kv
ca
che和存储的软硬结合解决方案;
3.负责持续跟进llm前沿技术和开源方案,结合存储完成场景化分析,并落地存储
产品,提升存储智能化竞争力。
职位要求:
1.计算机科学、软件工程或相关专业,有ai工程优化经验;
2.熟悉主流aig
c算法模型原理,熟悉llm/
cv/nlp/推荐系统等业务场景的系统和原理;
3.熟悉业界常用的大语言模型推理加速框架,如vllm.tensorrt-llm、or
ca、llama.
cpp等;
4.具备分布式系统的研发经验,有优化系统性能问题的能力和经验,有以下一个或者多个条件者优先:
1)有超大规模模型研发经验,涉及
数据、训练、部署、评估等相关工作;
2)具有大规模模型服务部署、优化经验;
3)了解主流llm模型,熟悉tensorrt-llm、or
ca、vllm并有llm模型训推加速经验;
4)熟悉主要云厂商的ai infra解决方案,有分布式计算和存储项目经验。