[上海] 特斯拉招聘Python 全栈工程师,AI应用方向
关于我们
官方网站:www.tesla.cn
公司地址:中国(上海)自由贸易试验区临港新片区江山路 5000 号
职位描述/工作职责
职位角色
特斯拉信息技术部门(工作地点:上海超级工厂)现招聘一名全职 IT AI Platform 开发工程师,专注于构建和扩展下一代 AIOps 与 MLOps 平台。随着人工智能技术,尤其是生成式AI(GenAI)平台在企业核心系统中的深入应用,我们亟需一位能够打通 AI研发与生产部署之间壁垒 的工程专家。
您将负责从 模型训练、版本管理、自动化部署到高性能推理服务 的完整 MLOps 体系建设,并主导构建支持 本地 GPU 推理与云端 LLM API 融合 的混合式推理网关平台,以实现 低延迟、高吞吐 的企业级 AI 服务能力。作为 GenAI 平台及未来 AI 服务落地的核心力量,您将显著提升 AI 功能的交付效率与系统稳定性。
岗位职责
- 设计、构建并维护可扩展的 MLOps 平台,实现 AI 模型从训练、版本控制、部署到监控的全生命周期管理。
- 基于 vLLM、TensorRT-LLM、TGI 等框架,在大规模 GPU 集群上开发并优化大语言模型(LLM)推理流水线。
- 构建融合本地 GPU 模型与云上 LLM API 的混合推理网关平台,实现智能路由、负载均衡与性能成本优化。
- 搭建自动化 LLM 微调(Fine-Tuning)流水线,支持 LoRA、QLoRA 等参数高效训练方法,涵盖数据预处理、分布式训练与检查点管理。
- 推动 RAG(检索增强生成)能力服务化(RAG-as-a-Service),集成并运维主流向量数据库(如 Pinecone、Milvus、Weaviate)。
- 通过 Prometheus、Grafana、OpenTelemetry 及自研监控方案,保障 AI 系统的可观测性与稳定性。
- 与 AI 科学家和应用工程师协作,进行模型优化(如量化、剪枝、蒸馏),提升推理效率与资源利用率。
- 支持 GenAI CN 平台的高性能模型服务需求,确保低延迟、高并发的服务能力。
- 制定 AI 模型服务的关键性能指标(KPI)与服务等级协议(SLA),量化业务价值与系统表现。
- 使用 GitLab CI、Jenkins、ArgoCD 等工具实现 AI 工作流的 CI/CD 自动化,确保可复现性与可审计性。
职位要求
基本要求
教育背景
- 计算机科学、人工智能、软件工程或相关专业本科及以上学历。
工作经验
- 至少 2 年软件开发经验,具备 MLOps、AI 基础设施或大规模模型推理服务 相关经验者优先。
- 有在生产环境中成功部署和运维 大语言模型(LLM)或深度学习模型 的实际项目经验者优先。
技术能力
- 精通 Python 或 Go,熟悉至少一种后端开发框架,如 Flask、FastAPI。
- 有 React / Next.js 前端开发经验者优先。
- 深入掌握 Kubernetes 和 Docker,具备通过 KubeFlow、NVIDIA GPU Operator 或自定义控制器管理 GPU 加速工作负载的实践经验。
- 熟悉主流 MLOps 平台与工具链(如 MLflow、Kubeflow)者优先。
- 有使用 vLLM、TGI、Triton Inference Server 等构建高并发、低延迟模型推理系统的真实案例者优先。
- 熟悉向量数据库(如 Pinecone、Milvus、FAISS、Weaviate)及其在 RAG 系统中的工程化集成者优先。
软技能
- 具备极强的自我驱动力,能够在快节奏环境中独立推动复杂项目落地。
- 出色的沟通与跨团队协作能力,能高效对接 AI 科学家、后端工程师及业务方。
- 具备系统性思维,关注系统的可扩展性、可靠性与性能优化。
- 主动发现问题并持续改进,追求运维卓越与平台稳定性。
薪资及其他待遇
我们为工程师提供:
技术驱动的团队文化:代码评审、技术分享、架构演进常态化,持续提升个人技术深度与广度;
有挑战的技术项目:参与特斯拉 App、内部中台等核心系统开发,接触前沿技术;
有竞争力的薪资福利:股票激励、五险一金、带薪年假、补充公积金、补充商业医疗等;
开放包容的团队氛围:扁平化管理,沟通高效。
如果你热爱技术、追求极致的用户体验,欢迎加入我们,一起用代码改变世界 🌍
关于 LearnKu