首页
学习
活动
专区
圈层
工具
发布
综合排序最热优先最新优先
时间不限
DeepSeekDeepSeek概述 | 本地部署deepseek
1 -> 概述 DeepSeek是由中国的深度求索公司开发的一系列人工智能模型,以其高效的性能和低成本的训练而受到关注。 知识蒸馏:DeepSeek-R1通过知识蒸馏,将长链推理(CoT)模型的推理能力蒸馏到标准LLM中,显著提升了推理性能。 推动行业变革:DeepSeek的成功挑战了传统的“大力出奇迹”的AI发展模式,为行业提供了新的发展思路和方向,激发了更多的创新和探索。 2.2 -> 部署deepseek-r1模型 回到ollama官网点击左上角的Models进入如下界面。 这样本地部署deepseek就算完成啦
枫叶丹
2025-02-08
3.9K1
标签:
什么是DeepSeek?如何入门DeepSeek
什么是DeepSeek?如何入门DeepSeek? 一、DeepSeek是什么? python=3.8 conda activate deepseek # 安装核心库 pip install deepseek-sdk torch>=2.0 2.2 快速体验 通过API调用基础功能 /DeepSeek-7B.git # 启动推理服务 python -m deepseek.serve --model-path . 模型中心:hub.deepseek.com 社区论坛:forum.deepseek.ai 实战教程: 《DeepSeek智能对话机器人开发入门》 《使用DeepSeek-CODEPILOT构建编程助手 》 四、常见问题解答 Q:需要多强的算力才能运行DeepSeek
猫头虎
2025-08-07
13.8K0
标签:
DeepSeekdeepseek可视化部署
1 -> 前文 【DeepSeekDeepSeek概述 | 本地部署deepseek 通过前文可以将deepseek部署到本地使用,可是每次都需要win+R输入cmd调出命令行进入到命令模式,输入命令 ollama run deepseek-r1:latest。 点击使用自己的 API Key 或本地模型 点击第一个Chatbox AI 进入该界面后,点击CHATBOX AI,选择其他的模型提供方 选择Ollama API这个模型提供方 点击模型,会显示已经部署到本地的deepseek
枫叶丹
2025-02-12
1K0
标签:
DeepSeek】如何在WPS中使用deepseek
1 -> 背景 随着人工智能技术的发展,大语言模型如ChatGPT、DeepSeek等不断涌现,为提升办公效率提供了新的途径。 2 -> 意义 推动办公智能化:WPS与DeepSeek的结合,推动了办公软件向智能化方向发展,为用户提供了更加智能、高效的办公解决方案。 功能多样化:除了基本的文本处理功能,DeepSeek还支持聊天、文生图、创作等功能,为用户提供了更多的创作可能性和便捷的交互体验。 个性化定制:用户可以根据自己的需求选择不同的DeepSeek模型(如deepseek-chat或deepseek-reasoner),并进行个性化的配置,以适应不同的工作场景。 3 -> 本地部署deepseek 相关文章: 【DeepSeekDeepSeek概述 | 本地部署deepseek 4 -> WPS引入deepseek 下载Office AI 以联想应用商店为例
枫叶丹
2025-02-15
1K0
标签:
DeepseekDeepSeek-R1诞生过程
本博客参考Deepseek开源论文:DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning 1.纯强化学习训练的语言模型 DeepSeek-R1-Zero 研究者首先提出了一个完全基于强化学习(RL)训练的模型DeepSeek-R1-Zero,该模型不依赖任何有监督微调(SFT)数据。 通过RL训练,DeepSeek-R1-Zero展现出了令人印象深刻的推理能力和自主学习能力。 2.引入冷启动数据的RL模型DeepSeek-R1 尽管DeepSeek-R1-Zero取得了优异的性能,但也存在着输出可读性差、语言混用等问题。 DeepSeek-R1已经在这条道路上迈出了坚实的一步。 总结 DeepSeek-R1-Zero是一个完全基于强化学习(RL)训练的模型在没有任何有监督数据的情况下,通过自我进化掌握了强大的推理能力。
云帆沧海
2025-02-13
4720
标签:
刚刚DeepSeek开源新模型DeepSeek-OCR
就在3个小时前,DeepSeek突然在HuggingFace上传新模型DeepSeek-OCR,一个只有3B大小的文档解析新模型,该模型的目标是探索视觉文本压缩的边界。 在生产环境中,DeepSeek-OCR能够以单个A100-40G GPU的计算能力,每天生成 200k+ 页的训练数据,供大语言模型或视觉语言模型使用。 markdown格式输出: prompt = "<image>\n<|grounding|>Convert the document to markdown. " 以下是一些案例: 案例2解析图标: 看来DeepSeek 模型地址:https://huggingface.co/deepseek-ai/DeepSeek-OCR
AgenticAI
2025-11-29
5080
标签:
实践DeepSeek
作为一名长期关注和实践人工智能技术的爱好者,我体验了腾讯云大模型知识引擎与 DeepSeek 的结合应用,接下来说一下我的感受吧! 腾讯云大模型知识引擎与 DeepSeek腾讯云大模型知识引擎是面向企业客户及合作伙伴的基于大模型的知识应用构建平台。 DeepSeek - R1 是 671B 模型,它经过强化学习训练,在推理过程中会进行大量的反思和验证,思维链长度可达数万字。 DeepSeek - V3 则是 671B 参数的 MoE 模型,在百科知识、数学推理等多项任务上表现突出。 在模型设置中,我毫不犹豫地选择了 “DeepSeek - R1/V3” 模型,并开启了 “联网搜索” 开关。
星空宇航员
2025-03-20
2240
标签:
DeepseekDeepSeek-R1训练方式分析
本博客参考Deepseek开源论文:DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning1 .纯强化学习训练的语言模型 DeepSeek-R1-Zero研究者首先提出了一个完全基于强化学习(RL)训练的模型DeepSeek-R1-Zero,该模型不依赖任何有监督微调(SFT)数据。 通过RL训练,DeepSeek-R1-Zero展现出了令人印象深刻的推理能力和自主学习能力。 2.引入冷启动数据的RL模型DeepSeek-R1尽管DeepSeek-R1-Zero取得了优异的性能,但也存在着输出可读性差、语言混用等问题。 DeepSeek-R1已经在这条道路上迈出了坚实的一步。
云帆沧海
2025-02-13
1.1K0
标签:
DeepSeek Prompt指南
序 本文主要研究一下如何写出更适合DeepSeek的Prompt 官方提示库 DeepSeek API 文档-提示库提供了一些DeepSeek 提示词样例。 对于非代码接入的场景,具体可以使用腾讯元器创建一个智能体,通过这个智能体来优化Prompt,再使用优化后的Prompt去DeepSeek执行 [图片] 如果是代码接入的,直接一次调用就可以 from >" ) completion = client.chat.completions.create( model="deepseek-chat", messages=[ 小结 使用AI来回答问题,Prompt的好坏很大程度决定了DeepSeek回答的内容,但是普通人要去学习那些Prompt有些费劲,把这个也交给DeepSeek一举两得。 doc DeepSeek API 文档-提示库
code4it
2025-02-20
1.8K0
标签:
DeepSeek认知之旅
DeepSeek《认知之旅》记录了DeepSeek V3/R1相关的8篇核心论文,以及最新的原生可训练稀疏注意力机制NSA论文中描述的关键要点,以时间顺序按脑图的形式整理到白板文件中,供大家学习使用。 其中每篇论文的脑图都记录了对应的研究背景、核心贡献、研究方法、评估结果以及一些非常重要的讨论和洞见,用全局视角从这份文件中或可窥得DeepSeek获得如此巨大成功的一些小线索。
用户4034541
2025-02-26
1440
标签:
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档