约 50 个结果
在新选项卡中打开链接
  1. 如何评价 DeepSeek 的 DeepSeek-V3 模型? - 知乎

    尽管DeepSeek-V3展示了per-tile和per-group量化对于模型收敛的重要性,论文中并没有给出对应的FP8矩阵乘法的算子效率。 另外,论文中缺乏per-token加per-channel量化的讨论,不清楚这种实现 …

  2. 有必要自己将deepseek部署到本地吗? - 知乎

    顺带教大家如何在10分钟内零基础地完全本地化部署DeepSeek-R1模型。 1.为什么要自己部署DeepSeek? 最近DeepSeek非常火爆! 它不仅能撰写文案和进行研究,还能联网实时回答问题,堪 …

  3. 深度求索的Deepseek免费开源,这家公司怎么盈利模式是怎样的呢?

    DeepSeek作为开源免费的大模型,其母公司深度求索(DeepSeek)的盈利模式主要基于生态构建、技术服务和产业协同,而非直接通过模型本身收费。 结合搜索结果中的信息,其盈利路径可归纳为以 …

  4. 使用Deepseek需要付费的吗? - 知乎

    2、阿里云百炼新人可领取百万token3: bailian.console.aliyun.com 此外,DeepSeek还为企业提供定制化的解决方案,这类服务通常需要根据具体需求协商价格。 所以,普通用户可以免费使用 …

  5. 如何评价openrouter上疑似deepseek V4的匿名模型 Hunter Alpha

    2026年3月12日 · 如何评价openrouter上疑似deepseek V4的匿名模型 Hunter Alpha 和另一个匿名模型Healer Alpha。

  6. DeepSeek是不是暂时崩了? - 知乎

    2026年3月29日 · 按照deepseek以往出现类似症状的经验,多半是后台在搞更新所导致,往好里想,或许是网上之前传的沸沸扬扬的V4版本要来了。 用不了也没办法,只能等着。 不如趁这个闲下来的时间 …

  7. DeepSeek-V3.2-Exp版本更新,有哪些信息值得关注?

    DeepSeek V3.2,可以说是算法同学最想要、最符合直觉的top 2048 token的sparse attention了,然而,经历过这场适配才能知道,背后有多少infra的坑要踩。 太不容易了,三个时区的同学连轴转一个 …

  8. DeepSeek V4 为什么还不发布? - 知乎

    DeepSeek V4 为什么还不发布? 年初已经有deepseek v4 发布的消息了,但是已经过去2个月了,还是没有看见v4的身影, qwen 已经在春节发布了新版本,确定已经不太成功了,… 显示全部 关注者 628

  9. 国内目前使用的AI智能问答软件,豆包、通义千问、元宝、kimi …

    DeepSeek的搜索是比较拉胯的,搜索生态没有建设好,也没有针对性的深度微调。 DeepSeek的改写能力比豆包要好一点,豆包的语言能力还是要比DeepSeek和Gemini Flash要薄脆一点。 Qwen和Kimi …

  10. 如何看待DeepSeek发布的新模型DeepSeek-Math-V2? - 知乎

    DeepSeek终于回来了,再次创造历史 (首个IMO金奖级别的开源模型)。 就在刚刚,DeepSeek在HuggingFace开源了全新的数学推理模型DeepSeekMath-V2,685B参数。