惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

Security Archives - TechRepublic
Security Archives - TechRepublic
O
OpenAI News
W
WeLiveSecurity
Hacker News: Ask HN
Hacker News: Ask HN
Hacker News - Newest:
Hacker News - Newest: "LLM"
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
T
Troy Hunt's Blog
L
LINUX DO - 最新话题
SecWiki News
SecWiki News
Schneier on Security
Schneier on Security
Exploit-DB.com RSS Feed
Exploit-DB.com RSS Feed
N
News and Events Feed by Topic
TaoSecurity Blog
TaoSecurity Blog
H
Heimdal Security Blog
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
P
Palo Alto Networks Blog
Project Zero
Project Zero
Attack and Defense Labs
Attack and Defense Labs
C
CXSECURITY Database RSS Feed - CXSecurity.com
T
Tor Project blog
Scott Helme
Scott Helme
T
Threat Research - Cisco Blogs
Simon Willison's Weblog
Simon Willison's Weblog
Spread Privacy
Spread Privacy
Cisco Talos Blog
Cisco Talos Blog
T
Threatpost
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
The Last Watchdog
The Last Watchdog
Google DeepMind News
Google DeepMind News
P
Privacy & Cybersecurity Law Blog
Know Your Adversary
Know Your Adversary
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
L
Lohrmann on Cybersecurity
Cloudbric
Cloudbric
I
Intezer
The Hacker News
The Hacker News
L
LINUX DO - 热门话题
AI
AI
B
Blog
S
Securelist
P
Proofpoint News Feed
量子位
Jina AI
Jina AI
V2EX - 技术
V2EX - 技术
T
The Exploit Database - CXSecurity.com
酷 壳 – CoolShell
酷 壳 – CoolShell
Recent Commits to openclaw:main
Recent Commits to openclaw:main
C
CERT Recently Published Vulnerability Notes
J
Java Code Geeks
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻

DeepSeek on 张智勇 - 创业、投资

暂无文章

DeepSeek 发布 R1 后的 10 多天
2025-02-01 · via DeepSeek on 张智勇 - 创业、投资

本文是 A4 周刊 2025 年第 5 周的扩展阅读材料。

时间线

1 月 20 日,DeepSeek 发布 R1 大模型,性能与OpenAI的o1模型相当,但成本远低于竞争产品。一些先行者(例如小编)率先感受到这个模型的厉害之处,但还没有立即发酵。

1月24日,DeepSeek-R1在聊天机器人竞技场(Chatbot Area)榜单上综合排名第三,与OpenAI的ChatGPT o1并列,在高难度提示词、代码和数学等领域更是位列第一

1 月26 日:DeepSeek 登顶苹果中国地区和美国地区应用商店免费 APP 下载排行榜,超越了 ChatGPT。之后大约在全球 140 多个国家的 APP 下载排行榜登顶。

1 月 27 日,DeepSeek 的成功让市场怀疑是不是还需要那么多 AI 芯片,英伟达股价一度下跌了 17%,市值缩水近 6000 亿美元。整个美股跌没了 1 万亿美元。当然后来涨回来不少。

1 月 28 日,DeepSeek 官网发出公告,其线上服务遭受大规模恶意攻击,攻击 IP 地址均来自美国。

1 月 28 日,美国多名官员称 DeepSeek 是 “偷窃”,并开展国家安全调查,美国海军提醒 “不得以任何形式下载、安装或使用 DeepSeek 模型”。

1 月 29 日,OpenAI 首席研究官 Mark Chen 发帖称,“外界对(DeepSeek 的)成本优势的解读有些过头”。

1 月 29 日,彭博社报道,OpenAI 和微软正在调查 DeepSeek 是否通过 OpenAI 的 API 集成了其数据。

1 月 29 日,DeepSeek 在意大利地区的苹果和谷歌应用商店中被下架 。

1 月 30 日,Anthropic 的 CEO 开始声讨 DeepSeek,建议美国加大芯片禁运力度。

1 月 30 日,微软宣布将 DeepSeek 的 R1 模型纳入 Azure AI 平台和 GitHub。

1 月 30 日,美国商务部开始调查中国人工智能公司 DeepSeek 是否使用了禁止出口到中国的美国芯片。

1 月 30 日,多个国家,如爱尔兰、韩国,要求 DeepSeek 提供对该国用户数据处理的信息。

1 月 31 日,英伟达网站显示,DeepSeek - R1 671b 已作为英伟达 NIM 微服务预览版在build.nvidia.com上发布。

2 月 1 日,亚马逊云科技宣布,DeepSeek 的 R1 模型已全面上线 Amazon Bedrock 和 Amazon SageMaker AI 平台。

不同角色的反应

总体而言:中国欢呼美国慌,企业在商言商。

  1. 美国和各国政府

    美国:由「不错不错,恭喜恭喜」,到「我怀疑你偷窃」「你威胁我们的安全」,到「我怀疑你偷偷买了我们的芯片」。

    其他国家:下架,或者,你解释一下你是怎么处理我国用户的隐私数据的?(编者:其实不能说外国都是坏的,一定程度上体现了 DeepSeek 爆火的速度太快,还没有面相国际市场的准备,而外国本来就很重视隐私,不能说是刻意针对 DeepSeek)

  2. 美国 AI 大模型公司

    DeepSeek 没那么强,特别是「没那么便宜」,R1 号称只用了几百万美元训练费用,属于误导,例如没有计算硬件费用(说 DeepSeek 有 5 亿美元的芯片),没有计算之前做准备的投入,同等口径下,Claude 也只用了 3000 万美元(小编:这个解释我是认同的)。

    DeepSeek 偷了我们的数据,是使用了我们的数据在做训练属于作弊。(小编:蒸馏可能是存在的,但不一定是 OpenAI 的数据,外界分析可能是阿里的数据或者 Meta 的数据,但后面这些本来就是开源的)

    国家要出手采取更加严厉的芯片禁运政策,不能让中国人在 AI 领域反超我们(Calude CEO 的博客)。

    被偷家了,不能藏着掖着了,要赶紧把准备过段时间再发布的模型发布了,要赶紧把价格降下来(OpenAI 发布 o3-mini)。

  3. 美国非 AI 大模型公司

    微软、亚马逊等云服务商:抓紧合作,生意的归生意。

    英伟达:集成 DeepSeek。

  4. 现在还不好说 DeepSeek 所受的攻击来自何方,但,实事求是的说,以 DeepSeek 过去一段时间的热度来说,他的服务能力本来就无法承接汹涌而来的流量,特别是「推理」和「搜索」都打开的情况;简单说,DeepSeek 可能只准备了让 1 万人访问,结果一下子来了 1 亿人,这看起来就是被攻击。——当然,我不了解具体情况。

我的基本观点

  1. 不是 AI 的终点,是 AI 迈进了一大步,是好事,不管对中美;
  2. DeepSeek 肯定是用了很多技巧,可能确实有一部分不那么道德,但结果是确实便宜(即使高于或者远高于 560 万美元)和强大。
  3. 对英伟达也不是坏事,甚至可能是好事(基于 1,可能会由几个 LLM 购买到所有企业都要购买),当然我依然无法对英伟达的股价做判断。