惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

L
LangChain Blog
Security Latest
Security Latest
P
Proofpoint News Feed
GbyAI
GbyAI
PCI Perspectives
PCI Perspectives
博客园 - Franky
N
Netflix TechBlog - Medium
博客园_首页
WordPress大学
WordPress大学
K
Kaspersky official blog
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
Vercel News
Vercel News
T
Threatpost
The Hacker News
The Hacker News
H
Help Net Security
S
Securelist
Recent Announcements
Recent Announcements
腾讯CDC
T
Tailwind CSS Blog
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
Engineering at Meta
Engineering at Meta
C
Cisco Blogs
V
V2EX
C
Check Point Blog
S
Schneier on Security
Cyberwarzone
Cyberwarzone
C
Cybersecurity and Infrastructure Security Agency CISA
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
B
Blog RSS Feed
H
Hackread – Cybersecurity News, Data Breaches, AI and More
Jina AI
Jina AI
M
MIT News - Artificial intelligence
T
Threat Research - Cisco Blogs
博客园 - 叶小钗
A
Arctic Wolf
AWS News Blog
AWS News Blog
Latest news
Latest news
Martin Fowler
Martin Fowler
Recorded Future
Recorded Future
Last Week in AI
Last Week in AI
The GitHub Blog
The GitHub Blog
小众软件
小众软件
B
Blog
aimingoo的专栏
aimingoo的专栏
C
Cyber Attacks, Cyber Crime and Cyber Security
V
Visual Studio Blog
P
Palo Alto Networks Blog
Spread Privacy
Spread Privacy

阮一峰的网络日志

科技爱好者周刊(第 396 期):互联网通信的替代方案 科技爱好者周刊(第 396 期):互联网通信的替代方案 - 阮一峰的网络日志 科技爱好者周刊(第 395 期):软件开发的第三种方式 科技爱好者周刊(第 395 期):软件开发的第三种方式 - 阮一峰的网络日志 科技爱好者周刊(第 393 期):脑腐状态 科技爱好者周刊(第 392 期):axios 投毒与好莱坞式骗术 科技爱好者周刊(第 391 期):AI 的贫富分化 科技爱好者周刊(第 390 期):没有语料,大模型就是智障 套壳中国大模型撑起500亿美元估值?扒一扒 Cursor 的"套壳"疑云 科技爱好者周刊(第 389 期):未来如何招聘程序员 科技爱好者周刊(第 388 期):测试是新的护城河 零安装的"云养虾":ArkClaw 使用指南 科技爱好者周刊(第 387 期):你是领先的 科技爱好者周刊(第 386 期):当外卖员接入 AI 字节全家桶 Seed 2.0 + TRAE 玩转 Skill 科技爱好者周刊(第 385 期):马斯克害怕中国车企吗? 智谱旗舰 GLM-5 实测:对比 Opus 4.6 和 GPT-5.3-Codex 科技爱好者周刊(第 384 期):为什么软件股下跌 科技爱好者周刊(第 383 期):你是第几级 AI 编程 Kimi 的一体化,Manus 的分层 科技爱好者周刊(第 382 期):独立软件的黄昏 AI native Workspace 也许是智能体的下一阶段 科技爱好者周刊(第 381 期):中国 AI 大模型领导者在想什么 科技爱好者周刊(第 380 期):为什么人们拥抱"不对称收益" 科技爱好者周刊(第 379 期):《硅谷钢铁侠》摘录 我如何用 AI 处理历史遗留代码:MiniMax M2.1 升级体验 科技爱好者周刊(第 378 期):预测是新的互联网热点 科技爱好者周刊(第 377 期):14万美元的贫困线 科技爱好者周刊(第 376 期):太空数据中心的争议 科技爱好者周刊(第 375 期):一扇门的 Bug 终于有人做了 Subagent,TRAE 国内版 SOLO 模式来了 科技爱好者周刊(第 374 期):6GHz 的问题 VS Code 使用国产大模型 MiniMax M2 教程 科技爱好者周刊(第 373 期):数据模型是新产品的核心 国产大模型接入 Claude Code 教程:以 Doubao-Seed-Code 为例 科技爱好者周刊(第 372 期):软件界面如何设计 大模型比拼:MiniMax M2 vs GLM 4.6 vs Claude Sonnet 4.5 科技爱好者周刊(第 371 期):一个乐观主义者的专访 科技爱好者周刊(第 370 期):正确的代码高亮 错误处理:异常好于状态码 科技爱好者周刊(第 369 期):Tim 与罗永浩的对谈 科技爱好者周刊(第 368 期):不要这样管理软件团队 一天之内,智谱和 Anthropic 都发了最强编程模型 科技爱好者周刊(第 367 期):Nano Banana 的几个妙用 科技爱好者周刊(第 366 期):旧金山疯狂的 AI 广告 科技爱好者周刊(第 365 期):流量变现正在崩塌 科技爱好者周刊(第 364 期):最难还原的魔方 科技爱好者周刊(第 363 期):最好懂的神经网络解释 科技爱好者周刊(第 362 期):GitHub 工程师谈系统设计 科技爱好者周刊(第 361 期):暗网 Tor 安全吗? 科技爱好者周刊(第 360 期):Dan Wang 的新书 科技爱好者周刊(第 359 期):Palantir 值得关注 科技爱好者周刊(第 358 期):如何拯救一家濒临倒闭的创业公司 扣子空间网页设计,是在挑战 V0 吗? 《唐纵日记》摘录 科技爱好者周刊(第 357 期):稳定币的博弈 科技爱好者周刊(第 356 期):公司强推 AI 编程,我该怎么办 科技爱好者周刊(第 355 期):两本《芯片战争》 科技爱好者周刊(第 354 期):8000mAh 手机电池,说明了什么? 国产 AI 网页开发工具:豆包 AI 编程简单测评 科技爱好者周刊(第 353 期):苹果的"液态玻璃"是为了 AR 科技爱好者周刊(第 352 期):Bug 追踪系统的正确样子 科技爱好者周刊(第 351 期):GitHub Issues(几乎)是最好的笔记应用 科技爱好者周刊(第 350 期):Java 三十周年 科技爱好者周刊(第 349 期):神经网络算法的发明者 科技爱好者周刊(第 348 期):李飞飞,从移民到 AI 明星 科技爱好者周刊(第 347 期):冷启动的破解之道 谷歌的 NotebookLM 能生成中文播客了 科技爱好者周刊(第 346 期):未来就是永恒感的丧失 巨头的新战场:AI 编程 IDE(暨 字节 Trae 调用 MCP 教程) 办公类 AI 初探:扣子空间 科技爱好者周刊(第 345 期):HDMI 2.2 影音可能到头了 科技爱好者周刊(第 344 期):制造业正在"零工化" 科技爱好者周刊(第 343 期):如何阻止 AI 爬虫 科技爱好者周刊(第 342 期):面试的 AI 作弊----用数字人去面试 科技爱好者周刊(第 341 期):低代码编程,恐怕不会成功 科技爱好者周刊(第 340 期):技术炒作三十年 Trae 国内版出来了,真的好用吗? 科技爱好者周刊(第 339 期):代币是什么 科技爱好者周刊(第 338 期):重新思考 6G 科技爱好者周刊(第 337 期):互联网创业几乎没了 科技爱好者周刊(第 336 期):面对 AI,互联网正在衰落 科技爱好者周刊(第 335 期):年底的未来已来 科技爱好者周刊(第 334 期):年终笔记四则 AI 搞定微信小程序 科技爱好者周刊(第 333 期):一切都要支付两次 科技爱好者周刊(第 332 期):西蒙·威利森的年终总结,梁文锋的访谈 科技爱好者周刊(第 331 期):你可能是一个 NPC 科技爱好者周刊(第 330 期):李开复梳理人工智能 科技爱好者周刊(第 329 期):示意图利器 D2 科技爱好者周刊(第 328 期):AI 模型不是一门好生意 AI 应用无代码开发教程:工作流模式详解 科技爱好者周刊(第 327 期):没有链接的互联网 科技爱好者周刊(第 326 期):世界没有那么多财富 科技爱好者周刊(第 325 期):VS Code 编辑器的下一站是 Zed? 科技爱好者周刊(第 324 期):人类已知的最大质数 科技爱好者周刊(第 323 期):技术公司的口号比拼 AI 开发的捷径:工作流模式 科技爱好者周刊(第 322 期):内容行业的内幕 科技爱好者周刊(第 321 期):傅盛回忆录
科技爱好者周刊(第 284 期):YouTube 有多少个视频?
阮一峰 · 2023-12-29 · via 阮一峰的网络日志

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系[email protected])。

封面图

一位意大利摄影师,苦苦尝试了6年,终于在本月拍到了一张难以置信的照片:大教堂、山峰、月亮处于一条直线,并且地球反射的太阳光,通过长曝光,可以照亮月亮顶部。(via

YouTube 有多少个视频?

YouTube 是世界最大视频网站,全世界的人都在上传视频。

但是,它没有透露过,内部一共有多少个视频。

上周,网上出现了一篇有趣的文章,使用概率方法,估计 YouTube 的视频总数。

这篇文章非常有启发意义,面试可能也会出这一类的题目。下面,我就分享作者是怎么做的。

我们知道,每一个 YouTube 视频都有唯一编号,放在 URL 里面。

比如,某个视频的 URL 是https://www.youtube.com/watch?v=NJHG0yuBabQ&,那么它的视频编号就是NJHG0yuBabQ&

YouTube 也没有透露过,这个编号是怎么产生的。

但是根据观察,可以得知它是一个11位字符串,前十位字符的取值范围是64个值([a-zA-Z0-9_-]),最后的第十一位字符的取值范围只有16个值。

这意味着,所有的编号一共有 2^64 种可能,这是一个超级巨大的数字,足以容纳过去和将来所有可能生成的视频。

显然,不是每一个编号,都有对应的视频,绝大部分是空号,而且空号远远多于实际视频。如果我们假定,YouTube 一共有10亿个视频,那么你大概猜184亿次,才会猜中一个有效的编号(前提是这些编号为均匀分布)。

那么,我们可以反推,通过抽中有效编号的概率,判断出 YouTube 一共有多少个视频

这就好比,某个地区的电话号码是从 843-000-0000 到 843-999-9999,一共有1000万个号码。我们随机拨打100个号码,如果其中10个可以接通(即10%的接通率),我们就可以判断出,大概有100万人拥有843号码,其他900万个都是空号。

那篇文章的作者就使用这种方法,随机构造视频编号,看看命中多少个,然后得到了一个结论:2023年 YouTube 的视频总数估计为 133.25 亿

他们不仅估计了视频总数,还估计了其他很多指标,全部公开在网站 tubestats.org 上面。

根据这些数据,可以得到一些有趣的观察。

  • 2023年 YouTube 共有133亿个视频,2022年是93亿个,年增长率超过40%。
  • 4.5% 的视频一次也没有播放过。
  • 72% 的视频一条评论也没有。
  • 60% 的视频是 Vlog(个人生活)。
  • 9分钟到16分钟的视频最多,占到20%。

如果你对长视频的数据感兴趣,可以去这个网站挖掘。

最后,我看到网友提到,这种判断方法并不新鲜。生物学家早就用它,了解湖泊中鱼的总数。

你在池塘里钓到100条鱼,全部做好了标识,然后放生。过了一个星期,你又去钓了100条鱼,发现其中有30条是上周钓到过的,请问这个池塘一共有多少条鱼?

科技动态

1、自动驾驶灯

奔驰汽车最近获得批准,在车辆上添加绿松石灯光。

这种灯光亮起时,就表示车辆处于自动驾驶状态。即使驾驶座上有司机,他此时也没有控制方向盘。

根据上图,该灯光出现在多个部位,包括车前灯、车后灯和后视镜上。

这个设计可能会成为所有车辆的共同标准。以后,我们通过车灯,就能区分自动驾驶车辆和人类驾驶车辆。但是那样,未来的马路上会不会都是一片青绿色?

2、64核笔记本

国内某厂商居然将服务器的64核 AMD EPYC CPU,放进了笔记本,并配上 RTX4080 显卡和液冷降温。

这可能是史上性能最强的笔记本了,因为用的是服务器配置。目前市场上性能最强的笔记本,不过是16核 CPU,而它是64核。

它的厚度为4.6厘米,其实还可以,但这造型太像板砖了,工业设计未免简陋了。

3、Cybertruck 涉水模式

马斯克在推特上宣布(下图),Cybertruck 将有一个套装,可以变成船,在水里至少开100米。

早先媒体已经确认,Cybertruck 的菜单里面确实有一个"涉水模式"(ward mode)(下图),看来真的可以在水里开。

但是,这个车非常重,很难想象可以浮在水面上,更大可能是溯溪,车轮可以接触到水底。

有的媒体恶搞,猜测马斯克所说的"套装"是一个气垫船的底盘,可以装在 Cybertruck 的下面,还画了想象图。

4、GitHub 贡献墙

有些国外的 HR 招聘人员,会查看求职者的 GitHub 贡献墙。

一篇文章透露,像下图这样的贡献墙,可能会让招聘官留下不好的印象,导致求职被拒。

上图这位程序员,周末两天基本不提交代码,圣诞假期、春假、暑假、秋假也很少提交。

5、绵羊除草

为了保持草坪整洁,除草机是必需的。但是,它的噪音很大,与安宁的环境不太协调。

加州大学戴维斯分校最近引入了绵羊,尝试用绵羊除草,而不是除草机。

最初这只是一个实验,看看绵羊能否替代除草机。但是后来发现,绵羊除了吃草,本身也是一道风景,并具有自然疗法的效果,让人们感到心灵平静。

现在,每天放出羊群到草坪上吃草,已经成了该校的固定做法。许多学生表示,绵羊让他们减轻了压力。

但是,绵羊需要额外的管理。每天早上,运输车将绵羊运入校园,晚上再运回谷仓,这是非常麻烦的,恐怕很难推广开来。

文章

1、为什么手机最后1%的电可以用很久?(中文)

本文介绍手机剩余电量的计算方法。

2、如何在 Windows 删除 Edge(中文)

微软为了遵守欧元区的监管规定,允许该区域的用户卸载 Edge 并移除 Bing。网友找到了变通方法,让非欧元区的用户也能卸载 Edge。(@WFANG12719 投稿)

3、iPhone 允许应用追踪用户(中文)

iPhone 有一个 API,能够获取用户的 WiFi 接入点,从而在用户无感知的情况下对其精确定位,该功能还无法关闭。

4、了解图形系统 X(中文)

Linux 图形环境的底层是 X 图形系统,本文对它进行一个通俗的介绍。(@silaoA 投稿)

5、开源公司的生与死(英文)

一个外国人程序员购买了中国产的 3D 打印机 Bambu Lab A1。他很喜欢这台打印机,感叹中国公司基于其他人的开源软件,做出了更好的产品,威胁到了原始的开源公司的生存。

6、如何用 Node.js 写一个命令行工具(英文)

本文介绍如果用 Node.js 的标准库,不加载任何外部模块,写一个命令行工具。

7、如何拷贝 Windows 不能拷贝的文本(英文)

本文介绍三种方法,在 Windows 拷贝那些无法拷贝的文字,比如窗口面板上的文字(上图)。

8、Firefox 的多账户容器(英文)

Firefox 允许新建容器,在容器里面访问某个网站。这不仅可以保护隐私,还可以同时登录单个网站的多个账户。

工具

1、Score In URL

一个在线编辑和分享乐谱的网站,乐谱保存在 URL 之中。

2、Teamlinker

一个开源的团队协作平台,包含项目、Wiki、日历、会议、聊天和网盘等功能。(@xbdsky 投稿)

3、Rspress

基于 Rspack 的静态站点生成器,内置了 Rust 工具链,性能优秀,上手简单。(@sanyuan0704 投稿)

4、AudioCut

一个 Web 工具,可以自动剪辑音频文件,去除噪音和重复内容,删除选中的单词和句子,适合编辑播客。(@tangpanqing 投稿)

5、Tianji

一个开源工具,网站流量分析 + 业务监控告警 + 服务器监控三合一,三种服务做在了一起。(@moonrailgun 投稿)

7、Memo Card

一个 Web 工具,用来生成文字分享的卡片图。(@ivone-liu 投稿)

8、vocal-separate

一款极简的人声和背景音乐分离工具,将音视频文件分离为单独的人声文件和伴奏文件,完全本地化作业,无需连接外网。(@jianchang512 投稿)

9、DouyinLiveRecorder

一款免费的直播录制工具,支持录制抖音、Tiktok、快手、虎牙、斗鱼、B站、小红书等多平台的直播视频。(@ihmily 投稿)

10、Drawing Prompt

一个文生图的辅助工具,可以自动扩展提示语,将简短的提示(非英语也可以)变成详尽丰富的英语提示,免费且无需登录。还支持生成随机的提示词 tag 组合,并内嵌 Fast SDXL 模型,用于预览效果。(@dongan-beta 投稿)

11、cloudflare-ai-web

通过免费的 Cloudflare Worker,搭建一个你自己的 AI 平台,支持切换多个 AI 模型,试用 Demo。(@Jazee6 投稿)

12、Penumbra

一种配色方案,有明暗两个主题。据说是通过数学计算得到的、最有利于感知的配色方案。

资源

1、计算机科学热门论文(英文)

该网站按照动态排名,列出计算机领域的最新热门论文。

2、黑客新闻电讯

这个网站使用 AI,将"黑客新闻"每天的热点写成一篇篇报道,以后的"内容农场"大概就是这种样子。

3、老式电脑纸模型

该网站提供各种老式电脑的折纸模型下载。

4、Kickass markdown

这个仓库收集各种 GitHub Markdown 技巧,比如显示红底白字(上图)。

5、Hugging Face 课程

著名 AI 平台 Hugging Face 的官方学习频道,目前有三门课程:NLP、深度学习和 AI 音频处理。

图片

1、波浪墙

英国的很多砖墙砌成波浪形。

表面上看,这样既浪费土地,又费工,但是它也有显著的优点。

它采用拱桥的曲面结构,具有更强的抗压力,所以比直墙更牢固,因此它可以修得很薄,比较节省材料。

文摘

1、香农与爱因斯坦

信息论奠基人香农的传记里面,记录了一段他与爱因斯坦的趣事。

博士毕业以后,香农来到普林斯顿高等研究院,爱因斯坦也在那里。

当时,香农只是一个小讲师,而爱因斯坦已经是名满世界的大科学家。

有一次,香农正在研究院给一群数学家上课,教室的后门打开了,爱因斯坦走了进来。

爱因斯坦站着听了几分钟课,然后与后排的一个听课者耳语一番,就离开了教室。

课程结束后,香农匆匆忙忙地赶到教室后排,找到那个与爱因斯坦耳语的人,迫切想要知道这名伟大的科学家对他的讲课内容有哪些评价。

那个人告诉他:"爱因斯坦只是问了洗手间怎么走。"

言论

1、

直到有一天,你意识到了你会死,手头的事情做不完,一切就都发生了改变。从那一天开始,你花费的时间才是真正花出去的时间。

-- 马丁·斯科塞斯,美国著名电影导演,今年80岁

2、

亚历山大大帝建立马其顿帝国后,有一天突然哭了,因为他感到没有更多的世界可以征服了。

-- 古罗马作家普鲁塔克

3、

普通人很难理解天才的思考过程,因为天才一方面很难向他人解释自己的想法,另一方面也不屑于这样做。

-- 乔治·亨利·刘易斯,英国哲学家

4、

专利流氓利用 AI 生成大量想法,然后逐一申请专利,这只是时间问题。

-- Hacker News 读者

5、

作家总是与一张白纸(或一个空白屏幕)进行对抗,通常是白纸获胜。

ChatGPT 的用户总是与一个空白文本框进行对抗,通常是空白文本框获胜。

-- dbreunig.com

往年回顾

真实方位是如何暴露的?(2022 #237)

元宇宙会成功吗(2021 #187)

Slack 被收购,以及企业的技术选型(2020 #137)

新人要为团队写文档(2019 #87)

(完)