慣性聚合 高效追蹤和閱讀你感興趣的部落格、新聞、科技資訊
閱讀原文 在慣性聚合中打開

推薦訂閱源

博客园 - 司徒正美
V
V2EX
T
Tailwind CSS Blog
有赞技术团队
有赞技术团队
aimingoo的专栏
aimingoo的专栏
Apple Machine Learning Research
Apple Machine Learning Research
IT之家
IT之家
Blog — PlanetScale
Blog — PlanetScale
A
About on SuperTechFans
月光博客
月光博客
T
The Blog of Author Tim Ferriss
宝玉的分享
宝玉的分享
Martin Fowler
Martin Fowler
博客园 - 聂微东
The GitHub Blog
The GitHub Blog
V
Visual Studio Blog
WordPress大学
WordPress大学
酷 壳 – CoolShell
酷 壳 – CoolShell
Engineering at Meta
Engineering at Meta
GbyAI
GbyAI

阮一峰的网络日志

科技爱好者周刊(第 396 期):互联网通信的替代方案 科技爱好者周刊(第 396 期):互联网通信的替代方案 - 阮一峰的网络日志 科技爱好者周刊(第 395 期):软件开发的第三种方式 科技爱好者周刊(第 395 期):软件开发的第三种方式 - 阮一峰的网络日志 科技爱好者周刊(第 393 期):脑腐状态 科技爱好者周刊(第 392 期):axios 投毒与好莱坞式骗术 科技爱好者周刊(第 391 期):AI 的贫富分化 科技爱好者周刊(第 390 期):没有语料,大模型就是智障 套壳中国大模型撑起500亿美元估值?扒一扒 Cursor 的"套壳"疑云 科技爱好者周刊(第 389 期):未来如何招聘程序员 科技爱好者周刊(第 388 期):测试是新的护城河 零安装的"云养虾":ArkClaw 使用指南 科技爱好者周刊(第 387 期):你是领先的 科技爱好者周刊(第 386 期):当外卖员接入 AI 字节全家桶 Seed 2.0 + TRAE 玩转 Skill 科技爱好者周刊(第 385 期):马斯克害怕中国车企吗? 智谱旗舰 GLM-5 实测:对比 Opus 4.6 和 GPT-5.3-Codex 科技爱好者周刊(第 384 期):为什么软件股下跌 科技爱好者周刊(第 383 期):你是第几级 AI 编程 Kimi 的一体化,Manus 的分层 科技爱好者周刊(第 382 期):独立软件的黄昏 AI native Workspace 也许是智能体的下一阶段 科技爱好者周刊(第 381 期):中国 AI 大模型领导者在想什么 科技爱好者周刊(第 380 期):为什么人们拥抱"不对称收益" 科技爱好者周刊(第 379 期):《硅谷钢铁侠》摘录 我如何用 AI 处理历史遗留代码:MiniMax M2.1 升级体验 科技爱好者周刊(第 378 期):预测是新的互联网热点 科技爱好者周刊(第 377 期):14万美元的贫困线 科技爱好者周刊(第 376 期):太空数据中心的争议 科技爱好者周刊(第 375 期):一扇门的 Bug 终于有人做了 Subagent,TRAE 国内版 SOLO 模式来了 科技爱好者周刊(第 374 期):6GHz 的问题 VS Code 使用国产大模型 MiniMax M2 教程 科技爱好者周刊(第 373 期):数据模型是新产品的核心 国产大模型接入 Claude Code 教程:以 Doubao-Seed-Code 为例 科技爱好者周刊(第 372 期):软件界面如何设计 大模型比拼:MiniMax M2 vs GLM 4.6 vs Claude Sonnet 4.5 科技爱好者周刊(第 371 期):一个乐观主义者的专访 科技爱好者周刊(第 370 期):正确的代码高亮 错误处理:异常好于状态码 科技爱好者周刊(第 369 期):Tim 与罗永浩的对谈 科技爱好者周刊(第 368 期):不要这样管理软件团队 一天之内,智谱和 Anthropic 都发了最强编程模型 科技爱好者周刊(第 367 期):Nano Banana 的几个妙用 科技爱好者周刊(第 366 期):旧金山疯狂的 AI 广告 科技爱好者周刊(第 365 期):流量变现正在崩塌 科技爱好者周刊(第 364 期):最难还原的魔方 科技爱好者周刊(第 363 期):最好懂的神经网络解释 科技爱好者周刊(第 362 期):GitHub 工程师谈系统设计 科技爱好者周刊(第 361 期):暗网 Tor 安全吗?
科技愛好者週刊(第 284 期):YouTube 有多少個視頻?
阮一峰 · 2023-12-29 · via 阮一峰的网络日志

這裡記錄每週值得分享的科技內容,週五發佈。

本雜誌開源,歡迎投稿。另有《誰在招人》服務,發佈程序員招聘信息。合作請郵件聯繫[email protected])。

封面圖

一位意大利攝影師,苦苦嘗試了6年,終於在本月拍到了一張難以置信的照片:大教堂、山峰、月亮處於一條直線,並且地球反射的太陽光,通過長曝光,可以照亮月亮頂部。(via

YouTube 有多少個視頻?

YouTube 是世界最大視頻網站,全世界的人都在上傳視頻。

但是,它沒有透露過,內部一共有多少個視頻。

上週,網上出現了一篇有趣的文章,使用概率方法,估計 YouTube 的視頻總數。

這篇文章非常有啟發意義,面試可能也會出這一類的題目。下面,我就分享作者是怎麼做的。

我們知道,每一個 YouTube 視頻都有唯一編號,放在 URL 裡面。

比如,某個視頻的 URL 是https://www.youtube.com/watch?v=NJHG0yuBabQ&,那麼它的視頻編號就是NJHG0yuBabQ&

YouTube 也沒有透露過,這個編號是怎麼產生的。

但是根據觀察,可以得知它是一個11位字符串,前十位字符的取值範圍是64個值([a-zA-Z0-9_-]),最後的第十一位字符的取值範圍只有16個值。

這意味著,所有的編號一共有 2^64 種可能,這是一個超級巨大的數字,足以容納過去和將來所有可能生成的視頻。

顯然,不是每一個編號,都有對應的視頻,絕大部分是空號,而且空號遠遠多於實際視頻。如果我們假定,YouTube 一共有10億個視頻,那麼你大概猜184億次,才會猜中一個有效的編號(前提是這些編號為均勻分佈)。

那麼,我們可以反推,通過抽中有效編號的概率,判斷出 YouTube 一共有多少個視頻

這就好比,某個地區的電話號碼是從 843-000-0000 到 843-999-9999,一共有1000萬個號碼。我們隨機撥打100個號碼,如果其中10個可以接通(即10%的接通率),我們就可以判斷出,大概有100萬人擁有843號碼,其他900萬個都是空號。

那篇文章的作者就使用這種方法,隨機構造視頻編號,看看命中多少個,然後得到了一個結論:2023年 YouTube 的視頻總數估計為 133.25 億

他們不僅估計了視頻總數,還估計了其他很多指標,全部公開在網站 tubestats.org 上面。

根據這些數據,可以得到一些有趣的觀察。

  • 2023年 YouTube 共有133億個視頻,2022年是93億個,年增長率超過40%。
  • 4.5% 的視頻一次也沒有播放過。
  • 72% 的視頻一條評論也沒有。
  • 60% 的視頻是 Vlog(個人生活)。
  • 9分鐘到16分鐘的視頻最多,佔到20%。

如果你對長視頻的數據感興趣,可以去這個網站挖掘。

最後,我看到網友提到,這種判斷方法並不新鮮。生物學家早就用它,瞭解湖泊中魚的總數。

你在池塘裡釣到100條魚,全部做好了標識,然後放生。過了一個星期,你又去釣了100條魚,發現其中有30條是上週釣到過的,請問這個池塘一共有多少條魚?

科技動態

1、自動駕駛燈

奔馳汽車最近獲得批准,在車輛上添加綠松石燈光。

這種燈光亮起時,就表示車輛處於自動駕駛狀態。即使駕駛座上有司機,他此時也沒有控制方向盤。

根據上圖,該燈光出現在多個部位,包括車前燈、車後燈和後視鏡上。

這個設計可能會成為所有車輛的共同標準。以後,我們通過車燈,就能區分自動駕駛車輛和人類駕駛車輛。但是那樣,未來的馬路上會不會都是一片青綠色?

2、64核筆記本

國內某廠商居然將服務器的64核 AMD EPYC CPU,放進了筆記本,並配上 RTX4080 顯卡和液冷降溫。

這可能是史上性能最強的筆記本了,因為用的是服務器配置。目前市場上性能最強的筆記本,不過是16核 CPU,而它是64核。

它的厚度為4.6釐米,其實還可以,但這造型太像板磚了,工業設計未免簡陋了。

3、Cybertruck 涉水模式

馬斯克在推特上宣佈(下圖),Cybertruck 將有一個套裝,可以變成船,在水裡至少開100米。

早先媒體已經確認,Cybertruck 的菜單裡面確實有一個"涉水模式"(ward mode)(下圖),看來真的可以在水裡開。

但是,這個車非常重,很難想象可以浮在水面上,更大可能是溯溪,車輪可以接觸到水底。

有的媒體惡搞,猜測馬斯克所說的"套裝"是一個氣墊船的底盤,可以裝在 Cybertruck 的下面,還畫了想象圖。

4、GitHub 貢獻牆

有些國外的 HR 招聘人員,會查看求職者的 GitHub 貢獻牆。

一篇文章透露,像下圖這樣的貢獻牆,可能會讓招聘官留下不好的印象,導致求職被拒。

上圖這位程序員,週末兩天基本不提交代碼,聖誕假期、春假、暑假、秋假也很少提交。

5、綿羊除草

為了保持草坪整潔,除草機是必需的。但是,它的噪音很大,與安寧的環境不太協調。

加州大學戴維斯分校最近引入了綿羊,嘗試用綿羊除草,而不是除草機。

最初這只是一個實驗,看看綿羊能否替代除草機。但是後來發現,綿羊除了吃草,本身也是一道風景,並具有自然療法的效果,讓人們感到心靈平靜。

現在,每天放出羊群到草坪上吃草,已經成了該校的固定做法。許多學生表示,綿羊讓他們減輕了壓力。

但是,綿羊需要額外的管理。每天早上,運輸車將綿羊運入校園,晚上再運回穀倉,這是非常麻煩的,恐怕很難推廣開來。

文章

1、為什麼手機最後1%的電可以用很久?(中文)

本文介紹手機剩餘電量的計算方法。

2、如何在 Windows 刪除 Edge(中文)

微軟為了遵守歐元區的監管規定,允許該區域的用戶卸載 Edge 並移除 Bing。網友找到了變通方法,讓非歐元區的用戶也能卸載 Edge。(@WFANG12719 投稿)

3、iPhone 允許應用追蹤用戶(中文)

iPhone 有一個 API,能夠獲取用戶的 WiFi 接入點,從而在用戶無感知的情況下對其精確定位,該功能還無法關閉。

4、瞭解圖形系統 X(中文)

Linux 圖形環境的底層是 X 圖形系統,本文對它進行一個通俗的介紹。(@silaoA 投稿)

5、開源公司的生與死(英文)

一個外國人程序員購買了中國產的 3D 打印機 Bambu Lab A1。他很喜歡這臺打印機,感嘆中國公司基於其他人的開源軟件,做出了更好的產品,威脅到了原始的開源公司的生存。

6、如何用 Node.js 寫一個命令行工具(英文)

本文介紹如果用 Node.js 的標準庫,不加載任何外部模塊,寫一個命令行工具。

7、如何拷貝 Windows 不能拷貝的文本(英文)

本文介紹三種方法,在 Windows 拷貝那些無法拷貝的文字,比如窗口面板上的文字(上圖)。

8、Firefox 的多賬戶容器(英文)

Firefox 允許新建容器,在容器裡面訪問某個網站。這不僅可以保護隱私,還可以同時登錄單個網站的多個賬戶。

工具

1、Score In URL

一個在線編輯和分享樂譜的網站,樂譜保存在 URL 之中。

2、Teamlinker

一個開源的團隊協作平臺,包含項目、Wiki、日曆、會議、聊天和網盤等功能。(@xbdsky 投稿)

3、Rspress

基於 Rspack 的靜態站點生成器,內置了 Rust 工具鏈,性能優秀,上手簡單。(@sanyuan0704 投稿)

4、AudioCut

一個 Web 工具,可以自動剪輯音頻文件,去除噪音和重複內容,刪除選中的單詞和句子,適合編輯播客。(@tangpanqing 投稿)

5、Tianji

一個開源工具,網站流量分析 + 業務監控告警 + 服務器監控三合一,三種服務做在了一起。(@moonrailgun 投稿)

7、Memo Card

一個 Web 工具,用來生成文字分享的卡片圖。(@ivone-liu 投稿)

8、vocal-separate

一款極簡的人聲和背景音樂分離工具,將音視頻文件分離為單獨的人聲文件和伴奏文件,完全本地化作業,無需連接外網。(@jianchang512 投稿)

9、DouyinLiveRecorder

一款免費的直播錄製工具,支持錄製抖音、Tiktok、快手、虎牙、鬥魚、B站、小紅書等多平臺的直播視頻。(@ihmily 投稿)

10、Drawing Prompt

一個文生圖的輔助工具,可以自動擴展提示語,將簡短的提示(非英語也可以)變成詳盡豐富的英語提示,免費且無需登錄。還支持生成隨機的提示詞 tag 組合,並內嵌 Fast SDXL 模型,用於預覽效果。(@dongan-beta 投稿)

11、cloudflare-ai-web

通過免費的 Cloudflare Worker,搭建一個你自己的 AI 平臺,支持切換多個 AI 模型,試用 Demo。(@Jazee6 投稿)

12、Penumbra

一種配色方案,有明暗兩個主題。據說是通過數學計算得到的、最有利於感知的配色方案。

資源

1、計算機科學熱門論文(英文)

該網站按照動態排名,列出計算機領域的最新熱門論文。

2、黑客新聞電訊

這個網站使用 AI,將"黑客新聞"每天的熱點寫成一篇篇報道,以後的"內容農場"大概就是這種樣子。

3、老式電腦紙模型

該網站提供各種老式電腦的摺紙模型下載。

4、Kickass markdown

這個倉庫收集各種 GitHub Markdown 技巧,比如顯示紅底白字(上圖)。

5、Hugging Face 課程

著名 AI 平臺 Hugging Face 的官方學習頻道,目前有三門課程:NLP、深度學習和 AI 音頻處理。

圖片

1、波浪牆

英國的很多磚牆砌成波浪形。

表面上看,這樣既浪費土地,又費工,但是它也有顯著的優點。

它採用拱橋的曲面結構,具有更強的抗壓力,所以比直牆更牢固,因此它可以修得很薄,比較節省材料。

文摘

1、香農與愛因斯坦

信息論奠基人香農的傳記裡面,記錄了一段他與愛因斯坦的趣事。

博士畢業以後,香農來到普林斯頓高等研究院,愛因斯坦也在那裡。

當時,香農只是一個小講師,而愛因斯坦已經是名滿世界的大科學家。

有一次,香農正在研究院給一群數學家上課,教室的後門打開了,愛因斯坦走了進來。

愛因斯坦站著聽了幾分鐘課,然後與後排的一個聽課者耳語一番,就離開了教室。

課程結束後,香農匆匆忙忙地趕到教室後排,找到那個與愛因斯坦耳語的人,迫切想要知道這名偉大的科學家對他的講課內容有哪些評價。

那個人告訴他:"愛因斯坦只是問了洗手間怎麼走。"

言論

1、

直到有一天,你意識到了你會死,手頭的事情做不完,一切就都發生了改變。從那一天開始,你花費的時間才是真正花出去的時間。

-- 馬丁·斯科塞斯,美國著名電影導演,今年80歲

2、

亞歷山大大帝建立馬其頓帝國後,有一天突然哭了,因為他感到沒有更多的世界可以征服了。

-- 古羅馬作家普魯塔克

3、

普通人很難理解天才的思考過程,因為天才一方面很難向他人解釋自己的想法,另一方面也不屑於這樣做。

-- 喬治·亨利·劉易斯,英國哲學家

4、

專利流氓利用 AI 生成大量想法,然後逐一申請專利,這只是時間問題。

-- Hacker News 讀者

5、

作家總是與一張白紙(或一個空白屏幕)進行對抗,通常是白紙獲勝。

ChatGPT 的用戶總是與一個空白文本框進行對抗,通常是空白文本框獲勝。

-- dbreunig.com

往年回顧

真實方位是如何暴露的?(2022 #237)

元宇宙會成功嗎(2021 #187)

Slack 被收購,以及企業的技術選型(2020 #137)

新人要為團隊寫文檔(2019 #87)

(完)