惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

Engineering at Meta
Engineering at Meta
博客园_首页
H
Help Net Security
WordPress大学
WordPress大学
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
罗磊的独立博客
博客园 - 三生石上(FineUI控件)
B
Blog
I
InfoQ
SecWiki News
SecWiki News
T
Tailwind CSS Blog
Spread Privacy
Spread Privacy
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
V
Vulnerabilities – Threatpost
N
Netflix TechBlog - Medium
P
Palo Alto Networks Blog
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
Vercel News
Vercel News
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
K
Kaspersky official blog
M
MIT News - Artificial intelligence
S
Schneier on Security
T
Threat Research - Cisco Blogs
F
Fortinet All Blogs
Cyberwarzone
Cyberwarzone
Scott Helme
Scott Helme
aimingoo的专栏
aimingoo的专栏
Martin Fowler
Martin Fowler
MyScale Blog
MyScale Blog
The Cloudflare Blog
Recent Announcements
Recent Announcements
Security Latest
Security Latest
G
GRAHAM CLULEY
IT之家
IT之家
Y
Y Combinator Blog
The Last Watchdog
The Last Watchdog
腾讯CDC
Google DeepMind News
Google DeepMind News
V
V2EX
S
Securelist
TaoSecurity Blog
TaoSecurity Blog
B
Blog RSS Feed
S
SegmentFault 最新的问题
博客园 - 叶小钗
P
Proofpoint News Feed
云风的 BLOG
云风的 BLOG
Project Zero
Project Zero
G
Google Developers Blog
Google DeepMind News
Google DeepMind News
F
Full Disclosure

博客园 - toong

envoy DDOS HTTP/2 Bomb CVE-2026-47774 安全漏洞分析 P2P与FRP与websocket python运行虚拟化环境 绑定网卡中断后是否需要设置RFS linux socket reuse port 小测试 现代C++ envoy timeout 说明 观察中断的脚本 /proc/interrupts openssl查看编译时选项设置的方法 内核ipsec转发优化方法 提高ipsec多核并行能力的优化方法之一 tc qdisc 的burst如何设置 bash模拟netstat取值的脚本 linux内核对MSI网卡队列的smp_affinity亲和CPU选择 bash多并发--进程池数量控制 bash单例模式 linux 分析中断 linux 查看 ipsec 丢包 linux内核rps与rfs机制分析 linux获取CPU利用率的快捷命令 开启openssl legacy的方法
大模型从0到1
toong · 2026-01-20 · via 博客园 - toong

一,大模型扫盲

 https://datawhalechina.github.io/so-large-lm/#/

大模型

二,机器学习

https://developers.google.com/machine-learning/guides?hl=zh-cn

https://developers.google.com/machine-learning/crash-course/prereqs-and-prework?hl=zh-cn

机器学习

三,机器学习进阶

高级机器学习

四,决策森林

https://developers.google.com/machine-learning/decision-forests?hl=zh-cn

囫囵吞枣了,完全不理解。

有个连续应该可以帮助理解,但是我没做:https://ydf.readthedocs.io/en/latest/tutorial/getting_started/

决策森林

五,神经网络

 https://colah.github.io/posts/2014-03-NN-Manifolds-Topology/

太学术几乎没看,AI的解释,差不多能帮助自洽理解了。

这篇由知名研究者 Christopher Olah 撰写的文章,深入浅出地探讨了神经网络与拓扑学之间的深刻联系,并提供了一个全新的视角来理解神经网络如何工作以及为何有时会失败。

文章的核心思想可以概括为以下几点:

1. 核心视角:神经网络是“空间变形器”

你可以把神经网络(尤其是每一层)想象成一个对输入数据空间进行连续拉伸、扭曲和变换的机器。它的目标,是通过一系列这样的变换,将原本复杂纠缠的、不同类别的数据点,在最终的表征空间里变得线性可分(即能用一条直线或一个平面分开)。

2. 核心约束:拓扑学限制

这是文章最精彩的观点。拓扑学是研究几何图形在连续变形下不变性质的数学。文章指出,标准的神经网络层(如使用 tanhsigmoid激活函数的全连接层)所进行的变换是一种同胚映射——它不会撕裂或粘合空间,只能连续地拉伸和压缩。

  •  
  • 解决方案:要解决这种拓扑约束,网络需要足够“宽”,即隐藏层需要有足够多的神经元(宽度)。更多的神经元意味着网络有能力将数据映射到更高维的空间,从而“解开”在低维空间中无法分离的纠缠结构(就像在三维空间中我们可以解开两个锁在一起的二维圆环)。

3. 对现实世界的启示:流形假设

文章将这一思想与机器学习的流形假设联系起来。该假设认为,自然数据(如图像)存在于高维空间中的低维流形上。不同类别的数据(如猫和狗的图片)对应着不同的、可能相互纠缠的流形。神经网络的分类任务,本质上就是分离这些纠缠的流形

  •  
  • “作弊”方式:网络可能会走“捷径”,不是真正解开流形,而是将纠缠的部分极度拉伸变薄,以实现较高的分类准确率。但这会导致不稳定的决策边界,对对抗性样本脆弱。

4. 对神经网络设计的反思

基于以上洞察,作者对传统神经网络层(仿射变换+逐点非线性)提出了反思,认为它们可能并非“操纵流形”的最佳工具。文章探讨了两种有趣的替代或补充思路:

  •  
  • K近邻(k-NN)层:用 k-NN 分类器替代最后的 Softmax 层,目标不再是追求严格的线性可分,而是让同类数据点更近、不同类更远,这或许是一个更自然的目标。

总结

这篇文章的核心价值在于,它用拓扑学这一强有力的数学工具,为神经网络的工作原理和局限性提供了一个直观的几何解释

  •  
  • 理解这一点有助于我们设计更好的网络架构和训练目标,避免网络陷入虚假的“捷径”解。

简言之,这篇文章为我们打开了一扇窗,让我们看到神经网络的训练不仅是调参,更是一场在几何和拓扑约束下的“空间变形手术”。

  • 这意味着:神经网络无法改变数据集的拓扑性质。例如,如果一个红色数据点组成的环完全被蓝色数据点包围(就像文章中经典的“红圈被蓝环包围”的例子),那么任何仅由这类层构成的神经网络,无论多深,都无法完美地将它们分开,因为在最终的空间里,这个“红圈被蓝环包围”的拓扑结构依然存在,而一条直线是无法做到这一点的。

  • 困难任务:如果数据流形在拓扑上非常复杂(如相互链接、环绕),那么对网络的宽度和结构就会提出根本性的要求。

  • 基于向量场的层:学习一个希望流形移动的方向场,然后据此平滑地变形整个空间,这可能更直观地实现流形分离。

  • 神经网络通过层层连续变换“扭曲”数据空间

  • 拓扑约束决定了网络能力的理论下限(例如,需要多宽才能分开特定结构的数据)。

六,自注意力机制

也是不理解。有个论文。

反正就是transformer的一个机制。见第三章先理解transformer即可。

七,transformer

TODO:https://transformers.run/c1/attention/

八,GPU编程

https://jizhuoran.github.io/intro2GPU/

CUDA by example:https://hpc.pku.edu.cn/docs/20170830181942363132.pdf

CUDA programing guide:https://docs.nvidia.com/cuda/cuda-programming-guide/

九,其他

hugging face上也有课:https://huggingface.co/learn