





















https://datawhalechina.github.io/so-large-lm/#/

https://developers.google.com/machine-learning/guides?hl=zh-cn
https://developers.google.com/machine-learning/crash-course/prereqs-and-prework?hl=zh-cn


https://developers.google.com/machine-learning/decision-forests?hl=zh-cn
囫囵吞枣了,完全不理解。
有个连续应该可以帮助理解,但是我没做:https://ydf.readthedocs.io/en/latest/tutorial/getting_started/

https://colah.github.io/posts/2014-03-NN-Manifolds-Topology/
太学术几乎没看,AI的解释,差不多能帮助自洽理解了。
这篇由知名研究者 Christopher Olah 撰写的文章,深入浅出地探讨了神经网络与拓扑学之间的深刻联系,并提供了一个全新的视角来理解神经网络如何工作以及为何有时会失败。
文章的核心思想可以概括为以下几点:
你可以把神经网络(尤其是每一层)想象成一个对输入数据空间进行连续拉伸、扭曲和变换的机器。它的目标,是通过一系列这样的变换,将原本复杂纠缠的、不同类别的数据点,在最终的表征空间里变得线性可分(即能用一条直线或一个平面分开)。
这是文章最精彩的观点。拓扑学是研究几何图形在连续变形下不变性质的数学。文章指出,标准的神经网络层(如使用 tanh或 sigmoid激活函数的全连接层)所进行的变换是一种同胚映射——它不会撕裂或粘合空间,只能连续地拉伸和压缩。
解决方案:要解决这种拓扑约束,网络需要足够“宽”,即隐藏层需要有足够多的神经元(宽度)。更多的神经元意味着网络有能力将数据映射到更高维的空间,从而“解开”在低维空间中无法分离的纠缠结构(就像在三维空间中我们可以解开两个锁在一起的二维圆环)。
文章将这一思想与机器学习的流形假设联系起来。该假设认为,自然数据(如图像)存在于高维空间中的低维流形上。不同类别的数据(如猫和狗的图片)对应着不同的、可能相互纠缠的流形。神经网络的分类任务,本质上就是分离这些纠缠的流形。
“作弊”方式:网络可能会走“捷径”,不是真正解开流形,而是将纠缠的部分极度拉伸变薄,以实现较高的分类准确率。但这会导致不稳定的决策边界,对对抗性样本脆弱。
基于以上洞察,作者对传统神经网络层(仿射变换+逐点非线性)提出了反思,认为它们可能并非“操纵流形”的最佳工具。文章探讨了两种有趣的替代或补充思路:
K近邻(k-NN)层:用 k-NN 分类器替代最后的 Softmax 层,目标不再是追求严格的线性可分,而是让同类数据点更近、不同类更远,这或许是一个更自然的目标。
这篇文章的核心价值在于,它用拓扑学这一强有力的数学工具,为神经网络的工作原理和局限性提供了一个直观的几何解释:
理解这一点有助于我们设计更好的网络架构和训练目标,避免网络陷入虚假的“捷径”解。
简言之,这篇文章为我们打开了一扇窗,让我们看到神经网络的训练不仅是调参,更是一场在几何和拓扑约束下的“空间变形手术”。
这意味着:神经网络无法改变数据集的拓扑性质。例如,如果一个红色数据点组成的环完全被蓝色数据点包围(就像文章中经典的“红圈被蓝环包围”的例子),那么任何仅由这类层构成的神经网络,无论多深,都无法完美地将它们分开,因为在最终的空间里,这个“红圈被蓝环包围”的拓扑结构依然存在,而一条直线是无法做到这一点的。
困难任务:如果数据流形在拓扑上非常复杂(如相互链接、环绕),那么对网络的宽度和结构就会提出根本性的要求。
基于向量场的层:学习一个希望流形移动的方向场,然后据此平滑地变形整个空间,这可能更直观地实现流形分离。
神经网络通过层层连续变换“扭曲”数据空间。
拓扑约束决定了网络能力的理论下限(例如,需要多宽才能分开特定结构的数据)。
也是不理解。有个论文。
反正就是transformer的一个机制。见第三章先理解transformer即可。
TODO:https://transformers.run/c1/attention/
https://jizhuoran.github.io/intro2GPU/
CUDA by example:https://hpc.pku.edu.cn/docs/20170830181942363132.pdf
CUDA programing guide:https://docs.nvidia.com/cuda/cuda-programming-guide/
hugging face上也有课:https://huggingface.co/learn
此内容由惯性聚合(RSS阅读器)自动聚合整理,仅供阅读参考。 原文来自 — 版权归原作者所有。