惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

S
Secure Thoughts
罗磊的独立博客
T
The Blog of Author Tim Ferriss
人人都是产品经理
人人都是产品经理
博客园 - 叶小钗
Last Week in AI
Last Week in AI
美团技术团队
Google Online Security Blog
Google Online Security Blog
Application and Cybersecurity Blog
Application and Cybersecurity Blog
D
Docker
G
Google Developers Blog
大猫的无限游戏
大猫的无限游戏
酷 壳 – CoolShell
酷 壳 – CoolShell
小众软件
小众软件
月光博客
月光博客
L
LINUX DO - 最新话题
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
W
WeLiveSecurity
H
Heimdal Security Blog
Vercel News
Vercel News
SecWiki News
SecWiki News
Forbes - Security
Forbes - Security
Blog — PlanetScale
Blog — PlanetScale
Google DeepMind News
Google DeepMind News
Exploit-DB.com RSS Feed
Exploit-DB.com RSS Feed
www.infosecurity-magazine.com
www.infosecurity-magazine.com
TaoSecurity Blog
TaoSecurity Blog
T
Troy Hunt's Blog
A
About on SuperTechFans
C
Check Point Blog
S
Security Affairs
Hacker News - Newest:
Hacker News - Newest: "LLM"
AI
AI
WordPress大学
WordPress大学
K
KPMG report finds enterprise disconnect between AI and its ROI | CIO
Help Net Security
Help Net Security
博客园_首页
The Last Watchdog
The Last Watchdog
S
SegmentFault 最新的问题
Hugging Face - Blog
Hugging Face - Blog
Security Archives - TechRepublic
Security Archives - TechRepublic
Engineering at Meta
Engineering at Meta
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
I
Intezer
K
Kaspersky official blog
M
MIT News - Artificial intelligence
J
Java Code Geeks
G
GRAHAM CLULEY
P
Palo Alto Networks Blog

博客园 - 你看起来真的很好吃

linux系统时间管理 安装历史docker版本 OCR文本提取+NER命名实体识别 测试 go——make和new的区别 go——GC垃圾回收机制 go——标识符的命名规范 go语言——数据类型 go语言——转义符 go开发环境安装 git使用 项目文档目录总结 鼠标连点器——python版 windows使用YOLOV5训练模型——搭建编译环境 高匿名动态IP代理获取 logging模块进行格式化输出 笔记 Django admin 添加操作记录 facenet + fiass 实现人脸识别
深度学习-激活函数
你看起来真的很好吃 · 2024-12-05 · via 博客园 - 你看起来真的很好吃

深度学习-激活函数

  1. 激活函数
    作用:增强网络的非线性能力
    扩展:

    1:神经网络为什么要引入非线性?

    如果神经网路没有引入非线性层,那么神经网络就变成了线性层的堆叠,堆叠后的表达式还是一个线性函数,线性函数的表达能力是有限的,它只能表示特征和目标值之间比较简单的关系,引入非线性层可以提高网络的表达能力,和鲁棒性

    激活函数介绍:
    sigmoid函数
      公式:
        

        函数图像:

                

      优点:
        1:输出范围(0,1)可以用于二分类
        2:连续函数方便求导
      缺点:
        1:在极大值和极小值时会出现梯度消失,梯度消失会导致在深度神经网络中反向传播时无法更新参数
        2:函数的输出值不是以0为均值,如果函数值全部大于0或小于0会导致反向传播更新参数时所有参数的更新方向一致,可能导致收敛速度变慢

                    

        3:运算复杂度高,函数为指数函数

    Tanh函数(双曲正切函数)
    函数:

    函数图像:

    优点:
           1:输出值以0为中心,加快收敛速度
      2:连续函数方便求导
    缺点:
       1:存在梯度消失问题
      2:运算复杂度高,存在指数函数

    ReLU函数(Rectified linear unit 线性修正单元)
    函数:

     函数图像

    优点:
      1:计算简单,只需要进行一次比较运算和一次取最大值的运算,收敛速度快
          2:避免梯度消失,x>0范围下不会出现梯度消失
          3:有助于稀疏化, ReLU函数对于负数输入的输出均为0,这种截断效果可以使得网络中一部分神经元对于某些输入永远不会被激活,从而实现神经元的稀疏化。稀疏化可以减少参数的数量,进而降低过拟合的风险,并提高网络的泛化能力。
    缺点:
      1:输出值不是以0为均值
      2:神经元坏死,在x<0时,梯度为0。这个神经元及之后的神经元梯度永远为0,不再对任何数据有所响应,导致相应参数永远不会被更新。
    Leaky ReLU函数
    PReLUhanshu 
    RReLU函数
    ELU函数
    SELU函数
    Maxout函数
    Softmac函数
    Swish函数
    Softplus函数
  2. 损失函数
  3. 优化器

posted @ 2024-12-05 19:06  你看起来真的很好吃  阅读(135)  评论()    收藏  举报