惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

L
LangChain Blog
Martin Fowler
Martin Fowler
P
Palo Alto Networks Blog
MongoDB | Blog
MongoDB | Blog
A
About on SuperTechFans
Google DeepMind News
Google DeepMind News
博客园_首页
量子位
小众软件
小众软件
F
Full Disclosure
Vercel News
Vercel News
爱范儿
爱范儿
Engineering at Meta
Engineering at Meta
F
Fortinet All Blogs
博客园 - 聂微东
V
V2EX
Blog — PlanetScale
Blog — PlanetScale
罗磊的独立博客
WordPress大学
WordPress大学
D
Darknet – Hacking Tools, Hacker News & Cyber Security
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
T
Tor Project blog
Google DeepMind News
Google DeepMind News
M
MIT News - Artificial intelligence
L
Lohrmann on Cybersecurity
H
Hacker News: Front Page
Spread Privacy
Spread Privacy
AI
AI
C
Cyber Attacks, Cyber Crime and Cyber Security
C
CERT Recently Published Vulnerability Notes
D
Docker
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
Recorded Future
Recorded Future
L
LINUX DO - 热门话题
Microsoft Azure Blog
Microsoft Azure Blog
Recent Commits to openclaw:main
Recent Commits to openclaw:main
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
Latest news
Latest news
W
WeLiveSecurity
Application and Cybersecurity Blog
Application and Cybersecurity Blog
博客园 - 司徒正美
博客园 - 叶小钗
T
Threat Research - Cisco Blogs
P
Privacy International News Feed
O
OpenAI News
Help Net Security
Help Net Security
aimingoo的专栏
aimingoo的专栏
宝玉的分享
宝玉的分享
博客园 - Franky

博客园 - Angry_Panda

【人生哲理】【视频】为什么说该花的钱不花,就会变成灾难呢? 随身移动WiFi ——50元级别的(三网 4G移动网络)—— 网速测试 豆包AI —— 为什么不把离散的状态空间属性用one-shot方式编码而是直接归一化为0到1范围的属性值 dogfight问题中(UAV 无人机空战——狗斗)—— 状态空间设计 为ubuntu系统安装samba网络磁盘,实现局域网中的共享网络磁盘 —— 跨系统文件共享的完整方案 sudo fwupdmgr get-upgrades —— 在 Linux 系统中,用 fwupd 工具查看当前机器所有可升级固件(BIOS/UEFI、SSD、雷电、外设等) git免密认证同步仓库代码报错——git@github.com: Permission denied (publickey) —— 所需的ssh-add加载加密私钥 —— 指定加密私钥存储位置 【转载】 执行 ssh-add 报错 Could not open a connection to your authentication agent —— git免密认证同步仓库代码,所需的ssh-add加载加密私钥 uv python环境管理工具 ubuntu系统python安装pycairo报错:Run-time dependency python found: NO (tried pkgconfig and sysconfig) 无人机 —— dogfight —— 经纬度与笛卡尔坐标系的相互转换、方位角的计算 防务:论文《基于 DoDAF 的反无人艇集群作战体系设计》 强化学习奖励函数 —— 双曲惩罚函数 —— 用于奖励函数设计 VR-Forces中发射与毁伤仿真机制 防务:导弹打击毁伤率网格计算法 如何配置远程的ubuntu服务器以使在本地windows电脑上可以进行X11图形转发——ssh远程X11转发的配置 反无人机 —— 三层区域划分 2026年6月19日 成都远程巨科 —— 课程内容 —— 北京竞业达集团(河北张家口启点教育) 2026年6月19日 硬十科技 —— 课程内容 —— 北京竞业达集团(河北张家口启点教育) 2026年5月30日 中科星图 —— 北京顺义区 —— 与财务实习生(小友)—— 顺义区(县、区城市中心)影院观影 2026年6月6日 北京国家博物馆 —— 北京顺义区中科星图公司 uv 工具操作 —— python docker里面安装windows容器 wsl —— 局域网访问wsl下的ubuntu主机 —— 命令行下进行网络配置 【转载】局域网访问WSL 使用镜像模式网络 简单实现 uv 创建Python环境 【转载】rpclib: client error C0002: Function ‘simGetImages‘ was called with an invalid number of arguments. TensorFlow1.15报错: W tensorflow/stream_executor/cuda/redzone_allocator.cc:312] Internal: Invoking ptxas not supported on Windows Relying on driver to perform ptx compilation 【转载】Airsim + UE4安装配置遇到的‘/projectfiles‘ 不是内部或外部命令,也不是可运行的程序或批处理文件问题解决 【转载】解决无法安装虚幻引擎错误代码 MD-DL-0 中科星图 —— 北京顺义区李桥镇 —— 星图防务 基于规则模板的深度强化学习决策算法 强化学习 —— Partially Observable Tasks(部分可观测任务): 部分可观测马尔可夫决策过程(POMDP)类 —— 含扰动与时延的鲁棒控制类(Perturbation & Delay)—— 动态系统辨识 + 元强化学习类(Meta-RL / System ID) 强化学习算法 —— 带自适应步长的策略梯度算法(PG算法、Adaptive step size for Adam optimizer) CEM算法出处 —— 交叉熵强化学习算法 —— 强化学习算法中经典的CEM算法 windows11 —— 电源管理 —— 休眠设置 故障检测 —— 电机故障 —— GitHub项目 python报错:raise Exception('ROM is missing for %s, see https://github.com/openai/atari-py#roms for instructions' % (game_name,)) Exception: ROM is missing for pong 神经网络概率编程框架 —— pyro概率编程 强化学习算法 —— 为什么TRPO算法使用状态值(V)而不是动作值进行计算? 强化学习算法 —— 时变基线 —— 时变基线的计算方式为:取批次内所有轨迹,对每个时间步的回报值做平均 强化学习算法 —— TRPO + GAE —— 原始的value function部分的实现算法 强化学习算法 —— TRPO —— KL散度求费雪信息矩阵时的trick —— 用10%数据估算费雪信息矩阵FIM 人工智能论文 —— 数学理论推导重点关键 —— heuristic approximation 具身智能:零一造物_ZERO机械臂 人工智能: 利用物理模型泛化学习机器人操纵 —— Leveraging Physics-Based Models To Learn Generalizable Robotic Manipulation 交叉熵强化学习算法 —— Cross entropy method (CEM) Reinforcement Learning —— RL 算法 人形机器人 —— Hugging Face 与 NVIDIA 加速开源 AI 机器人研发 强化学习 —— 论文:《Optimizing Expectations: From Deep Reinforcement Learning to Stochastic Computation Graphs》—— 作者:John Schulman 人工智能 —— 神经网络 —— Rop(R‑算子)是什么? —— 豆包AI生成 强化学习算法:PPO and TRPO算法实现细节 —— Implementation Matters in Deep RL: A Case Study on PPO and TRPO 利用多張GPU訓練大型語言模型—從零開始介紹DeepSpeed、Liger Kernel、Flash Attention及Quantization —— 【生成式AI時代下的機器學習(2025)】助教課 豆包AI自动生成答案 —— 强化学习算法库baseline中的ppo2算法是什么,与ppo有啥区别? 为什么强化学习算法主流框架是actor-critic而不是将actor-critic合并成只有critic的框架,使用q值通过softmax方法自动生成policy呢? 论文:《面向强化学习的可解释性研究综述》 python报错:ImportError: libGL.so.1: cannot open shared object file: No such file or directory python运行报错:pip安装package报错 —— Expected matching RIGHT_PARENTHESIS for LEFT_PARENTHESIS 纪念 —— 游戏 —— 国产游戏 —— 黑悟空 AI芯片管制是否会延迟中国AI的技术发展? 张Xue峰原话(全网流传最完整版) —— 社会就是一个大筛子 人工智能理论(实证法) —— 神经网络理论 —— 关于“彩票理论”的讨论 神经网络(人工智能)—— CNN模型在训练过程中图片的预处理过程对整体算法训练过程中计算效率的影响? 为什么显卡明明可以放下0.5B、1.5B甚至3B的大模型参数,但是训练的时候就会报显存不足的错误呢? 比赛视频2025年 —— 人形机器人越野避障 —— 机器人百米障碍赛夺冠纪录 如何解决 kagglehub下载速度慢的问题 —— kaggle下载速度慢如何解决 如何撰写发表CCF顶会论文 —— 如何写论文 科技公司的干部年轻化 —— 互联网一线大厂,如果30岁之前还没有做到项目负责人,那么可能就只能原地踏步了 —— 35岁后开启人生职业生涯的下半场 面试注意事项 算法工程师 —— 学人工智能技术找一个算法研发工程师职位的首要条件是什么? 学习工作时的伴听音乐 —— 在线音乐播放 祖籍 历史上哪件兵器最厉害? 辽宁省沈阳市民办高校教师岗位求职面试体验 (十分的不佳)—— 沈阳城市学院 强化学习(岗位招聘)—— 具身深度强化学习运控岗 经典视频 —— 强化学习入门视频 —— David Silver深度强化学习 —— 中文翻译版本(带中文字幕)—— 附:PPT文件(PDF版本) 为什么美国害怕不是第一 大语言模型:MedicalGPT: Training Your Own Medical GPT Model with ChatGPT Training Pipeline. 训练医疗大模型,实现了包括增量预训练(PT)、有监督微调(SFT)、RLHF、DPO、ORPO、GRPO。 豆包AI自动生成:985/211信息学院的人工智能专业的本科生和硕士生的课程内容 DeepSeek复现:TinyZero项目的配置及安装 深度学习 —— 人工智能 —— 大语言模型(LLM) —— flash-attn 安装卡死
企业公司上班 —— 北京小区(顺义李桥镇)——水电费(卡)
Angry_Panda · 2026-06-11 · via 博客园 - Angry_Panda

865d1dab95be8d73e57c83559707bea7_compress

图片

本博客是博主个人学习时的一些记录,不保证是为原创,个别文章加入了转载的源地址,还有个别文章是汇总网上多份资料所成,在这之中也必有疏漏未加标注处,如有侵权请与博主联系。 如果未特殊标注则为原创,遵循 CC 4.0 BY-SA 版权协议。