惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

SecWiki News
SecWiki News
M
MIT News - Artificial intelligence
博客园 - 司徒正美
I
InfoQ
V
V2EX
L
LangChain Blog
人人都是产品经理
人人都是产品经理
T
Tailwind CSS Blog
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
The GitHub Blog
The GitHub Blog
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
WordPress大学
WordPress大学
H
Help Net Security
美团技术团队
Y
Y Combinator Blog
G
Google Developers Blog
小众软件
小众软件
The Cloudflare Blog
博客园 - 三生石上(FineUI控件)
Jina AI
Jina AI
量子位
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
D
Darknet – Hacking Tools, Hacker News & Cyber Security
Spread Privacy
Spread Privacy
博客园 - 聂微东
The Register - Security
The Register - Security
F
Full Disclosure
S
Securelist
G
GRAHAM CLULEY
Cyberwarzone
Cyberwarzone
F
Fox-IT International blog
H
Hacker News: Front Page
C
Cisco Blogs
D
Docker
L
LINUX DO - 热门话题
Google Online Security Blog
Google Online Security Blog
T
Troy Hunt's Blog
Hacker News - Newest:
Hacker News - Newest: "LLM"
T
ThreatConnect
aimingoo的专栏
aimingoo的专栏
Last Week in AI
Last Week in AI
J
Java Code Geeks
宝玉的分享
宝玉的分享
Project Zero
Project Zero
L
LINUX DO - 最新话题
博客园_首页
MongoDB | Blog
MongoDB | Blog
Stack Overflow Blog
Stack Overflow Blog
P
Proofpoint News Feed
博客园 - 叶小钗

博客园 - Angry_Panda

基于规则模板的深度强化学习决策算法 强化学习 —— Partially Observable Tasks(部分可观测任务): 部分可观测马尔可夫决策过程(POMDP)类 —— 含扰动与时延的鲁棒控制类(Perturbation & Delay)—— 动态系统辨识 + 元强化学习类(Meta-RL / System ID) 强化学习算法 —— 带自适应步长的策略梯度算法(PG算法、Adaptive step size for Adam optimizer) CEM算法出处 —— 交叉熵强化学习算法 —— 强化学习算法中经典的CEM算法 windows11 —— 电源管理 —— 休眠设置 故障检测 —— 电机故障 —— GitHub项目 python报错:raise Exception('ROM is missing for %s, see https://github.com/openai/atari-py#roms for instructions' % (game_name,)) Exception: ROM is missing for pong pyro概率编程 强化学习算法 —— 为什么TRPO算法使用状态值(V)而不是动作值进行计算? 强化学习算法 —— 时变基线 —— 时变基线的计算方式为:取批次内所有轨迹,对每个时间步的回报值做平均 强化学习算法 —— TRPO + GAE —— 原始的value function部分的实现算法 强化学习算法 —— TRPO —— KL散度求费雪信息矩阵时的trick —— 用10%数据估算费雪信息矩阵FIM 人工智能论文 —— 数学理论推导重点关键 —— heuristic approximation 零一造物_ZERO机械臂 人工智能: 利用物理模型泛化学习机器人操纵 —— Leveraging Physics-Based Models To Learn Generalizable Robotic Manipulation 交叉熵强化学习算法 —— Cross entropy method (CEM) Reinforcement Learning —— RL 算法 人形机器人 —— Hugging Face 与 NVIDIA 加速开源 AI 机器人研发 强化学习 —— 论文:《Optimizing Expectations: From Deep Reinforcement Learning to Stochastic Computation Graphs》—— 作者:John Schulman 人工智能 —— 神经网络 —— Rop(R‑算子)是什么? —— 豆包AI生成 强化学习算法:PPO and TRPO算法实现细节 —— Implementation Matters in Deep RL: A Case Study on PPO and TRPO 利用多張GPU訓練大型語言模型—從零開始介紹DeepSpeed、Liger Kernel、Flash Attention及Quantization —— 【生成式AI時代下的機器學習(2025)】助教課 豆包AI自动生成答案 —— 强化学习算法库baseline中的ppo2算法是什么,与ppo有啥区别? 为什么强化学习算法主流框架是actor-critic而不是将actor-critic合并成只有critic的框架,使用q值通过softmax方法自动生成policy呢? 论文:《面向强化学习的可解释性研究综述》 python报错:ImportError: libGL.so.1: cannot open shared object file: No such file or directory python运行报错:pip安装package报错 —— Expected matching RIGHT_PARENTHESIS for LEFT_PARENTHESIS 纪念 —— 游戏 —— 国产游戏 —— 黑悟空 AI芯片管制是否会延迟中国AI的技术发展? 张Xue峰原话(全网流传最完整版) —— 社会就是一个大筛子 人工智能理论(实证法) —— 神经网络理论 —— 关于“彩票理论”的讨论 神经网络(人工智能)—— CNN模型在训练过程中图片的预处理过程对整体算法训练过程中计算效率的影响? 为什么显卡明明可以放下0.5B、1.5B甚至3B的大模型参数,但是训练的时候就会报显存不足的错误呢? 比赛视频2025年 —— 人形机器人越野避障 —— 机器人百米障碍赛夺冠纪录 如何解决 kagglehub下载速度慢的问题 —— kaggle下载速度慢如何解决 如何撰写发表CCF顶会论文 —— 如何写论文 科技公司的干部年轻化 —— 互联网一线大厂,如果30岁之前还没有做到项目负责人,那么可能就只能原地踏步了 —— 35岁后开启人生职业生涯的下半场 面试注意事项 算法工程师 —— 学人工智能技术找一个算法研发工程师职位的首要条件是什么? 学习工作时的伴听音乐 —— 在线音乐播放 祖籍 历史上哪件兵器最厉害? 辽宁省沈阳市民办高校教师岗位求职面试体验 (十分的不佳)—— 沈阳城市学院 强化学习(岗位招聘)—— 具身深度强化学习运控岗 经典视频 —— 强化学习入门视频 —— David Silver深度强化学习 —— 中文翻译版本(带中文字幕)—— 附:PPT文件(PDF版本) 为什么美国害怕不是第一 大语言模型:MedicalGPT: Training Your Own Medical GPT Model with ChatGPT Training Pipeline. 训练医疗大模型,实现了包括增量预训练(PT)、有监督微调(SFT)、RLHF、DPO、ORPO、GRPO。 豆包AI自动生成:985/211信息学院的人工智能专业的本科生和硕士生的课程内容 DeepSeek复现:TinyZero项目的配置及安装 深度学习 —— 人工智能 —— 大语言模型(LLM) —— flash-attn 安装卡死
中科星图 —— 北京顺义区李桥镇 —— 星图防务
Angry_Panda · 2026-05-23 · via 博客园 - Angry_Panda

image

中科星图股份有限公司(股票代码:688568)创立于2006年,2020年7月在科创板上市,是中国科学院空天信息创新研究院投资的国有控股高新技术企业。作为国内数字地球产品研发与产业化的领军企业,中科星图将大数据、云计算和人工智能等新一代信息技术、地理信息技术与航空航天产业深度融合,自主研发了覆盖空天大数据获取、处理、承载、可视化和应用等产业链环节的GEOVIS数字地球产品。

image

地址:

https://mail.geovis.com.cn/

本博客是博主个人学习时的一些记录,不保证是为原创,个别文章加入了转载的源地址,还有个别文章是汇总网上多份资料所成,在这之中也必有疏漏未加标注处,如有侵权请与博主联系。 如果未特殊标注则为原创,遵循 CC 4.0 BY-SA 版权协议。