惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

T
Tenable Blog
Last Week in AI
Last Week in AI
P
Proofpoint News Feed
Engineering at Meta
Engineering at Meta
H
Help Net Security
F
Fortinet All Blogs
MyScale Blog
MyScale Blog
宝玉的分享
宝玉的分享
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
博客园 - 司徒正美
量子位
N
Netflix TechBlog - Medium
Apple Machine Learning Research
Apple Machine Learning Research
小众软件
小众软件
Recorded Future
Recorded Future
博客园 - 三生石上(FineUI控件)
Vercel News
Vercel News
aimingoo的专栏
aimingoo的专栏
I
InfoQ
Microsoft Security Blog
Microsoft Security Blog
Scott Helme
Scott Helme
The Last Watchdog
The Last Watchdog
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
IT之家
IT之家
AI
AI
WordPress大学
WordPress大学
Security Archives - TechRepublic
Security Archives - TechRepublic
Google Online Security Blog
Google Online Security Blog
U
Unit 42
V2EX - 技术
V2EX - 技术
MongoDB | Blog
MongoDB | Blog
Schneier on Security
Schneier on Security
博客园 - Franky
H
Heimdal Security Blog
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
Jina AI
Jina AI
W
WeLiveSecurity
P
Privacy & Cybersecurity Law Blog
Cloudbric
Cloudbric
B
Blog RSS Feed
N
News | PayPal Newsroom
S
Securelist
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
I
Intezer
Hacker News - Newest:
Hacker News - Newest: "LLM"
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
博客园_首页
罗磊的独立博客
H
Hackread – Cybersecurity News, Data Breaches, AI and More
雷峰网
雷峰网

博客园 - 快乐就好

vs code使用 mvn install 使用winsw部署spring boot项目 springboot jrebel热部署 springboot devtools热启动 浅谈单元测试 IntelliJ IDEA live template 方法配置 使用MHA实现MySQL主从复制高可用 Linux 常用命令介绍 开源堡垒机 dubbo循序渐进 - Jenkins自动化部署 maven教程 Git命令速查表 maven下载,上传设置 Maven中 jar包冲突原理与解决办法 使用Nexus3搭建Maven私服+上传第三方jar包到本地maven仓库 dubbo循序渐进 - 使用Docker安装Nexus dubbo循序渐进 - nacos安装 dubbo循序渐进 - 什么是RPC
延迟调度总结
快乐就好 · 2019-10-21 · via 博客园 - 快乐就好

流式计算的调度复杂性在于需要考虑公平性和数据本地化。

FIFO调度
FIFO是一个简单的调度策略,适合用于作业并发少,或者无作业并发,且作业的map任务数量大,最好是大于等于集群的slot数量。FIFO调度中经典的两个问题

head-of-line
小作业,多作业并发的场景,量化数据本地化的公式为,为总的slot,为map任务需要的slot

sticky slots
大作业,多作业并发,slot数量小于总作业所需的slot数。作业能达到的最大本地化是

延迟调度
适用于大作业、适用于小作业、适用于长作业。延迟调度是一个综合表现比较好的调度策略。注意:大量作业并发也会存在数据本地化偏低的情况。

Hadoop延迟调试

1. 多级延迟调度

2. map任务做延迟调度,reduce任务不做延迟调度

3. 本地化公式:=73%

D:每秒能释放的slot=S/T