





















这是一个创建于 558 天前的主题,其中的信息可能已经有所发展或是发生改变。
有个室温采集系统,一共 1686 个住户,每小时取一次数,供热季从 10 月份取到明年 4 月份,大约
1686*24*30*7=8,497,440 条数据,后期涉及到统计,分组排序等。
目前想到的办法是一年新建一张表,存储历史,然后做个配置表去管理查询哪张表。各位有在实际中遇到过相似问题的吗?有更好的办法吗?
第 1 条附言 · 2024 年 12 月 6 日
首先感谢各位 v 友给出的建议,我总结了下
1 、mysql 单表几千万上亿都没啥问题,不用考虑那么多(也可以索引、分区、分表)
2 、使用数据库 pgsql
3 、使用时序数据库
服务器没真实跑过这么大的数据,我云服务器跑几百万条数据就很慢了(当然配置也比较低),既然大家都说 mysql 没问题的话,那我就先实际运行试试,有问题再说,再次感谢各位 V 友们!
1 kuxuan 2024 年 12 月 4 日收藏 |
2 wowo243 2024 年 12 月 4 日这不就是按年分表,分库分表有框架,比如 shardingsphere |
3 CodeCodeStudy 2024 年 12 月 4 日可以用时序数据库,比如 influxdb 之类的 |
4 akira 2024 年 12 月 4 日统计,分组排序 提前算好就行 啦 |
5 hefish 2024 年 12 月 4 日10 年才 8000 多万,100 年才 8 亿多。。。。一年建一张表也行,就是分析统计跨年度的时候要额外处理一下。。。 实在不行还可以分区嘛,根据时间分区,这样落在一个数据库文件里的数据量就更有限了。。。 |
6 linauror 2024 年 12 月 4 日都按年存了,其实不必搞什么配置表,直接不让跨年查明细就好了,主要是控制一下明细的时间范围。 |
7 Martens 2024 年 12 月 4 日这种数据可以用时序数据库 |
8 digitv 2024 年 12 月 4 日mysql 哪里有这么脆弱啊,单标现在最大都可以支持到几十 TB 了,别被网上的一些垃圾文章误导。直接去买云厂商的产品,几亿条都没问题。 |
9 yuzo555 2024 年 12 月 4 日建议时序数据库 |
10 HunterPan 2024 年 12 月 4 日分区吧 10 年数据够用了 |
11 whoosy 2024 年 12 月 4 日800w 数据小意思 |
12 rockddd 2024 年 12 月 4 日一年才八百万,直接上云服务的数据库,哪怕存几年,这点量 查起来都没什么感觉 |
13 dr1q65MfKFKHnJr6 2024 年 12 月 4 日800W ,室温数据,没啥复杂的数据结构,主要是查询(统计),统计提前跑任务, |
14 justfindu 2024 年 12 月 4 日我们有个统计表, 一个月是 4000 万数据, 偷懒单表, 不过可以归档. 3 个月一归档. |
15 dddd1919 2024 年 12 月 4 日不可变时序数据,上 hive |
16 weilai99 2024 年 12 月 4 日单表八百万一点问题都没有,我们单表将近两千万都轻轻松松 |
17 shen13176101 2024 年 12 月 4 日想复杂了,业务就那么简单,不相信 mysql 换 pg |
18 systemGuest 2024 年 12 月 4 日你太看不起 mysql 了,我们单表最大 8 亿的设备登录记录,照样正常查。 |
19 cheng6563 2024 年 12 月 4 日一年 800 万...等你一天 800 万在考虑这些吧... |
20 jiakme 2024 年 12 月 4 日如果允许的话, 可以考虑将 mysql 更换为 pgsql. 简单数据, 单表 1 亿没问题 |
21 zdw406 2024 年 12 月 4 日800w 数据量不算大 |
22 molika 2024 年 12 月 4 日docker 里面跑的 mysql 云虚拟机 一年跑了 4000 多 w 条数据 还会连表查询..目前没有任何压力 |
23 jimrok 2024 年 12 月 4 日800 万单表存储是没有问题,估计你也不开放查询给用户使用,这种数据最多给建模分析用,但普通的预测模型直接使用文件,pandas 就能很好处理,根本不需要读你的数据库。 |
24 luziafy 2024 年 12 月 4 日单表就行 十年后再说 |
25 cominghome 2024 年 12 月 4 日字段不多、对耗时不敏感的话放心用,mysql 配置跟得上单表几千万行没事的。 从架构层面来说,你的方案没有问题。如果用户量级不会急速膨胀也可以考虑按其他因素分表也是可以的,比如按 userid 尾数 0~9 可以分出十个表来,像你这种情况稳定跑个几十年都没事。 |
26 Yukineko 2024 年 12 月 4 日按年分区,800w 不是随随便便 |
27 zhangqian99 2024 年 12 月 4 日我司的一张表 8 个字段,运行两年 3 亿 3 千万行数据,占用存储 22G 。你的一年才 800 万行,担心啥,你太小看 mysql 了 |
28 LieEar 2024 年 12 月 4 日800 万这个级别 mysql 绰绰有余 |
29 kiwi95 2024 年 12 月 4 日加大内存甚至不用分表,节省下来的开发费维护用够加内存的了 |
30 SoulSleep 2024 年 12 月 4 日800 万/年。。。一行就几个字段....统计、分组排序.......单表够了 |
31 wbrobot 2024 年 12 月 4 日我 MySQL 5.7 老版本,单表 4 亿也没说啥啊,你 800 万零头都不到啊。。。好奇怪的帖子 |
32 franchise 2024 年 12 月 4 日这量级单表,按周期做统计即可 |
33 YetToCome 2024 年 12 月 4 日这个数据量,建议不要单表,业务的方向很快就会膨胀到单表支撑不了的。 |
34 wbrobot 2024 年 12 月 4 日@zhangqian99 确实,我看了一下我的,又一年过去,已经增加到 5 亿 2 千万了,数据 21G,索引 29G ,一台每月 5 刀的 VPS 跑的飞快。。。 |
35 nanrenlei 2024 年 12 月 4 日一年 800w 的话 mysql 单表没问题,我们有的单表存储了 2000w ,但是统计全量数据之类的就比较慢了大概需要十来秒中,如果不需要事务的话也可以用 mongodb 存储,mongodb 大概存 10 亿不是问题,也可以使用 influx 这种时序数据库,但要增加学习成本 |
36 shyrock 2024 年 12 月 4 日一年八百万,又不是一小时八百万。。。感觉这数据增加十分缓慢啊。。。 建议先用着,等你真正感受到性能瓶颈再说优化的事,记住”提前优化是万恶之源“。 |
37 pkoukk 2024 年 12 月 4 日能支撑,索引建好就行 |
38 Jinnrry 2024 年 12 月 4 日 via iPhone我这里评论表,单表 20 亿 |
39 cenbiq 2024 年 12 月 4 日确保你的操作都命中索引,然后把你最经常查询的字段(比如说最经常按数据的采集时间来查询)做成聚集索引,完事。 |
40 whp1473 2024 年 12 月 4 日如果只是简单统计,团队能控住,可以考虑上时序数据库,如果复杂统计不要求事务可以 Starrocks 、Clickhouse 。 |
41 luobingit 2024 年 12 月 4 日才 800w 单表足够了 之前开发的系统一年十几亿 单表也没啥问题 复杂查询走 ES 注意磁盘 遇到瓶颈再优化 这点数据 就整分库分表了 不至于吧 |
42 meeop 2024 年 12 月 4 日800w 数据,你拿你的手机当服务器都没有问题 现在 2024 年了,任何数据承担 800w 数据都没有任何问题,甚至 800w 数据你全读取到内存里都没问题 |
43 yoyolichen 2024 年 12 月 4 日不管是单表还是分表,统计都建议提取个中间表,每天定时任务跑一下 |
44 qq135449773 2024 年 12 月 4 日存进去是没什么问题,可是之后怎么去用里面的数据,索引怎么设计优化,才是关键的问题。 把这种传统数据库当时序库用,一时间有点想不出来索引怎么去做.... |
45 noyidoit 2024 年 12 月 4 日太小看 mysql 了,遇到问题再说吧 |
47 dilu 2024 年 12 月 4 日太小看 mysql 了,第一家公司,7 年前。有一个流水表,十几亿的记录,二十多个字段,加了合适的索引。数据十几个 g ,索引也有十几个 g ,用的还是 4h8g 的配置,不过用的是腾讯云的 mysql 。 app 是 2w 日活左右,正常查询,接口平均都在 1s 以内,一点压力都没有。 |
48 rickiey 2024 年 12 月 4 日按年分表也没问题,这些数据是不是收集完后基本不会变,可以存在其他更合适的数据库,比如 clickHouse |
49 la2la 2024 年 12 月 4 日1. 你这个业务场景不涉及到复杂事物场景,1 年 800w 数据 MySQL 完全抗的住 |
50 reeco 2024 年 12 月 4 日Mysql 单表 我极限存过 2 亿数据 |
51 ShinichiYao 2024 年 12 月 4 日当年也挺担心 MySQL 的单表大数据性能,10 年前的硬件 6 核 8G 内存,单表每月新增一个分区,最近看了一下,已经 19 亿数据了 |
52 Rat3 2024 年 12 月 4 日每个三到五个供热季分一个表,随便搞 |
53 badbye 2024 年 12 月 4 日一张表存无压力,过几年再看 |
54 luorixy 2024 年 12 月 4 日是不是大家都对 MySQL 的性能都很担忧啊 一年才 800 万的量都担心了 MySQL 在大家眼里的性能这么差吗😂 |
55 xuelu520 2024 年 12 月 4 日这才多少数据,单表 10 年都不是问题 |
56 ltmst 2024 年 12 月 4 日单表查询没啥问题,做分区就行了 |
57 decken 2024 年 12 月 4 日上亿都没问题 MySQL 性能不差的 |
58 ymy3232 2024 年 12 月 4 日一张表可以用到项目倒闭,你的项目还不一定能活 10 年,能活十年的项目有的是办法优化 |
61 THESDZ 2024 年 12 月 4 日与其担心这个,不如担心备份问题。 |
62 julyclyde 2024 年 12 月 4 日1 不需要解决 |
63 johnlin 2024 年 12 月 4 日我们 2000w 条数据都存一张表的,800w 可以的。不跨年查询的话,你一下子建 20 张表 [20 年] ,然后建立一个字典,每个年度一张表,后期都不用你维护的 |
64 cccvno1 2024 年 12 月 4 日单表直接存,室温数据分布应该挺密集的,只要索引加好,普通机械硬盘都没有问题。 |
65 0x663 2024 年 12 月 4 日 |
66 0x663 2024 年 12 月 4 日而且一看你这个系统名称我就明白了是绩效项目,《室温采集系统》 |
67 JZen 2024 年 12 月 4 日800w 应该可以随便跑,以前我的双核垃圾服务器存 2000w 行的表都不慌,要做复杂统计可以把数据 dump 出来,在其他性能更高的机器上做。 |
69 encro 2024 年 12 月 4 日一年 800 万,啥都不用干分表分区分库都不用管,3 年后再看就是了。。。 统计专门做统计表。 建议采用 postgresql ,哈哈。 |
70 wangyzj 2024 年 12 月 4 日你这个类似 iot 场景了,不适合 mysql |
71 gerryzhu0033 2024 年 12 月 4 日不想麻烦的,直接用 mysql + 分区表,统计分组的话后面加个 clickhouse ,妥妥的 |
72 go522000 2024 年 12 月 4 日看到大家的数据都到亿了,真强大。 |
73 chengxiao 2024 年 12 月 4 日是不是看多了那个什么单表 2000w ,思维固化了 |
75 GreenHand 2024 年 12 月 4 日我记得十年前我们单表就存了 10 亿级别的数据了 |
76 FightPig 2024 年 12 月 4 日800w 没问题吧,我没怎么用 mysql,我们的 pg 现在单表上亿,没发现什么毛病 |
77 soul11201 2024 年 12 月 4 日 via Android这点数据很多吗? |
78 RangerWolf 2024 年 12 月 4 日我们单点 mysql 存储了 1T+的数据(没有分布式、也没有主从,只要每天备份) |
79 ksc010 2024 年 12 月 4 日一年 800w 不算事 |
80 realpg 2024 年 12 月 4 日我的单表一天就八百万数据 |
81 realpg 2024 年 12 月 4 日 |
82 mingtdlb 2024 年 12 月 4 日来到我司后,我想明白了我司 几乎所有的研发 做事风格都是顾前不顾后,工作量自己创造。 渐渐的我也想明白了,明年都不一定在这公司了,前人栽树 后人凉,埋点坑问题不大,何况你这个不算坑 |
83 w3cll 2024 年 12 月 4 日才 800w 而已,你是有多看不起 MySQL ?我们这边单表三四千万都轻轻松松 |
84 mooyo 2024 年 12 月 4 日八百万啊,你等八千万了再回来问吧。。 |
87 kkbear 2024 年 12 月 5 日一年 800w ?? mysql 被黑成这样了吗? |
88 esee 2024 年 12 月 5 日 via Android你是不是没有正经做过项目都是写个 demo 就没了。mysql 没这么脆弱,我一个表两三年时间了三四亿行数据了,现在也没性能瓶颈。 |
89 open9527 2024 年 12 月 5 日这个项目能坚持十年吗 |
90 yufeng0681 2024 年 12 月 5 日@zdw406 #21 题主一个回复都没有,感觉浪费了大家一腔热情。 |
91 iv8d 2024 年 12 月 5 日一年上亿了再喊我,## |
92 visper 2024 年 12 月 5 日干十年八千万了,你也离职了,留给后人烦恼,说不定项目已经被停归档了。 |
93 bthulu 2024 年 12 月 5 日目前八亿单表没问题, 等你数据到八亿了, 硬件也早就日新月异了, 更不用担心了 |
94 onesuren 2024 年 12 月 5 日这个场景 时序数据库比较合适。 |
95 NoKey 2024 年 12 月 5 日我们用的 pgsql ,一年 2 亿多数据,现在 2 年了,还是单表,除了一些改字段,大批量更新很慢之外,正常写入查询几乎感觉不到啥性能问题。所以,先找目标数据库进行压测,测试完了看结果再说,网上一些老八股文讲的什么几百万分库,都是早些年的环境下的结论了 |
96 JingKeWu 2024 年 12 月 5 日 |
100 sazima 2024 年 12 月 5 日之前做物联网相关的,一天 6000w 数据, 单表。 |
此内容由惯性聚合(RSS阅读器)自动聚合整理,仅供阅读参考。 原文来自 — 版权归原作者所有。