redis 实现搜索热词统计“当日 top10”和“当周 top10”两种方案的抉择

核心问题

一个项目中，遇到了搜索热词统计的需求，我使用了 redis 的五大数据类型之一 Sorted Set 实现。目前有两项数据需要统计：“当日搜索热词 top10”和“当周搜索热词 top10”。

关于这两项数据的统计方法，目前想到了两种实现方法：

两个 redis 的 Sorted Set 实现，一个 Sorted Set A 统计当天，0 点 top10 记录进 mysql，Sorted Set 清零。一个 Sorted Seted B 统计当周，每周日 top10 记录进 mysql，Sorted Set B 清零。
只使用用一个 Sorted Set 记录当天搜索热词，0 点 top10 记录进 mysql，Sorted Set 清零。到周日时，会有 7 * 10 行记录。把这 7 * 10 行遍历，每次便利都记录进 Sorted Set，全部遍历结束后，再从 Sorted Set 中取出 top10 记录进 mysql 的周热词统计表中。

Sorted Set 是 redis 的数据结构，方法 1 会占用两份内存，一份当天的，一份当周的。方法 2 会提高系统的复杂度，并且在统计周表时，可能会出现短时间内大量的计算（当然可以使用定时任务放到凌晨进行）。

请问我该选择哪种解决办法比较好呢？

硬件与用户量

我在写的是一个学生项目，ECS 是 1 核 2GB 内存的学生机（别歧视呀哈哈，穷学生 😅）。如果当天的搜索热词和当周的搜索热词都使用 redis 内存记录，我怕内存会爆炸。

目前生产环境的 ECS 内存用了 1GB，保守还剩 900MB，我怕 redis 消耗两份内存会炸。目前是一个小程序的后端，快要上线了，预计初期用户数量不多。关键词长度限制最大 8

天马行空想一下，1MB = 1048576 字节，按两个字节存一个字算，1MB 能存 1048576/2/8 = 65,536 个不重复的搜索关键词，看起来好像可以存很多。我没熟练使用过 redis，不知道这样天马行空地计算，是否真的可以呢 🤔

问题中涉及的相关知识（如已经了解问题，这部分可忽略）

一个项目中，遇到了搜索热词统计的需求。我使用了 redis 的五大数据类型之一 Sorted Set 实现。

Redis 有序集合(sorted set)

Redis 有序集合和集合一样也是 string 类型元素的集合,且不允许重复的成员。

不同的是每个元素都会关联一个 double 类型的分数。redis 正是通过分数来为集合中的成员进行从小到大的排序。

有序集合的成员是唯一的,但分数(score)却可以重复。

集合是通过哈希表实现的，所以添加，删除，查找的复杂度都是 O(1)。集合中最大的成员数为 232 - 1 (4294967295, 每个集合可存储 40 多亿个成员)。

如上图，redis 的 Sorted Set 自带排序功能。

操作方法也比较简单，在本项目中，核心是两个方法：

zincrby 命令，对于一个 Sorted Set，存在的就把分数加 x (x 可自行设定)，不存在就创建一个分数为 1 的成员。

zrevrange，查询集合中指定顺序的值。返回有序的集合中，score 大的在前面。

Linux 下 Redis7 安装（附图解步骤）

[图片] 一、前言由于最近晚上下班回家后实在太过于无聊（电视剧不想追、小说不想看），所以找个项目玩玩，刚好这个项目需要用到 Redis，而现在我的云服务器没有，所以记录一下本次的 Redis 安装流程，为了下次再安装时可以快速响应，就是这个酱子。二、安装流程 1、下载 Redis 压缩包首先，我们需要先到官网上下 ..

Redis Lua 脚本分批操作

Redis 大数据分批操作一般来讲，如果 Redis 一次性执行太多数据的话，可能导致 Redis 服务主进程被长时间阻塞，造成其他命令的执行收到影响。可以使用 Lua 脚本对每次执行的数量做一个限制，数据量超过一定限制后，分批量执行 ‍ 代码实现来源：[链接] local unack2retry = funct ..

Redis

Redis 入门 redis 简介 [图片] [图片] [图片] [图片] redis 的下载和安装 linux [图片] [图片] windows [图片] [图片] redis 服务启动与停止 linux [图片] [图片] 修改成后台启动，在 redis4.0 文件夹下修改 redis.conf。在 vim 中输 ..

【译】特性对比：Redis vs Hazelcast

[图片] 导言 Redis 和 Hazelcast 是构建内存数据库的两个常见选择，但对于您的需求来说哪个更好呢？在本文中，我们将讨论如何在 Redis 和 Hazelcast 之间做出正确选择。 Redis 是什么？ Redis 是一个开源的内存键值数据结构存储库，可以用于实现数据库、缓存和消息代理。Redis 软件 ..

监听 Redis 缓存过期（Key 失效）事件

[图片] 监听 Redis 缓存过期（Key 失效）事件最近写公司一个项目遇到一个场景，设备上线后会以 0.5HZ 的频率给后台发送状态消息，20 秒内没有重连则认为设备下线，需要执行相应操作。首先想到的就是在 Redis 存带过期时间的 key，每次设备发来消息就去刷新 key 的过期时间，key 过期后，则执行 ..

数据库显示进度百分比、估算时间

用数据库管理要看的书和课程时，发现要用到“模板”功能来实现“进度”、“耗时估算”的展现，而模板功能要通过代码实现，经过对论坛大佬教程和 GPT 的参考，有了点眉目，这里分享下本编程小白的实践过程，以及加减乘数运算模板代码。首先，在汇总页旁的“+”号新建“进行中”、“时间统计”，专门显示进度百分比和估算时间，右击列可以 ..

欢迎来到这里！

我们正在构建一个小众社区，大家在这里相互信任，以平等 • 自由 • 奔放的价值观进行分享交流。最终，希望大家能够找到与自己志同道合的伙伴，共同成长。

关于

14 回帖

redis 实现搜索热词统计“当日 top10”和“当周 top10”两种方案的抉择

注册关于

请输入回帖内容 ...

88250 • 3 年前 • 1 • 1 赞同
订阅者

前者，分开维护清晰明了。

1 回复
2501224066 • 3 年前 • 1 • 1 赞同

当然分开啊

1 回复
JellyfishMIX • 3 年前
作者

谢谢 D 大，回复好快。我在写的是一个学生项目，ECS 是 1 核 2GB 内存的学生机（别歧视呀哈哈，穷学生 😅）。如果当天的搜索热词和当周的搜索热词都使用 redis 内存记录，我怕内存会爆炸。

目前生产环境的 ECS 内存用了 1GB，保守还剩 900MB，我怕 redis 消耗两份内存会炸。目前是一个小程序的后端，快要上线了，预计初期用户数量不多。关键词长度限制最大 8

天马行空想一下，1MB = 1048576 字节，按两个字节存一个字算，1MB 能存 1048576/2/8 = 65,536 个不重复的搜索关键词，看起来好像可以存很多。我没熟练使用过 redis，不知道这样天马行空地计算，是否真的可以呢

1 回复
88250 • 3 年前 • 1 赞同
订阅者

嗯，没问题就这样计算，一般的 CRUD 项目不用怎么考虑内存占用，如果真要考虑降低运行时内存换编程语言

2 回复
JellyfishMIX • 3 年前
作者

明白了，谢谢
JellyfishMIX • 3 年前
作者

嗯嗯嗯，我决定采用分开，还能少写点代码，哈哈哈。谢谢！
JellyfishMIX • 3 年前
作者
请问我这样的设计，mysql 的热词统计“周数据”和“天数据”，我也想了两种方案：
1. 周数据和天数据存在一张 table 中，用一个标志位字段 grade 来判断是周数据还是天数据
2. 周数据和天数据分成两张表
上述单表和双表，哪个方案比较好呢
1 回复
88250 • 3 年前
订阅者

其他业务列字段都一样的话一张表，但如果周天数据量相差太大就两张表，分开容易扩展或者运维。

1 回复
JellyfishMIX • 3 年前
作者

明白了，谢谢
DASHU • 3 年前
订阅者支持者勇士

直接存表吧我理念中能数据库的就先数据库

1 回复
JellyfishMIX • 3 年前
作者

考虑过直接存表，不过出于性能的考虑，选择了多使用 redis 的方案。其实还有更合适的 elastic search，但是我还没有学 😅
qloog • 3 年前
捐赠者

简单点的话天的 redis key 用 date[例如：20200603]，周的可以用 [年 + 第几周] 就可以搞定

1 回复
JellyfishMIX • 3 年前
作者

哈哈哈，不错的逻辑。有点类似于分库分表的序号思想。对我来说是不可能用 redis 存长期数据的，数据在内存待 7 天我就感觉难受，我对内存走火入魔得想方设法节省 😅（当然换编程语言是不可能的）

1 回复
qloog • 3 年前
捐赠者

这种排行类的用 redis 完全没有问题，redis 也不是完全基于内存，也会定时写到磁盘的。当然如果要想落到数据库的也可以存一份，仅仅是存储，读取还是走 redis。

redis 实现搜索热词统计“当日 top10”和“当周 top10”两种方案的抉择

核心问题

硬件与用户量

问题中涉及的相关知识（如已经了解问题，这部分可忽略）

相关帖子

Redis[命令篇]

Linux 下 Redis7 安装（附图解步骤）

Redis Lua 脚本分批操作

Redis

【译】特性对比：Redis vs Hazelcast

监听 Redis 缓存过期（Key 失效）事件

数据库显示进度百分比、估算时间

欢迎来到这里！