惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

IntelliJ IDEA : IntelliJ IDEA – the Leading IDE for Professional Development in Java and Kotlin | The JetBrains Blog
IntelliJ IDEA : IntelliJ IDEA – the Leading IDE for Professional Development in Java and Kotlin | The JetBrains Blog
C
CXSECURITY Database RSS Feed - CXSecurity.com
博客园_首页
H
Hackread – Cybersecurity News, Data Breaches, AI and More
T
ThreatConnect
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
博客园 - 聂微东
H
Help Net Security
T
Threat Research - Cisco Blogs
Blog — PlanetScale
Blog — PlanetScale
A
Arctic Wolf
G
Google Developers Blog
量子位
U
Unit 42
I
InfoQ
V
V2EX
F
Fox-IT International blog
P
Privacy & Cybersecurity Law Blog
V
Visual Studio Blog
J
Java Code Geeks
大猫的无限游戏
大猫的无限游戏
C
CERT Recently Published Vulnerability Notes
博客园 - 三生石上(FineUI控件)
T
The Exploit Database - CXSecurity.com
T
Tailwind CSS Blog
SecWiki News
SecWiki News
Know Your Adversary
Know Your Adversary
MyScale Blog
MyScale Blog
宝玉的分享
宝玉的分享
The Hacker News
The Hacker News
Project Zero
Project Zero
Application and Cybersecurity Blog
Application and Cybersecurity Blog
月光博客
月光博客
Recent Commits to openclaw:main
Recent Commits to openclaw:main
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
G
GRAHAM CLULEY
C
Cisco Blogs
I
Intezer
Simon Willison's Weblog
Simon Willison's Weblog
O
OpenAI News
Recorded Future
Recorded Future
T
Tenable Blog
W
WeLiveSecurity
腾讯CDC
Stack Overflow Blog
Stack Overflow Blog
T
The Blog of Author Tim Ferriss
www.infosecurity-magazine.com
www.infosecurity-magazine.com
D
Docker
C
Cybersecurity and Infrastructure Security Agency CISA
PCI Perspectives
PCI Perspectives

文章列表

亚马逊的技术哲学 11月初的美国之旅 -- 参加微软的 Microsoft Ignite 2019 如何学习一门新的语言 思路清奇:通过 JavaScript 获取移动设备的型号 一些关于Logecho的新动态 利用dns解析来实现网站的负载均衡 服务器被sfewfesfs病毒攻击 从一些小白问题想到的 使用phar上线你的代码包 Ruby学习第一天 从如何获取可信赖的ip地址聊起 新版 SegmentFault 重构之系统架构 一个用于web开发的泛域名 如何优雅地连接ssh 我是如何看简历的 靠谱的前端工程师在哪里 PHP 5.6新特性之一:内部操作符重载 邮件发送服务AWS SES,Mailgun以及SendCloud 用PHP实现一个Amazon SES的代理服务器 在MySQL字段中使用逗号分隔符 JavaScript 教程 - SegmentFault 思否
怎么样使用 Redis 来存储和查询 ip 数据
joyqi · 2013-12-05 · via

今天我的朋友佛手给我打了个电话,他们网站的业务要根据客户的 ip 地址快速定位客户的地理位置。网上已经有一大堆类似的 ip 地址库可以用,但问题是这些地址库的数据表结构大多如下所示

+--------------+------------------+------+-----+---------+----------------+
| Field        | Type             | Null | Key | Default | Extra          |
+--------------+------------------+------+-----+---------+----------------+
| ip_id        | int(11) unsigned | NO   | PRI | NULL    | auto_increment |
| ip_country   | varchar(50)      | NO   |     | NULL    |                |
| ip_startip   | bigint(11)       | NO   | MUL | NULL    |                |
| ip_endip     | bigint(11)       | NO   | MUL | NULL    |                |
| country_code | varchar(2)       | NO   |     | NULL    |                |
| zone_id      | int(11)          | NO   |     | 0       |                |
+--------------+------------------+------+-----+---------+----------------+

最核心的部分是三个:ip_startipip_endip 以及 ip_id。其中 ip_id 是我们要查询的结果,当然你也可以把 zone_idip_country 包括进去。我这里就用 ip_id 来特指查询结果了。

面对这个表,没什么其它办法,你的查询语句只能是

sqlSELECT * FROM who_ip WHERE ip_startip <= {ip} AND ip_endip >= {ip}

其中 {ip} 是你要查询的 ip 地址,为了方便查询,在 php 中我们一般要用 ip2long 函数把它转换为一个整数。现在问题来了,这个表有 400 万条数据,无论你怎么优化它的索引结构(实际上我觉得这没啥用),在以上查询语句中都要耗费 2 秒以上的时间,对于一个高频使用的接口,这显然是不可忍受的。

REDIS 可以解决这个问题吗?

实际上这也是佛手同学最关心的问题,因为我们知道Redis有强大数据结构和超快的速度,那么我们能设计出适应这种查询场景的结构吗?

范围查询,我首先想到的就是Redis里面的Sorted Sets结构,这也是redis中唯一可以指定范围(SCORE值)查询的结构了,所以基本上我们的希望都寄托在它身上了。

最简单粗暴的方法就是把ip_startipip_endip都转化为Sorted Sets里的Score,然后把ip_id定义为Member。这样我们的查询就很简单了,只需要用ZRANGESCORE查询出离ip最近SCORE对应的两个ip_id即可。然后再分析,如果这两个ip_id是相同的,那么说明这个ip在这个地址段,如果不同的话证明这个ip地址没有被任何地址段所定义,是一个未知的ip。

基本逻辑是没有问题的,但是最大的问题还是性能上的挑战。根据我的经验,一个SET里面放10万条数据以上就已经很慢了,如果放到400万这种量级,我非常怀疑它跟mysql相比还有优势吗?

我设计的存储结构

我的解决方案是把这个地址库切分,每一片区最多保存65536个地址。也就是说如果一个ip地址段为188.88.77.22 - 188.90.78.10,那么我们就把它切分为

188.88.77.22 - 188.88.77.255
188.89.0.0 - 188.89.255.255
188.90.0.0 - 189.90.78.10

也就是我们保证每一个ip地址段都被保存在xxx.xxx.0.0 - xxx.xxx.255.255的一个区段中,这个区段的理论极限是保存65536个值,实际上要远小于这个数字。而这样的区段理论上也有65536个,这都是ip地址的设计所限,当然实际上也远小于这个值。

因此这样的设计基本上就能满足我们的性能需要了。以下是我用php写的数据切分程序

php<?php

// redis 参数
define('REDIS_HOST', '127.0.0.1');
define('REDIS_PORT', 6379);
define('REDIS_DB', 10);

define('MYSQL_HOST', 'localhost');
define('MYSQL_PORT', 3306);
define('MYSQL_USER', 'root');
define('MYSQL_PASS', '123456');
define('MYSQL_DB', 'who_brand');

define('MYSQL_TABLE', 'who_ip');
define('MYSQL_COLUMN_START', 'ip_startip');
define('MYSQL_COLUMN_END', 'ip_endip');
define('MYSQL_COLUMN_ID', 'ip_id');
define('MYSQL_PAGESIZE', 1000);

mysql_connect(MYSQL_HOST . ':' . MYSQL_PORT, MYSQL_USER, MYSQL_PASS);
mysql_select_db(MYSQL_DB);

function add_ip($page, $offset, $value) {
    static $redis;

    if (!$redis) {
        $redis = new Redis();
        $redis->connect(REDIS_HOST, REDIS_PORT);
        $redis->select(REDIS_DB);
    }

    $key = 'ip:' . $page;
    $redis->zAdd($key, $offset, $value);
}

$page = 0;
do {
    $offset = $page * MYSQL_PAGESIZE;
    $count = 0;

    $res = mysql_query('SELECT * FROM ' . MYSQL_TABLE . ' LIMIT ' . MYSQL_PAGESIZE . " OFFSET {$offset}");

    while ($ip = mysql_fetch_assoc($res)) {
        $start = $ip[MYSQL_COLUMN_START];
        $end = $ip[MYSQL_COLUMN_END];
        $value = $ip[MYSQL_COLUMN_ID];

        $startOffset = $start % 65536;
        $endOffset = $end % 65536;

        $start -= $startOffset;
        $end -= $endOffset;

        $startPage = $start / 65536;
        $endPage = $end / 65536;

        for ($i = $startPage; $i <= $endPage; $i ++) {
            if ($i == $startPage) {
                add_ip($i, $startOffset, 's:' . $value);

                if ($i != $endPage) {
                    add_ip($i, 65535, 'e:' . $value);
                }
            }

            if ($i == $endPage) {
                add_ip($i, $endOffset, 'e:' . $value);

                if ($i != $startPage) {
                    add_ip($i, 0, 's:' . $value);
                }
            }

            if ($i != $endPage && $i != $startPage) {
                add_ip($i, 0, 's:' . $value);
                add_ip($i, 65535, 'e:' . $value);
            }
        }

        echo ($page * MYSQL_PAGESIZE + $count) . "\n";
        $count ++;
    }

    $page ++;
} while ($count = MYSQL_PAGESIZE);

查询程序也非常简单

php<?php

define('REDIS_HOST', '127.0.0.1');
define('REDIS_PORT', 6379);
define('REDIS_DB', 10);

$redis = new Redis();
$redis->connect(REDIS_HOST, REDIS_PORT);
$redis->select(REDIS_DB);

$ip = ip2long('173.255.218.70');
$offset = $ip % 65536;
$page = ($ip - $offset) / 65536;


// 取出小于等于它的最接近值
$start = $redis->zRevRangeByScore('ip:' . $page, 0, $offset, array(
    'limit' => array(0, 1)
));

// 取出大于等于它的最接近值
$end = $redis->zRangeByScore('ip:' . $page, $offset, 65535, array(
    'limit' => array(0, 1)
));

if (empty($start) || empty($end)) {
    echo 'unknown';
    exit;
}

$start = $start[0];
$end = $end[0];

list ($startOp, $startId) = explode(':', $start);
list ($endOp, $endId) = explode(':', $end);

if ($startId != $endId) {
    echo 'unknown';
    exit;
}

echo $startId;

转载自我的博客:http://70.io/develop/use-redis-to-store-ip-data.html