使用 Python 配合 Redis 超越缓存

网友投稿 836 2023-05-20

使用 Python 配合 Redis 超越缓存

使用 Python 配合 Redis 超越缓存

如果你是一位 Python 开发者, 那么你肯定使用过 Redis , 并且认为它是一个很棒的缓存。 虽然你的印象没有错, Redis 的确是一个很棒的缓存, 但使用 Redis 能够解决的问题并不仅限于缓存。

我们将探索 Redis 和 Redis Enterprise 的一些其他用途。 为了找点乐子, 我将使用之前《 使用 Redis 储存地理位置数据 》一文中的大脚怪(Bigfoot)数据。 此外, 由于这篇文章的读者都是 Python 开发者, 所以我将使用 Python 来编写本文的所有代码!

我在接下来展示的代码中使用了 aioredis 客户端库, 因为它对 async/await 提供了非常棒的支持。 如果你对 async/await 不熟悉的话, 那么可以去看看 这篇文章 , 里面提到了 async/await 对提升性能的帮助。

使用 Redis 构建队列

Redis 提供了字符串、哈希、集合和列表等多种数据结构可供使用。 这些数据结构都是储存数据的好帮手, 其中列表就可以用作一个非常棒的队列(queue)。

为了将列表用作队列, 我们需要使用 RPUSH 将新项目推送至列表末尾, 然后使用 LPOP 或者 BLPOP 将它们从列表的前面弹出。 由于 Redis 对数据库的所有修改都是在单个线程里面完成的, 所以这些操作都是原子的。

作为例子, 下面这段在队列里面添加了一些大脚怪的踪迹。

import asyncio import aioredis  async def main():    redis = await aioredis.create_redis('redis://:foobared@localhost:6379/0', encoding='utf-8')    await asyncio.gather(     add_to_queue(redis, 'Possible vocalizations east of Makanda'),     add_to_queue(redis, 'Sighting near the Columbia River'),     add_to_queue(redis, 'Chased by a tall hairy creature')   )    redis.close()   await redis.wait_closed()  def add_to_queue(redis, message):   return redis.rpush('bigfoot:sightings:received', message)  asyncio.run(main())

import asyncio 这个程序非常直接。 我们只需要在第 18 行调用 redis.rpush , 就能够将指定的元素推入到队列。 接下来是从队列另一端读取元素的代码, 同样非常简单。

import aioredis   from pprint import pp   async def main():     redis = await aioredis.create_redis('redis://:foobared@localhost:6379/0', encoding='utf-8')     while True:      sighting = await redis.blpop('bigfoot:sightings:received')      pp(sighting)   asyncio.run(main())

Redis 还有 一些同样很酷的命令 , 它们不仅可以将列表用作队列甚至堆栈。 我最喜欢的是 BRPOPLPUSH , 它可以从列表的右侧阻塞并弹出一些元素, 然后将被弹出的元素推入到另一个列表。 你可以使用这个命令来将一个队列中的元素传递至另一个队列, 这是非常棒的一个命令。第 11 行和第 12 行的无限循环将等待并且打印被推入至队列中的大脚怪踪迹。 这里使用了 redis.blpop 而不是 redis.lpop , 因为前者可以阻塞客户端并等待列表中的元素返回。 比起让 Redis 和 Python 代码之间的网络无休止地轮询并做无用功, 让客户端阻塞并等待元素出现的做法会高效得多。

使用 Redis 订阅和发送事件

Redis 提供的东西中有些并不是数据结构, 比如订阅与发布(Pub/Sub)特性就是其中之一。 这个特性就像它的名字一样, 是一个内置于 Redis 中的发布与订阅机制。 得益于这个特性, 我们只需要 使用一些命令 就可以在自己的 Python 应用里面添加强大的订阅与发布机制。

通过执行订阅操作可以让我们发现事件, 以下是代码:

import asyncio  import aioredis   from pprint import pp   async def main():     redis = await aioredis.create_redis('redis://:foobared@localhost:6379/0', encoding='utf-8')     [channel] = await redis.psubscribe('bigfoot:broadcast:channel:*')     while True:      message = await channel.get()      pp(message)   asyncio.run(main())

用于匹配模式的 redis.psubscribe 函数和非模式匹配的 redis.subscribe 函数都返回 Python 列表, 以便包含不定数量的元素。 程序将解构这个列表(Python 的术语是解包)以获得我想要的通道, 并在之后使用 .get 进行阻塞调用以等待下一条消息。因为我想要接收所有跟大脚兽有关的消息, 所以我在这段代码的第 10 行使用 redis.psubscribe 订阅了一个 Glob 风格的模式, 通过使用 bigfoot:broadcast:channel:* 作为模式, 客户端将接收到所有以 bigfoot:broadcast:channel: 开头的事件。

发布事件非常简单, 下面是代码:

import asyncio  import aioredis   async def main():     redis = await aioredis.create_redis('redis://:foobared@localhost:6379/0', encoding='utf-8')     await asyncio.gather(      publish(redis, 1, 'Possible vocalizations east of Makanda'),      publish(redis, 2, 'Sighting near the Columbia River'),      publish(redis, 2, 'Chased by a tall hairy creature')    )     redis.close()    await redis.wait_closed()   def publish(redis, channel, message):    return redis.publish(f'bigfoot:broadcast:channel:{channel}', message)   asyncio.run(main())

值得注意的是, 发布与订阅是一个发送即遗忘机制(fire-and-forget)。 如果代码发布了一个事件但是却没有人监听, 那么该事件就会消失。 如果你想让自己的事件持续存在, 那么可以考虑使用前面提到的队列, 又或者接下来将要介绍的 Redis 流。这段代码的重点是第 18 行, 它使用了名字非常直接的 redis.publish 来讲消息发布至所需的通道。

使用 Redis 储存数据流

除了发布与订阅之外, Redis 还可以使用流来发布和订阅事件。 Redis 流 是一个非常大的话题, 但使用它只需要 掌握少量命令 。 从 Python 来看, 这些命令的用法都是非常简单的, 我将一一向你说明。

下面的代码将把三次大脚兽的目击事件添加到流里面。

import asyncio  import aioredis   async def main():     redis = await aioredis.create_redis('redis://:foobared@localhost:6379/0', encoding='utf-8')     await asyncio.gather(      add_to_stream(redis, 1, 'Possible vocalizations east of Makanda', 'Class B'),      add_to_stream(redis, 2, 'Sighting near the Columbia River', 'Class A'),      add_to_stream(redis, 3, 'Chased by a tall hairy creature', 'Class A'))     redis.close()    await redis.wait_closed()   def add_to_stream(redis, id, title, classification):    return redis.xadd('bigfoot:sightings:stream', {      'id': id, 'title': title, 'classification': classification })   asyncio.run(main())

每个新添加的流事件都有一个唯一标识符, 其中包含自 1970 年开始的时间戳(毫秒)和一个用破折号连接的序列号。 例如, 当我写这篇文章的时候, 1970 年 1 月 1 日(Unix纪元)午夜已经过去了 1,593,120,357,193 毫秒(1.59千兆秒)。 因此当我运行上面这段代码的时候, 命令将创建出 ID 为 1593120357193-0 的事件。这段代码中最重要的就是第 17 行和第 18 行, 它使用了 redis.xadd 函数将一次目击事件的字段添加到流里面。

我们在添加事件的时候可以使用 * 来代替具体的 ID , 这样 Redis 就会根据当前时间来自动生成事件的 ID , 这也是 redis.xadd 函数的默认行为。

正如接下来的代码所示, 在读取流元素的时候, 我们需要设置一个起始 ID 。 你可以看到, 在第 10 行, 程序将变量 last_id 设置成了 0-0 , 这个 ID 代表流的起始位置。

import asyncio  import aioredis   from pprint import pp   async def main():     redis = await aioredis.create_redis('redis://:foobared@localhost:6379/0', encoding='utf8')     last_id = '0-0'    while True:      events = await redis.xread(['bigfoot:sightings:stream'], timeout=0, count=5, latest_ids=[last_id])      for key, id, fields in events:        pp(fields)        last_id = id   asyncio.run(main())

程序的第 12 行使用 redis.xread 函数从流中请求最多 5 个 0-0 之后的事件。 该调用将返回一个列表, 然后程序将对其进行循环和解构, 以获得事件的字段和标识符。 事件的标识符会被储存起来, 以便将来调用 redis.xread 时可以获得新的事件并在有需要时重新读取之前读取过的旧事件。

将 Redis 用作搜索引擎

Redis 可以通过模块(Module)扩展来增加新的命令和功能。 有 大量的模块 可以用于 AI 模型服务、图形数据库、时间序列数据库以及本例中的搜索引擎。

RedisSearch 是一个强大的搜索引擎, 它摄取数据的速度快得惊人。 有些人喜欢用它来进行 瞬时搜索 , 但除此之外它也可以用来进行其他搜索。 下面是使用该模块的一个例子:

import asyncio import aioredis  from pprint import pp  async def main():    redis = await aioredis.create_redis('redis://:foobared@localhost:6379/0', encoding='utf-8')    await redis.execute('FT.DROP', 'bigfoot:sightings:search')    await redis.execute('FT.CREATE', 'bigfoot:sightings:search',     'SCHEMA', 'title', 'TEXT', 'classification', 'TEXT')    await asyncio.gather(     add_document(redis, 1, 'Possible vocalizations east of Makanda', 'Class B'),     add_document(redis, 2, 'Sighting near the Columbia River', 'Class A'),     add_document(redis, 3, 'Chased by a tall hairy creature', 'Class A'))    results = await search(redis, 'chase|east')   pp(results)    redis.close()   await redis.wait_closed()  def add_document(redis, id, title, classification):   return redis.execute('FT.ADD', 'bigfoot:sightings:search', id, '1.0',     'FIELDS', 'title', title, 'classification', classification)  def search(redis, query):   return redis.execute('FT.SEARCH', 'bigfoot:sightings:search', query)  asyncio.run(main())

在拥有了索引之后, 程序就可以向里面添加文档了, 这一操作发生在程序的第 27 行和第 28 行, 通过 FT.ADD 命令来完成。 每个文档偶读需要一个唯一 ID 、一个介于 0.0 和 1.0 之间的权重(rank)以及相应的字段。在第 12 和第 13 行, 程序使用 FT.CREATE 创建了一个索引。 索引需要描述程序将要添加的每个文档中的字段的模式。 在这个例子中, 程序需要添加大脚兽的目击事件, 该文档包含一个标题和一个分类, 并且它们都是文本字段。

正如程序的第 31 行所示, 在索引加载文档之后, 程序就可以使用 FT.SEARCH 命令和具体的查询语句来执行查询操作。 第 20 行的特定查询指示 RedisSearch 在索引中查找包含这些术语之一的文档。 在这个例子中, 该查询将返回两个文档。

使用 Redis 作为主数据库

Redis 可以作为一个速度奇快的内存存储数据库来使用。 下面的代码使用了哈希来演示这种用法。 哈希是一种非常棒的数据结构, 它可以建模你想要储存的记录类型, 并且能够将数据的主键用作键名的其中一部分。

import asyncio  import aioredis   from pprint import pp   async def main():     redis = await aioredis.create_redis('redis://:foobared@localhost:6379/0', encoding='utf-8')     await asyncio.gather(      add_sighting(redis, 1, 'Possible vocalizations east of Makanda', 'Class B'),      add_sighting(redis, 2, 'Sighting near the Columbia River', 'Class A'),      add_sighting(redis, 3, 'Chased by a tall hairy creature', 'Class A'))     sightings = await asyncio.gather(      read_sighting(redis, 1),      read_sighting(redis, 2),      read_sighting(redis, 3))     pp(sightings)     redis.close()    await redis.wait_closed()   def add_sighting(redis, id, title, classification):    return redis.hmset(f'bigfoot:sighting:{id}',      'id', id, 'title', title, 'classification', classification)   def read_sighting(redis, id):    return redis.hgetall(f'bigfoot:sighting:{id}')   asyncio.run(main())

你可能会这样想”如果我把服务器关掉了怎么办?如果它崩溃了怎么办?那我就什么数据都没有了!“ No,不会的! 你可以修改你的 redis.conf 文件, 用几种不同的方式来持久化内存中的数据 。 此外, 如果你使用的是 Redis Enterprise , 我们也有为你提供 相应的解决方案 , 使得你可以直接使用 Redis 而不必担心持久化的问题。

为了方便你亲手尝试这些例子, 我把文中涉及的 所有代码都放到了 GitHub 上面 , 你可以克隆并开始使用它们。 如果你是 Docker 用户, 项目里面也有一个名为 start-redis.sh 的 shell 脚本, 它可以拉取一个镜像, 然后启动一个能够运行这些例子的 Redis 版本。

如果你在玩耍完毕之后想要认真地构建一些软件, 那么可以注册并尝试 Redis Cloud Essentials 。 它和你所熟悉和喜欢的 Redis 一样, 唯一的区别就是这种 Redis 由云端进行管理, 所以你只需要专注于构建你的软件即可。

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:三篇文章了解 TiDB 技术内幕 - 谈调度
下一篇:工欲性能调优,必先利其器(1)
相关文章