






















我经常遇到一种很具体的遗忘:明明知道自己之前在手机上看到过某个东西,却完全想不起它来自哪个 App、出现在哪一天、存在于哪个页面。更麻烦的是我通常没有截图来帮我回忆,那些内容只是当时恰好看到,没有收藏、没有转发、也没有写进笔记。
后来想找,连一个可以回去的入口都没有。
一开始我只是觉得烦,后来我慢慢意识到,这件事可能比「找不到截图」更大一点:如果将来每个人都能拥有自己的 AI 助手,它能不能理解你不只取决于模型有多强,也取决于你给它留下过多少真实的上下文。今天没有留下来的东西,明天很难补上。
所以我开始做屏忆(ScreenMemo),一个开源的本地屏幕记忆工具:自动记录屏幕内容,然后通过 OCR、搜索、时间线、每日总结和 AI 回顾,把那些原本滑走、然后遗忘的内容,变成可以找回的线索。

屏忆的基础工作流程并不神秘:通过无障碍服务定时截屏,然后把截图保存在本地,同时记录当前应用、时间和路径;对截图做 OCR 并建立本地索引后,在 App 里提供搜索、图库、收藏、时间线、动态总结、每日总结和 AI 回顾。
它最直接的场景,是找回那些你觉得「我明明看过」、但记忆相对模糊的内容。
比如昨天在信息流里刷到过一个有用的方法,隔天想再看时却发现没有收藏,想不起作者、也想不起标题。放在过去,我大概会翻浏览记录、重新搜关键词,或者干脆等它哪天再次被推荐。
屏忆的做法更粗暴一点:如果当时屏幕被记录下来,OCR 文本进入了本地索引,之后就可以搜索那几个模糊的关键词,再回到对应截图确认。

第二种情况是找回一段过程。
有些操作不是一张截图能说明白的。注册、登录、授权、付款、查询、客服沟通,都可能跨过好几个页面。单张截图只能告诉你某一刻屏幕上有什么,时间线能把前后关系补回来。屏忆支持按时间回看,也可以生成回放,用来还原一次操作路径。

还有每天的回顾。
如果你一直在手机上查资料、沟通、处理事情,屏幕内容本身也会留下了不少线索。每日总结不是日记,只是先把一天里零散的记录整理成一份能读的摘要。它不一定深刻,但至少能回答一个朴素的问题:今天我大概看过什么、处理过什么。

AI 回顾也是类似思路。
普通 AI 助手并不知道你昨天在手机上看过什么。屏忆在你配置 AI 提供商后,可以基于截图、动态总结、上下文片段和你明确选择的证据图片做回顾。你可以问它「下午那段流程大概在做什么」,也可以让它帮你从一组截图里整理出重点。这里的 AI 不是凭空聊天,它只会将你已经留下的屏幕线索作为上下文。

最后,屏忆也支持收藏和备注。自动记录负责兜底,但有些内容还是要人来标一下,看到值得留下的截图,你可以加一句自己的说明。这个功能小但必要,自动记录再多也替代不了人的判断。

如果要找一个参照物,屏忆和一些桌面端自动记录屏幕的工具有点像。比如我经常想到 Rewind,它早期的方向和屏忆很接近,记录 Mac 上看过、听过的内容,再用 OCR 和语音识别做搜索。这个想法很诱人,也确实说明桌面端早就有人在尝试「屏幕记忆」。只是后来的故事有点复杂:Rewind 在 2024 年转向 Limitless,开始做会议记录和录音吊坠;2025 年被 Meta 收购后,Limitless 官方说明写明 Rewind 应用会逐渐停止运营,最新版从 2025 年 12 月 19 日起已经禁用了屏幕和音频捕获。

Rewind 的事不是一句「产品失败」就能概括的,商业产品会转向、会被收购、会砍掉特定功能,开发团队有自己的选择。但对个人记忆库来说,这些「意外」的影响会变得十分具体,它们的理想状态是长期记录,但这些产品本身未必长期存在。
后续微软的 Recall 则补上了另一层提醒:它同样想把电脑上出现过的内容做成可搜索的时间线;2024 年遇到隐私和安全方面的质疑后,微软在官方博客里说,Recall 会先进入 Windows Insider 计划,而不是直接随 Copilot+ PC 面向用户提供预览。大公司也绕不开这个问题:只要工具会持续记录屏幕,信任就会跑到功能前面。

在手机上几乎没找到同类工具的前提下,偏偏很多最零碎、最容易丢的上下文又都发生在手机上:聊天、搜索、信息流、支付、设置、临时打开的网页。这便是屏忆开发的初心。你的屏幕里可能有聊天、订单、账号、位置、支付流程、工作资料和临时验证码,有了 Rewind、Recall 等功能的「前车之鉴」,屏忆在设计理念上强调本地保存和开源,截图、OCR、索引和大多数配置默认留在本地;代码、实现方式和隐私边界你也能直接在 GitHub 仓库里看到。本地优先也意味着用户必须能把数据带走,屏忆支持导出 ZIP 备份,导入时提供覆盖导入和合并导入。

屏忆还提供隐私模式、敏感内容分析和 NSFW 相关能力。这不是猎奇功能,而是长期记录屏幕以后必须面对的问题。一个记忆工具不能只会保存,也要能遮挡、限制和删除。

存储方面,自动截图的数据是长期增长的,按压缩后约 50 KB 一张、每分钟一张粗算,30 天大约是 43200 张截图,约 2.1 GB。这个数字不算夸张但会持续增长,所以屏忆不能只负责保存。它还要提供目标大小压缩、历史压缩、过期清理、存储分析和按应用策略。你可以只记录真正需要的 App,也可以定期清理不再需要的截图。

屏忆的设置页自上线以来变得越来越长,一开始我也有点犹豫:设置太多会不会显得复杂?但做了一段时间后,我觉得这些开关不能省。
因为屏忆记录的是屏幕,很多选择不应该由工具替用户决定:哪些 App 要进入记忆库、哪些内容需要自动遮挡、AI 请求发给哪个模型、提示词怎么写、请求日志要不要保留……甚至要不要把本地记忆通过 MCP 暴露给同一局域网里的 AI 客户端,这些都应该是明确的选择,而不应该藏在默认行为里。

所以屏忆把 AI 能力被做成了可选项。只有在你启用 AI 并配置提供商后,相关总结或对话请求才会发往你配置的模型服务。这会增加配置门槛,但我更愿意把选择权留给用户,你可以配置 OpenAI、Claude、Gemini 或兼容接口的服务,也可以调整 Prompt,查看请求日志和工具调用报告。这样做不如「打开即用」顺滑,但出了问题时,你至少知道一次总结用了哪些图片、发给了哪个模型、返回了什么结果;MCP 服务也是同样的思路,它可以让桌面端 AI 客户端读取手机里的摘要、搜索结果和少量证据图片,但需要手动开启,只在局域网内工作,并且带 token。

做屏忆之后,我越来越觉得「记住」不是一个单点功能。只做自动截图,会变成图片堆;只做 AI 总结,会缺少证据;只强调本地保存,又必须面对备份和迁移;只强调找回,也要承认有些内容应该被清理。
屏忆现在做的这些功能,本质上都在围绕同一件事:让屏幕上发生过的事,在未来还能有线索可循。
所以它也不会只停在手机端。目前我正在做桌面端,一方面是为了处理更大的备份、合并和迁移任务,另一方面也是希望把手机里留下的记录带到更适合整理、检索和写作的环境里。手机负责捕获那些稍纵即逝的画面,桌面负责承接更长时间尺度上的整理和回看。
更远一点,我希望屏忆能逐步适配更多平台。不是为了把所有设备都塞进同一个 App,而是让记录、搜索、回顾、备份和迁移之间形成一条更完整的链路。你在不同设备上看到过的内容,不应该因为换了设备、换了系统、换了应用入口,就彻底断掉。
屏忆现在才刚刚起步。它还需要更好的兼容性、更稳定的后台、更清晰的隐私控制、更顺滑的搜索体验和更丰富的回顾方式。但从今天开始,把一部分屏幕记忆留在自己手里,我觉得已经是一件值得做的事。
如果未来真的会有更懂我们的个人 AI,它需要的不只是更强的模型,也需要足够真实、足够连续、并且仍然由自己掌握的上下文。屏忆想做的,就是先把这些上下文留下来。
> 关注 少数派小红书,感受精彩数字生活 🍃
> 实用、好用的 正版软件,少数派为你呈现 🚀
此内容由惯性聚合(RSS阅读器)自动聚合整理,仅供阅读参考。 原文来自 — 版权归原作者所有。