惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

SecWiki News
SecWiki News
I
InfoQ
The Cloudflare Blog
人人都是产品经理
人人都是产品经理
博客园 - Franky
T
Tailwind CSS Blog
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
量子位
博客园_首页
罗磊的独立博客
V
V2EX
李成银的技术随笔
大猫的无限游戏
大猫的无限游戏
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
T
True Tiger Recordings
Vercel News
Vercel News
Cyberwarzone
Cyberwarzone
Cisco Talos Blog
Cisco Talos Blog
F
Fox-IT International blog
D
Darknet – Hacking Tools, Hacker News & Cyber Security
M
Microsoft Research Blog - Microsoft Research
Know Your Adversary
Know Your Adversary
爱范儿
爱范儿
The Register - Security
The Register - Security
G
Google Developers Blog
The Hacker News
The Hacker News
Malwarebytes
Malwarebytes
S
Securelist
博客园 - 三生石上(FineUI控件)
Jina AI
Jina AI
T
Threat Research - Cisco Blogs
T
The Exploit Database - CXSecurity.com
S
SegmentFault 最新的问题
博客园 - 叶小钗
F
Fortinet All Blogs
Apple Machine Learning Research
Apple Machine Learning Research
宝玉的分享
宝玉的分享
博客园 - 聂微东
T
Threatpost
博客园 - 【当耐特】
D
Docker
P
Privacy & Cybersecurity Law Blog
www.infosecurity-magazine.com
www.infosecurity-magazine.com
G
GRAHAM CLULEY
V
Visual Studio Blog
C
Cisco Blogs
IT之家
IT之家
S
Security Archives - TechRepublic
Latest news
Latest news
阮一峰的网络日志
阮一峰的网络日志

元视角

Terraform 极简入门:从 AWS-CLI 到基础设施即代码(IaC) - 元视角 .NET 生态下的 Agent 框架选型:从 ReAct 到原生推理 - 元视角 从「能用」到「好用」:LLM 流式响应实现方式的探索之路 - 元视角 当我用 2000 条聊天记录,让 AI 为我画一幅自画像 - 元视角 基于 Supabase 的 AI 应用开发探索 - 元视角 盛世幻象:从荔枝看盛唐的兴衰 - 元视角 观影 - 元视角 听歌 - 元视角 个人作品 - 元视角 站点统计 - 元视角 读书 - 元视角 微博 × MCP:社交媒体新玩法解锁 - 元视角 四点钟海棠花未眠 - 元视角 留言 - 元视角 Semantic Kernel × MCP:智能体的上下文增强探索 - 元视角 命运、偏见与自由:《魔童之哪吒闹海》的终极抗争 - 元视角 基于 K-Means 聚类分析实现人脸照片的快速分类 - 元视角 容器技术驱动下的代码沙箱实践与思考 - 元视角 温故而知新:后端通用查询方案的再思考 - 元视角 浅议 CancellationToken 在前后端协同取消场景中的应用 - 元视角 Semantic Kernel 视角下的 Text2SQL 实践与思考 - 元视角 走走停停,允许一切发生 - 元视角 关于 ChatGPT 的流式传输,你需要知道的一切 - 元视角 从抖音看见世界的参差 - 元视角 俯仰之间:五一小长假出行记 - 元视角 RAG 的是与非、Rewrite 和 Rerank - 元视角 《你想活出怎样的人生》与宫崎骏的自我和解 - 元视角 使用 EFCore 和 PostgreSQL 实现向量存储及检索 - 元视角 基于 LLaMA 和 LangChain 实践本地 AI 知识库 - 元视角 使用 llama.cpp 在本地部署 AI 大模型的一次尝试 - 元视角 如何为 Git 配置多个 SSH Key - 元视角 C# 使用 LibUsbDotNet 实现 USB 设备检测 - 元视角 基于 C# 实现样式与数据分离的打印方案 - 元视角 基于 SVG 的图形交互方案实践 - 元视角 前端视频播放技术概览 - 元视角 你好,千寻小姐 - 元视角 温故而知新,再话 Python 动态导入 - 元视角 后 GPT 时代,NLP 不存在了? - 元视角 视频是不能 P 的系列:使用 Milvus 实现海量人脸快速检索 - 元视角 GDI+下字体大小自适应方案初探 - 元视角 小爱音箱集成 ChatGPT 的不完全教程 - 元视角 程序员视角下的三体世界随想 - 元视角 关于 Docker 容器配置信息的渐进式思考 - 元视角 在 Docker 容器内集成 Crontab 定时任务 - 元视角 为你的服务器集成 LDAP 认证 - 元视角 似花还似非花 - 元视角 视频是不能 P 的系列:使用 Dlib 实现人脸识别 - 元视角 浅议分布式链路追踪与日志的整合 - 元视角 关于 Git 大文件上传这件小事 - 元视角 .NET 进程内队列 Channel 的入门与应用 - 元视角 使用 Fody 实现 .NET 的静态编织 - 元视角 .NET Core + ELK 搭建可视化日志分析平台(下) - 元视角 聊一聊前端图片懒加载背后的故事 - 元视角 杂感·七月寄望 - 元视角 支持外部链接跳转的 Vue Router 扩展实现 - 元视角 视频是不能 P 的系列:OpenCV 和 Dlib 实现表情包 - 元视角 不得不说的 ASP.NET Core 集成测试 - 元视角 再议 DDD 视角下的 EFCore 与 领域事件 - 元视角 Vue.js 前端项目容器化部署实践极简教程 - 元视角 再见,人间四月天 - 元视角 Python 图像风格化迁移助力画家梦想 - 元视角 在 Vue.js 中使用 Mock.js 实现接口模拟 - 元视角 利用 ASP.NET Core 中的标头传播实现分布式链路追踪 - 元视角 读《一个叫欧维的男人决定去死》 - 元视角 利用 gRPC 实现文件的上传与下载 - 元视角 七种武器:延迟队列的原理和实现总结 - 元视角 gRPC 流式传输极简入门指南 - 元视角 烟波梦影,从天国王朝到刺客信条 - 元视角 关于 - 元视角 Envoy 集成 Jaeger 实现分布式链路追踪 - 元视角 浅议非典型 Web 应用场景下的身份认证 - 元视角 gRPC 借助 Any 类型实现接口的泛化调用 - 元视角 分布式丛林探险系列之 Redis 集群模式 - 元视角 写在冬阳升起以前 - 元视角 分布式丛林探险系列之 Redis 主从复制模式 - 元视角 通过 Python 预测 2021 年双十一交易额 - 元视角 从《失控玩家》中得到的启示 - 元视角 gRPC 搭配 Swagger 实现微服务文档化 - 元视角 SSL/TLS 加密传输与数字证书的前世今生 - 元视角 夕雾花园:从建筑中读出的爱情和美学 - 元视角 使用 Python 自动识别防疫健康码 - 元视角 你不可不知的容器编排进阶技巧 - 元视角 ASP.NET Core 搭载 Envoy 实现 gRPC 服务代理 - 元视角 再话 AOP,从简化缓存操作说起 - 元视角 洗衣随想曲 - 元视角 ASP.NET Core 搭载 Envoy 实现微服务身份认证(JWT) - 元视角 浪客剑心:一曲幕末时代的挽歌 - 元视角 ASP.NET Core 搭载 Envoy 实现微服务的监控预警 - 元视角 ASP.NET Core 搭载 Envoy 实现微服务的负载均衡 - 元视角 ASP.NET Core 搭载 Envoy 实现微服务的反向代理 - 元视角 ASP.NET Core gRPC 打通前端世界的尝试 - 元视角 EFCore 实体命名约定库:EFCore.NamingConventions - 元视角 ASP.NET Core gRPC 集成 Polly 实现优雅重试 - 元视角 ASP.NET Core gRPC 健康检查的探索与实现 - 元视角 ASP.NET Core gRPC 拦截器的使用技巧分享 - 元视角 SnowNLP 使用自定义语料进行模型训练 - 元视角 假如时间有温度 - 元视角 使用 HttpMessageHandler 实现 HttpClient 请求管道自定义 - 元视角 ABP vNext 的实体与服务扩展技巧分享 - 元视角 ABP vNext 对接 Ant Design Vue 实现分页查询 - 元视角
通过 EF/Dapper 扩展实现数据库审计功能 - 元视角
2020-04-24 · via 元视角

相信大家都有过周末被电话“吵醒”的经历,这个时候,客服同事会火急火燎地告诉你,客户反馈生产环境上某某数据“异常”,然后你花费大量时间去排查这些错误数据,发现这是客户使用某一种“骚”操作搞出来的“人祸”。可更多的时候,你不会这么顺利,因为你缺乏有力的证据去支持你的结论。最终,你不情愿地去处理了这些错误数据。你开始反思,为什么没有一种流程去记录客户对数据的变更呢?为什么你总要花时间去和客户解释这些数据产生的原因呢?好了,这就要说到我们今天这篇博客的主题——审计。

什么是审计

结合本文引言中的描述的场景,当我们需要知道某条数据被什么人修改过的时候,或者是希望在数据变更的时候去通知某个人,亦或者是我们需要追溯一条数据的变更历史的时候,我们需要一种机制去记录数据表中的数据变更,这就是所谓的审计。而实际的业务中,可能会有类似,查询某一个员工一天内审批了多少单据的需求。你不要笑,人类常常如此无聊,就像我们有一个异常复杂的计费逻辑,虽然审计日志里记录了某个费用是怎么计算出来的,可花时间最多的地方,无一例外是需要开发去排查和解释的,对于这一点,我时常感觉疲于应对,这是我这篇文章里想要写审计的一个重要原因。

EF/EF Core 实体跟踪

EF 和 EF Core 里都提供了实体跟踪的功能,我的领导经常吐槽我,在操作数据库的时候,喜欢显式地调用repository.Update()方法,因为他觉得项目中的实体跟踪是默认打开的。可当你学习了Vue以后,你了解到Vue中是检测不到数组的某些变化的,所以,这个事情我持保留意见,显式调用就显式调用呗,万一哪天人家把实体跟踪给关闭了呢?不过,话说回来,实体跟踪确实可以帮我们做一点工作的,其中,就包括我们今天要说的审计功能。

EF 和 EF Core 中的实体追踪主要指 DbContext 类的 ChangeTracker,而通过 DetachChanges()方法,则可以获得那些变化了的实体的集合。所以,使用实体追踪来实现审计功能,本质上就是在 SaveChanges()方法调用前后,记录实体中每一个字段的变化情况。为此,我们考虑编写下面的类——AuditDbContextBase,顾名思义,这是一个审计相关的 DbContext 基类,所以,希望实现审计功能的 DbContext 都会继承这个类。这里,我们重写其 SaveChanges()方法,其基本定义如下:

public class AuditDbContextBase : DbContext, IAuditStorage
{
    public DbSet<AuditLog> AuditLog { get; set; }
    public AuditDbContextBase(DbContextOptions options, AuditConfig auditConfig) : base(options) { }
    public virtual Task BeforeSaveChanges() { }
    public virtual Task AfterSaveChanges() { }

    public override async Task<int> SaveChangesAsync(bool acceptAllChangesOnSuccess,
         CancellationToken cancellationToken = default)
    {
        await BeforeSaveChanges();
        var result = await base.SaveChangesAsync(acceptAllChangesOnSuccess, cancellationToken);
        await AfterSaveChanges();
        return result;
    }

    public void SaveAuditLogs(params AuditLog[] auditLogs)
    {
        AuditLog.AddRange(auditLogs);
        base.SaveChangesAsync();
    }
}

接下来,就是去实现BeforeSaveChanges()AfterSaveChanges()两个方法:

//BeforeSaveChanges
public virtual Task BeforeSaveChanges()
{
    ChangeTracker.DetectChanges();
    _auditEntries = new List<AuditEntry>();
    foreach (var entityEntry in ChangeTracker.Entries())
    {
        if (entityEntry.State == EntityState.Detached 
            || entityEntry.State == EntityState.Unchanged)
            continue;
        if (entityEntry.Entity.GetType() == typeof(AuditLog))
            continue;
        if (_auditConfig.EntityFilters.Any(x => x(entityEntry)))
            continue;

        var auditEntry = new AuditEntry(entityEntry, _auditConfig);
        _auditEntries.Add(auditEntry);
    }

    return Task.CompletedTask;
}

//AfterSaveChanges
public virtual Task AfterSaveChanges()
{
    if (_auditEntries == null || !_auditEntries.Any())
        return Task.CompletedTask;

    _auditEntries.ForEach(auditEntry => auditEntry.UpdateTemporaryProperties());

    var auditLogs = _auditEntries.Select(x => x.AsAuditLog()).ToArray();
    if (!_auditConfig.AuditStorages.Any())
        _auditConfig.AuditStorages.Add(this);
    _auditConfig.AuditStorages.ForEach(
        auditStorage => auditStorage.SaveAuditLogs(auditLogs)
    );

    return Task.CompletedTask;
}

可以注意到,我们会在SaveChanges()方法执行前,通过ChangeTracker.DetectChanges()方法显式地捕获“变化",这些“变化”会被存储到一个临时的列表中。而在SaveChanges()方法执行后,则会更新那些只有在数据提交后才可以获得的“临时”数据,最典型的例子是自增的 ID,在数据提交前,我们是无法获得真正的 ID 的。这个列表中的内容最终会通过AsAuditLog()方法进行转化。下面是AuditEntry中的部分代码片段:

//SetValuesCollection
private void SetValuesCollection(List<PropertyEntry> properties)
{
    foreach (var property in properties)
    {
        var propertyName = property.Metadata.GetColumnName();
        if (_auditConfig.PropertyFilters.Any(x => x(_entityEntry, property)))
            continue;

        switch (OperationType)
        {
            case OperationType.Created:
                NewValues[propertyName] = property.CurrentValue;
            break;
            case OperationType.Updated:
                if (_auditConfig.IsIgnoreSameValue 
                    && property.OriginalValue.ToString() == property.CurrentValue.ToString())
                    continue;
                OldValues[propertyName] = property.OriginalValue;
                NewValues[propertyName] = property.CurrentValue;
            break;
            case OperationType.Deleted:
                OldValues[propertyName] = property.OriginalValue;
            break;
        }
    };
}

//AsAuditLog
public AuditLog AsAuditLog()
{
    return new AuditLog()
    {
        Id = Guid.NewGuid().ToString("N"),
        TableName = TableName,
        CreatedBy = string.Empty,
        CreatedDate = DateTime.Now,
        NewValues = NewValues.Any() ? JsonConvert.SerializeObject(NewValues) : null,
        OldValues = OldValues.Any() ? JsonConvert.SerializeObject(OldValues) : null,
        ExtraData = ExtraData.Any() ? JsonConvert.SerializeObject(ExtraData) : null,
        OperationType = (int)OperationType
    };
}

在此基础上,我们可以编写我们实际的 DbContext,这里以 CustomerContext 为例,当我们向其中添加、修改和删除 Customer 的时候,就会触发审计相关的逻辑,默认情况下,审计产生的数据 AuditLog 和 Customer 在同一个数据库上下文中,当然,我们可以通过注入 IAuditStore 来实现更精细的控制,例如,可以将审计日志输入到文本文件,甚至是 Mongodb 这样的非关系型数据库里,因为有依赖注入的存在,这些实现起来会非常的简单!

//注入AuditLog配置
services.AddAuditLog(config => 
    config
    .IgnoreTable<AuditLog>()
    .IgnoreProperty<AuditLog>(x => x.CreatedDate)
    .WithExtraData("Tags", ".NET Core")
    .WithStorage<FileAuditStorage>()
    .WithStorage<MongoAuditStorage>()
);

//注入DbContext
services.AddDbContext<CustomerContext>(options =>
    options.UseSqlServer(Configuration.GetConnectionString("DefaultConnection")));

//像平时一样使用EF
var entity = _context.Customer.Where(x => x.Id == customer.Id).FirstOrDefault();
entity.Name = customer.Name;
entity.Email = customer.Email;
entity.Address = customer.Address;
entity.Tel = customer.Tel;
_context.Customer.Update(entity);
await _context.SaveChangesAsync();

下面是最终生成的审计日志信息:

审计日志表展示 审计日志表展示

Castle 动态代理

而对于像 Dapper 这种轻量级的 ORM,它本身没有类似 EF/EF Core 的 ChangeTracker 的设计,如果我们在项目中使用 Dapper,并且希望实现审计的相关功能,直观上看就会有一点困难。其实,平时在混合使用 EF/Dapper 的过程中,经常遇到的问题就是,如何确保传统的 ADO.NET 和 EF 在一个数据库事务中,如何确保 Dapper 和 EF 在一个数据库事务中等等。此时,我们就需要一点抽象,首先去实现一个 Dapper 的仓储模式,然后再借助 Castle 这类动态代理库实现对接口的拦截。这里以 Dapper 的扩展库 Dapper.Contrib 为例。首先,我们定义一个仓储接口 IRepository:

public interface  IRepository
{
    TEntity GetByID<TEntity>(object id) where TEntity : class;

    TEntity GetByKeys<TEntity>(object keys) where TEntity : class;

    TEntity QueryFirst<TEntity>(string sql, object param) where TEntity : class;

    TEntity QuerySingle<TEntity>(string sql, object param) where TEntity : class;

    [AuditLog(OperationType.Created)]
    void Insert<TEntity>(params TEntity[] entities) where TEntity : class;

    [AuditLog(OperationType.Updated)]
    void Update<TEntity>(params TEntity[] entities) where TEntity : class;

    [AuditLog(OperationType.Deleted)]
    void Delete<TEntity>(params TEntity[] entities) where TEntity : class;

    void Delete<TEntity>(params object[] ids) where TEntity : class;

    IEnumerable<TEntity> GetByQuery<TEntity>(Expression<Func<TEntity,bool>> exps) where TEntity : class;

    IEnumerable<TEntity> GetByQuery<TEntity>(string sql, object param) where TEntity : class;

    IEnumerable<TEntity> GetAll<TEntity>() where TEntity : class;
}

接下来,我们就可以在拦截器中实现数据审计功能,因为 Dapper 本身没有 ChangeTracker,所以,我们必须要在先从数据库中查出来 OldValue,所以,实际效率应该并不会特别高,这里权当做为大家扩展思路吧!

public class AuditLogInterceptor : IInterceptor
{
    public void Intercept(IInvocation invocation)
    {
        var repository = invocation.Proxy as IRepository;
        var entityType = GetEntityType(invocation);
        var tableName = GetTableName(entityType);
        var tableIdProperty = entityType.GetProperty("Id");
        var auditLogAttrs = invocation.Method.GetCustomAttributes(typeof(AuditLogAttribute), false);
        if (auditLogAttrs == null || auditLogAttrs.Length == 0 || entityType == typeof(AuditLog))
        {
            invocation.Proceed();
            return;
        }

        var auditLogAttr = (auditLogAttrs as AuditLogAttribute[])[0];
        var auditLogs = new List<AuditLog>();
        switch (auditLogAttr.OperationType)
        {
            case Domain.OperationType.Created:
                auditLogs = GetAddedAuditLogs(invocation, tableName);
            break;
            case Domain.OperationType.Updated:
                auditLogs = GetUpdatedAuditLogs(invocation, tableName, entityType, 
                    tableIdProperty, repository);
            break;
            case Domain.OperationType.Deleted:
                auditLogs = GetDeletedAuditLogs(invocation, tableName);
            break;
        }
            
        invocation.Proceed();
        repository.Insert<AuditLog>(auditLogs.ToArray());
    }
}

同样地,这里需要需要使用Autofac将其注册到 IoC 容器中:

builder.RegisterType<DapperRepository>().As<IRepository>()
    .InterceptedBy(typeof(AuditLogInterceptor))
    .EnableInterfaceInterceptors();
builder.RegisterType<AuditLogInterceptor>();

思路延伸:领域事件

最近这段时间,对于数据同步这类“需求”略有感触,譬如某种单据在两个互为上下游的系统里流转,譬如不同系统间实时地对基础资料进行同步等。这类需求可能会通过ETLDBLink这类“数据库”手段实现,亦有可能是通过互相调用 API 的方式实现,再者无非是通过数据库实现类似消息队列的功能……而我个人,更推崇通过事件来处理,因为它更接近人类思考的本质,希望在适当的时机来“通知”对方,而论询实际上是一种相当低效的沟通方式。一个订单被创建,一条记录被修改,本质上都是一个特定事件,而在业务上对此感兴趣的任何第三方,都可以去订阅这个事件,这就是事件驱动的思想。

领域事件 领域事件

我拜读了几篇关于“领域驱动设计(DDD)”文章,了解到 DDD 中有领域事件和集成事件的概念。最直接的体会就是,DDD 是主张“充血模型”的,它把事件附加到实体上,最大的好处就是,可以让“发送(Dispatch)”事件的代码,集中地放在一个地方。而我们现在的业务代码,基本是高度耦合的,每次去添加一个事件的时候,最担心地就是遗漏了某个地方。按照 DDD 的思想,实现领域事件,最常用的伎俩是重写 DbContext 的 SaveChanges()方法,或者在 EF 中去指定 DbContext 的 Complate 事件。这里同样借助了 ChangeTracker 来实现:

public class OrderContext : DbContext
{
    public async Task<bool> SaveChangesAsync(CancellationToken cancellationToken = default(CancellationToken))
    {
        var aggregateRoots = dbContext.ChangeTracker.Entries().ToList();
        await _eventDispatcher.DispatchAsync(aggregateRoots,cancellationToken);
        var result = await base.SaveChangesAsync();
    }
}

其中,_eventDispatcher作为事件分发器来分发事件,它实现了IEventDispatcher接口。相对应地,事件订阅者需要实现IDomainEventHandler接口。如果是最简单的进程内通信,那么你需要一个容器来管理IDomainEventIDomainEventHandler间的关系;而如果是不同微服务间的通信,那么你需要引入RabbitMQ或者kafka这类消息队列中间件。

public interface IDomainEvent
{

}

public interface IDomainEventHandler<in TDomainEvent>
        where TDomainEvent : IDomainEvent
{
    Task HandleAysnc(TDomainEvent @event, CancellationToken cancellationToken = default);
}

public interface IEventDispatcher
{
    Task DispatchAsync<TDomainEvent>(
        TDomainEvent @event,
        CancellationToken cancellationToken = default) where TDomainEvent :IDomainEvent;
}

所以,你现在问我怎么样做数据同步好,我一定会说,通过事件来处理。因为这样,每一条数据的新增、更新、删除,都可以事件的形式发布出去,而关心这些数据的下游系统,则只需要订阅这些事件,该干嘛好嘛,何乐而不为呢?搞什么中间表,打什么标记,用数据库一遍遍地实现消息队列有意思吗?同样地,你会意识到,仓储模式,哪怕 ORM 换成 Dapper,我们一样可以去发布这些事件,增量同步自然是要比全量同步优雅而且高效的。最重要的是,程序员再不需要到处找地方埋点了,你看我博客更新频率这么低,不就是因为这些事情浪费了时间吗(逃?因为,全量 + 实时同步就是一个非常愚蠢的决定。

本文小结

本文分别针对EF CoreDapper实现了数据库审计的功能。对于前者,主要是通过重写 DbContext 的SaveChanges()方法来实现,而EFEF Core中的ChangeTracker则提供了一种获取数据库表记录变化前后值的能力。而对于后者,主要是实现了Dapper的仓储模式,在此基础上结合Castle的动态代理功能,对仓储接口进行拦截,以此实现审计日志的记录功能。整体来看,后者对代码的侵入性要更小一点,理论上我们可以实现EFEF Core的仓储模式,这样两者在实现上会更接近一点,当然,更直接的方案是去拦截SaveChanges()方法,这和我们使用继承的目的是一样的,由于 Dapper 本身没有ChangeTracker,所以,在处理Update()相关的仓储接口时,都需要先查询一次数据库,这一点是这个方案里最大的短板。而顺着这个方案扩展下去,我们同样可以挖掘出一点DDD领域事件的意味,这就变得很有意思了,不是吗?这篇博客就先写到这里吧……再见