惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

V2EX - 技术
V2EX - 技术
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
Latest news
Latest news
T
The Exploit Database - CXSecurity.com
博客园 - 三生石上(FineUI控件)
WordPress大学
WordPress大学
L
Lohrmann on Cybersecurity
aimingoo的专栏
aimingoo的专栏
B
Blog
T
Threat Research - Cisco Blogs
罗磊的独立博客
Application and Cybersecurity Blog
Application and Cybersecurity Blog
P
Proofpoint News Feed
P
Palo Alto Networks Blog
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
宝玉的分享
宝玉的分享
博客园 - 司徒正美
Google DeepMind News
Google DeepMind News
Blog — PlanetScale
Blog — PlanetScale
T
Tor Project blog
阮一峰的网络日志
阮一峰的网络日志
Last Week in AI
Last Week in AI
Martin Fowler
Martin Fowler
酷 壳 – CoolShell
酷 壳 – CoolShell
Recorded Future
Recorded Future
D
DataBreaches.Net
Y
Y Combinator Blog
大猫的无限游戏
大猫的无限游戏
IT之家
IT之家
B
Blog RSS Feed
Scott Helme
Scott Helme
P
Proofpoint News Feed
V
Vulnerabilities – Threatpost
A
Arctic Wolf
Help Net Security
Help Net Security
L
LINUX DO - 最新话题
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
Vercel News
Vercel News
AWS News Blog
AWS News Blog
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
S
Schneier on Security
Hacker News: Ask HN
Hacker News: Ask HN
N
Netflix TechBlog - Medium
L
LangChain Blog
博客园 - 叶小钗
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
M
MIT News - Artificial intelligence
N
News and Events Feed by Topic
Webroot Blog
Webroot Blog
W
WeLiveSecurity

博客园 - 简单生活

街霸4无法建立离线用户的问题 - 简单生活 - 博客园 c/c++和.net之间相互调用 尴尬 googleTranslateApi 想改变一些习惯很难 史玉柱这个人值得研究 秀才造反十年不成(转载) PLSQL常用方法汇总(转载) 值得收藏的民间小偏方 最近事情超级多 勇敢挑起重担 POP3邮件客户端(.NET2.0)--译 关于webcast的wmv文件在windows2003播放声音问题 2007年抓的兔子太多了,结果没抓到一个。 笔记本交还公司了,伴随了我两年的家伙。 用VS2005打开一个.NET2.0方案,里面有几个工程和一个网站,提示网站的项目.csproj文件无法打开:“此安装不支持该项目类型”,的解决办法。 wcg2007总决赛sky和pj双双银牌 - 简单生活 - 博客园 顿悟 网站盈利模式分析总结十条(转载)
一个通过散列在文件夹里找出相同文件工具(译)
简单生活 · 2008-09-01 · via 博客园 - 简单生活

原文:http://www.codeproject.com/KB/files/DuplicateFinder.aspx

点击下载源码:https://files.cnblogs.com/zhangjidong/DuplicateFinder_src.zip

介绍

每年一次,我做一项比较可怕的工作,清理我创建或者下载的文件,最后一次我试着去干这件事情,我认为半自动化的做这件事情是一项比较复杂的事情,我需要一些免费,好用的工具去找到重复的文件,但是我没有找到符合我需要的。

我决定写一个。

背景

CRC算法的方法在http://www.fesersoft.com/dotNet可以找到。我通过调用一个杜里的函数库使用MD5,我添加一个事件到MD5计算方法中,用于计算散列进行情况,这是一个进程,用于读取流的闻之,当md5计算方法读取相同流的时候。

使用守则

The utility uses two main classes, DirectoryCrawler, and hashing. The use is so obvious :)

主要用到两个类:classesDirectoryCrawler,他们的用途显而易见。

兴趣点

#优化文件的移动,当移动大文件的时候,界面反应迟钝。

#添加一个可以选择用crc32还是MD5散列的选项。

#也许使用XML为配置文件,在移动重复文件到D:"DuplicateFiles(这是硬编码,微软万岁!)

并且当扫描的时候跳过,对我是充足的。

#不要忘记把你的帖子弄成大纲。

#(已经做了):写一个事件,可以激活MD5类,用于汇报散列进程,设想有个10GB

历史

 

v0.2

添加List<Fileinfo> List<string[]> 取代数组列表。

MD5散列渠道CRC32

添加跳过源目录操作

添加除去子目录操作

一些优化

许可

这篇文章,联通任何相关源码和文件,都遵循CPOL