惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

博客园_首页
Microsoft Security Blog
Microsoft Security Blog
云风的 BLOG
云风的 BLOG
B
Blog
The Register - Security
The Register - Security
L
LangChain Blog
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
N
Netflix TechBlog - Medium
F
Full Disclosure
The GitHub Blog
The GitHub Blog
Recorded Future
Recorded Future
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
Blog — PlanetScale
Blog — PlanetScale
Jina AI
Jina AI
美团技术团队
宝玉的分享
宝玉的分享
Hugging Face - Blog
Hugging Face - Blog
阮一峰的网络日志
阮一峰的网络日志
G
Google Developers Blog
大猫的无限游戏
大猫的无限游戏
S
SegmentFault 最新的问题
D
DataBreaches.Net
Martin Fowler
Martin Fowler
H
Hackread – Cybersecurity News, Data Breaches, AI and More
Google DeepMind News
Google DeepMind News
WordPress大学
WordPress大学
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
博客园 - Franky
The Cloudflare Blog
博客园 - 【当耐特】
U
Unit 42
月光博客
月光博客
T
The Blog of Author Tim Ferriss
博客园 - 叶小钗
博客园 - 聂微东
I
InfoQ
B
Blog RSS Feed
Apple Machine Learning Research
Apple Machine Learning Research
Cyberwarzone
Cyberwarzone
V
V2EX
S
Securelist
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
S
Security @ Cisco Blogs
PCI Perspectives
PCI Perspectives
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
H
Heimdal Security Blog
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
The Hacker News
The Hacker News
D
Darknet – Hacking Tools, Hacker News & Cyber Security
T
Tor Project blog

博客园 - 在天空飞翔

asp net core 跨平台初体验 获取图片的主色调 U盘启动安装 window server 2003 简单的中文姓名生成器 扩展 DataGridView 的功能(五) WebBrowser - 想说爱你不容易 表白 天涯宝盒-天涯看贴脚本-只看楼主-自动翻页 使用 asp.net 编写的一些大中型的网站 PrecompiledApp.config 的惨剧 [音乐] the dream catcher 扩展DataGridView 的功能(四) 三八节快乐 将MP3文件嵌入到exe中并播放 [音乐] 下个路口见 雷人的面试 发现不明飞行物 扩展 DataGridView 的功能(三) 扩展 DataGridView 的功能(二)
csv 文件的读取
在天空飞翔 · 2011-01-27 · via 博客园 - 在天空飞翔

因为工作中会接触到许多不同的数据库,像 oracle,access,mssql,mysql,db2 等,比较杂。

所以一直想做一个通用的数据查询工具,支持所有的数据库,操作界面统一为 mssql 2005 的界面,这样可以少安装很多客户端工具,也不需要在不同的数据库客户端工具之间切换来切换去了。

先放一个初始的截图,和mssql的操作界面一样,左边是表、列信息显示区,右上是 sql 语句录入区,右下是结果显示区

支持表和字段的自动提示,支持 csv,excel 的导入导出

ps:图中连接的数据库为 IBM DB2 9.5

 

在做数据导入导出功能时,最基本的 csv 文件格式一定要支持吧,当时就想 csv还不简单,无非就是逗号分隔,回车换行的文本文件吗,很快就写出来了


最初的 csv 读取

public static string[][] read_csv(string text)
{
    var text_array 
= new List<string[]>();
    
string[] lines = text.Split('\r''\n');
    
foreach (var line in lines)
    {
        
if (!string.IsNullOrEmpty(line))
        {
            
string[] fields = line.Split(',');
            text_array.Add(fields);
        }
    }
    
return text_array.ToArray();
}

public   text)
{
  lines)
.IsNullOrEmpty(line))
);
            text_array.Add(words);
        }
 text_array.ToArray();

开始一切都好,没遇到什么问题,后来用的多了,问题开始出现了,发现有些 csv的字段中含有逗号,这下完了,遇到逗号就当成另外一个字段了,当然会报错,原来当初太轻视 csv 文件了,呵呵,实际上csv 也是有一些需要注意的规范的。

1.如果csv文件字段中有特殊字符,整个字段应该用双引号包起来

   特殊字符有三种, 逗号[,]    回车换行[\r\n]    和处于字段开头的双引号["]

   例如:字段   a,     b,c(b,c 文本中包含逗号)       ,d      

            就应该变成    a,"b,c",d

            有回车换行的也是一样 

2.如果 csv字段中有特殊字符,并且字段中含有双引号,则字段中的双引号应该写两次

    例如:字段  a,     b,c"aa      ,d

             就应该变成   a,"b,c""aa",d

 有了这两个规范,把读取方法重新修改一下就完了,也不复杂

修改后的 csv 读取

public static string[][] read_csv(string text)
{
    
if (text == null)
        
return null;
    var text_array 
= new List<string[]>();
    var line 
= new List<string>();
    var field 
= new StringBuilder();
    
//是否在双引号内
    bool in_quata = false;
    
//字段是否开始
    bool field_start = true;
    
for (int i = 0; i < text.Length; i++)
    {
        
char ch = text[i];
        
if (in_quata)
        {
            
//如果已经处于双引号范围内
            if (ch == '\"')
            {
                
//如果是两个引号,则当成一个普通的引号处理
                if (i < text.Length - 1 && text[i + 1== '\"')
                {
                    field.Append(
'\"');
                    i
++;
                }
                
else
                    
//否则退出引号范围
                    in_quata = false;
            }
            
else //双引号范围内的任何字符(除了双引号)都当成普通字符
            {
                field.Append(ch);
            }
        }
        
else
        {
            
switch (ch)
            {
                
case ','//新的字段开始
                    line.Add(field.ToString());
                    field.Remove(
0, field.Length);
                    field_start 
= true;
                    
break;
                
case '\"'://引号的处理
                    if (field_start)
                        in_quata 
= true;
                    
else
                        field.Append(ch);
                    
break;
                
case '\r'//新的记录行开始
                    if (field.Length > 0 || field_start)
                    {
                        line.Add(field.ToString());
                        field.Remove(
0, field.Length);
                    }
                    text_array.Add(line.ToArray());
                    line.Clear();
                    field_start 
= true;
                    
//在 window 环境下,\r\n通常是成对出现,所以要跳过
                    if (i < text.Length - 1 && text[i + 1== '\n')
                        i
++;
                    
break;
                
default:
                    field_start 
= false;
                    field.Append(ch);
                    
break;
            }
        }
    }
    
//文件结束
    if (field.Length > 0 || field_start)
        line.Add(field.ToString());
    
if (line.Count > 0)
        text_array.Add(line.ToArray());
    
return text_array.ToArray();
}

经过修改后,基本上就没遇到什么问题了。