惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

酷 壳 – CoolShell
酷 壳 – CoolShell
H
Hacker News: Front Page
P
Palo Alto Networks Blog
T
ThreatConnect
Apple Machine Learning Research
Apple Machine Learning Research
博客园_首页
T
True Tiger Recordings
P
Privacy & Cybersecurity Law Blog
B
Blog
IT之家
IT之家
Last Week in AI
Last Week in AI
F
Full Disclosure
Hacker News: Ask HN
Hacker News: Ask HN
C
Comments on: Blog
Microsoft Azure Blog
Microsoft Azure Blog
C
Cybersecurity and Infrastructure Security Agency CISA
Microsoft Security Blog
Microsoft Security Blog
博客园 - 【当耐特】
N
News and Events Feed by Topic
NISL@THU
NISL@THU
腾讯CDC
雷峰网
雷峰网
Security Latest
Security Latest
李成银的技术随笔
M
Microsoft Research Blog - Microsoft Research
L
LangChain Blog
L
Lohrmann on Cybersecurity
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
C
Check Point Blog
Y
Y Combinator Blog
Recent Announcements
Recent Announcements
博客园 - Franky
N
News | PayPal Newsroom
V
V2EX
A
About on SuperTechFans
The Register - Security
The Register - Security
月光博客
月光博客
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
Google Online Security Blog
Google Online Security Blog
MyScale Blog
MyScale Blog
Cisco Talos Blog
Cisco Talos Blog
Vercel News
Vercel News
WordPress大学
WordPress大学
C
Cyber Attacks, Cyber Crime and Cyber Security
The Hacker News
The Hacker News
IntelliJ IDEA : IntelliJ IDEA – the Leading IDE for Professional Development in Java and Kotlin | The JetBrains Blog
IntelliJ IDEA : IntelliJ IDEA – the Leading IDE for Professional Development in Java and Kotlin | The JetBrains Blog
爱范儿
爱范儿
A
Arctic Wolf
L
LINUX DO - 最新话题
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More

博客园 - 大汪的数据之路

数据码农马年大吉 字符串分割并展开成表格的SQL实现方法 BI报表及可视化分析类工具使用经验总结(下) BI报表及可视化分析类工具使用经验总结(上) 基于Python实现自动化微信通知和预警 常用数据管理工具与平台汇总 OneID系统建设实践总结 网易有数BI使用总结 网易NDH大数据平台使用经验 版本管理总结 程序自动化vs人工手动处理 SQL开发总结 数据平台使用经验 数据团队运维值班任务简介 Python环境安装、管理与部署 windows获取kerberos认证 SQL动态长度行列转置 ODI Scenario 场景 Oracle KEEP 分析函数
Chat2DB测试体验
大汪的数据之路 · 2025-11-05 · via 博客园 - 大汪的数据之路

最近因为整理数据类的管理工具和平台,想起来上半年曾经测试使用过的Chat2db。这个工具最早就是因为博客园的推广看到的。上半年deepseek火了之后,大家都开始关注AI的应用了。作为数据工程师,首先想到就是AI在数据上的应用。在关注学习ChatBI类的工具时,偶然间发现了Chat2DB这个工具,于是就测试试用一下。

首先Chat2DB分为本地版和在线版。本地版可以连接公司测试环境的数据库,可以基于实际项目的数据做一些测试。下载安装比较简单,之后提示要输入激活码,否则只能试用14天。这个时间相对比较短,如果超过时间了,可以另外找一台机器下载安装测试了。

数据源接入这块,基本支持各类主流的数据库,测试了下Oracle,能正常连接。大数据这块,支持hive、impala引擎,还缺一个Spark的支持。连接好数据源之后,查看表、查看数据、写SQL等常规操作与其他数据库客户端基本差不多。以下是安装后,连上数据源,进行SQL编写的界面。

image

这个工具强调其是AI first,因此想必AI是其最大的特色。在SQL编辑器中,按下“/”键,可以随时调用打开自然语言输入浮动对话框,输入一段文本,即可生成想要的SQL。比如实际项目中经常遇到的,生成一段日期临时表。

image

生成完之后可以随时关闭浮动框,继续编写SQL代码。这个体验还基本流畅。

自然语言查询支持各类常用大模型,如Qwen、deepseek等,用户可以自行选择。除了生成一些通用的SQL外(如各类SQL函数),数据开发中最常见的就是基于库表写一些SQL查询。这块翻译生成效果的好坏主要依赖元数据是否完整准确,如表注释是否清晰,字段是否都加了注释。在AI类演示系统中一般都会选择业务简单,标签齐全的表,但是真实的系统中,一大半表可能都没有表注释,在这样的情况下,大模型生成的SQL往往是胡说八道。Chat2DB的自然语言对话框中输入@,可以指定库表中的表,这样就限制了SQL表的范围,一定程度上控制了大模型幻觉。

image

 除此之外,Chat2DB中还有一个AI数据集的概念。将数据源中的表添加至AI数据集,然后将该集合的表进行标准化的标注。这样后续用户在自然语言查询时,可以手动选择基于AI数据集进行SQL生成。这样一来,生成SQL的质量就很高了。看完介绍视频中提到这个功能,我眼睛一亮,于是就实操测试了下。AI数据集的创建还是比较清晰方便的,但是在AI对话时,怎么也找不到选择自定义AI数据集的入口,只能选择某个库表(离线版和在线版都找不到)。这个让我很奇怪,按说这么重要的功能不会只停留在宣传片中,希望下次有机会再实际测试一下这个功能。

另外一个特色功能就是AI辅助DDL/DML功能,Chat2DB将其称为Table Copilot功能。具体来说,在表结构管理页面中,用户可以通过自然语言描述各类DDL工作,比如增加一个字段***,将***字段长度扩展到***,删除字段等,Copilot收到后会翻译成SQL,然后返回给用户进行确认,若有必要,用户可进行手工微调,然后点击执行,进行表结构更新。因为现在数据库多达十来种,各类数据库的SQL方言又有些差异,比如字符串类型:有VARCHAR/VARCHAR2/STRING/TEXT等。通过自然语言方式进行交互,确确实实能提高数据开发工程师日常工作的效率,这块实测下来是完全可用的。

有一点不足,目前Copilot功能不支持自定义词根。在实际测试中发现经常同一个词根被翻译成不同的英文。比如证券,有时会被翻译成sec,有时会翻译成security,这样就很容易造成同一个库同一系列表出现不同的表名单词缩写,或者同一张表中同一系列字段出现不同的字段单词缩写。以下是实测中连续两次增加字段:

image

image

如果支持用户自定义上传词根,大模型在生成SQL时优先匹配词根,则可以控制表名字段名的命名规范,这个在大型多人合作开发项目中尤为重要。

其他功能就是可以快速对数据做一些展示,如折线图、柱状图等。这个其实就是BI的功能,我猜测既然主要定位是Chat,那么就不局限于DB了,跟数据相关的功能都可以包含进来了。

在线版和本地版页面基本一样,暂时还没看出其主要应用场景在哪里(可能只是给用户提供一个测试demo环境)。另外还有个本地化部署版,部署完成之后效果看着像是CloudQuery一样,作为一个后台各类数据库访问的统一的入口,这些与AI都不太沾边,就不测试了。

在AI使用限制方面,Local版本只能免费试用AI功能一年,每月3000次AI服务。因为AI服务大模型占用资源,按照调用次数或者token数量收费,这个也可以理解。在企业环境中,有些企业已经部署了本地大模型,如果Chat2DB可以开放入口,可以让用户选择企业自有大模型引擎,这样的话可能会有更多的企业受众。

整体来说,Chat2DB作为数据库客户端还是能满足数据库工程师日常的各种需求的,但是目前来看,还不足以吸引我放弃已经使用习惯的数据库客户端(如使用中的PLSQL develepor/DBeaver),可能不收费我就用了吧9b8eee25-1a52-49f9-becb-e9086c8f439a。希望其AI特色功能未来越来越好用,以后有机会会再试用一下。