Snowflake AI 指南：如何在提升开发效率的同时降低 Token 成本｜技术实践

InfoQ - 促进软件开发领域知识与创新的传播

Meta 收购 Manus 这事儿泡汤了 5.5万 Star 开源项目 Ghostty 被迫出走，GitHub 正在终结一代技术人的乌托邦 Slack 长时运行多智能体系统的上下文管理方案从 T+1 到分钟级：金城银行基于 Apache Doris 构建高可靠、强一致的实时数据平台谷歌云推出 Agents CLI，简化 AI 智能体开发全流程 Claude官方击穿高薪、高学历的安全防线！Anthropic点名10大高危职业，但有群人暂时稳了亚马逊云科技终止 WorkMail 服务，并将 App Runner 转入维护模式 OPPO小布记忆：全模态碎片化内容的理解与智能整理实践｜AICon上海模力工场038周AI应用周榜：工具在消失，工作流在出现 Akamai CEO Tom Leighton：Agent 时代来临，云基础设施正从“中心化”转向“分布式边缘” 日均数百亿入库背后：从“人肉调度”到K8s弹性架构，度小满金融基于OceanBase重构入库架构实践百度文库网盘发布GenFlow 4.0：月活用户超1亿，要把网盘变成全端AI工作台 Altman 投的 Agent 终端 Warp 开源了！斩获3.5万star 哪些客户需要拒, 敢让龙虾决定吗?_AI&大模型_InfoQ 中文站_InfoQ精选视频从开发到生产：为什么越来越多的机器学习团队纷纷迁移到 Snowflake ｜ BUILD 2025_AI&大模型_王玮_InfoQ精选视频探索多智能体工作流：LangGraph Snowflake Cortex AI ｜ BUILD 2025_AI&大模型_王玮_InfoQ精选视频腾讯云分布式缓存数据库：AI Agent - 从提示词工程到 Harness 工程 | 腾讯云数据库 DBTalk_腾讯_凌敏_InfoQ精选视频基于 Streamlit 为 CSV 数据构建分析智能体｜ BUILD 2025_AI&大模型_王玮_InfoQ精选视频 AI 智能体：告别文档缺漏｜ BUILD 2025_AI&大模型_王玮_InfoQ精选视频构建 AI 驱动的数据管道：深度探讨 Snowflake Openflow 与非结构化数据 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频云端太贵、本地不够聪明，英特尔押注“端云混合AI”：智能体PC会替人完成工作不到10%的存储投入，可能拖垮90%的GPU投资！IBM把AI Agent塞进存储系统，算清企业最容易忽略的一笔账 Snowpark 上手实战｜ BUILD 2025_大数据_王玮_InfoQ精选视频 ClickHouse + Langfuse，构建 Agent 可观测基石腾讯云分布式缓存数据库：Cluster Proxy 共享连接架构深度解析 | 腾讯云数据库 DBTalk_腾讯_凌敏_InfoQ精选视频 AI 写代码太烧钱了：Copilot、Claude 一起涨价，不如把程序员请回来？英特尔发布至强600系列工作站处理器与锐炫Pro B70 GPU，全新AI工作站来了腾讯云分布式缓存数据库：从 Redis 到 Valkey - 开源社区如何快速创新 | 腾讯云数据库 DBTalk_腾讯_凌敏_InfoQ精选视频印奇这次要“从0重做”智驾模型！首谈阶跃和千里双公司布局：中国AI商业闭环要靠车跑出来从Cursor返聘归来，90后华裔女高管带Claude开启日更模式：token成本比工程师工资低多了！从 Coding 到 Agent：QCon 北京 2026 全景复盘，优秀出品人 & 明星讲师名单揭晓全链路支撑大模型国产化“Day 0适配”，商汤大装置构建全栈能力底座凌晨，OpenAI 与亚马逊云科技史上最大联合发布来了 HashiCorp Vault 2.0 发布：引入新身份联邦机制，迈入 IBM 生命周期体系 Yelp 实现超 1,000 个 Cassandra 节点零停机升级写了 17 年开源代码，我为什么认为 Coding Agents 堆功能是在瞎折腾？基于 Apache Camel 编排智能体与多模态 AI 管道面向智能体与人类用户的AI记忆系统：架构设计与核心场景实践｜AICon上海 Anthropic 推出 Managed Agents，简化 AI 代理部署流程阿里HappyHorse开启灰测，720P视频生成低至0.44元/秒讯飞联合清华团队押注量子AI：不看营收、不设KPI，一群“无人区”科学家，抢夺下代AI算力入口小米万亿模型全面开源：MIT 协议、1M 上下文，但还是打不过 DeepSeek Cortex Code 入门指南：面向数据工程师的实践路径｜技术实践 openJiuwen社区首发Team Skills，定义Coordination Engineering新范式用 Snowflake Cortex Agents 释放结构化数据的最大价值｜技术实践 Grafana 利用 Kafka 对 Loki 进行了架构重构，并发布了一款命令行工具，旨在将可观测性引入编码代理 ClickHouse重构全文索引：对象存储上跑出高性能 Full-Text Search 可观测性和遥测技术如何提升软件工程实践 Dropbox 与 GitHub 合作，将单体库大小从 87GB 缩减至 20GB Agent 的下一站：基于长期记忆系统 EverOS 的自我演进｜AICon上海同一赛道，四种收费：Agent 控制层（Harness）开始分裂 Cloudflare Sandboxes 正式发布，为 AI 代理提供持久化隔离环境 Agent 的“记忆断片”困局，该怎么破？_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选视频数据分析师如何快速建立在 AI 时代最值钱的能力：一份可落地的行动路线图摩尔线程最新财报：研发占比超86%，万卡级大规模智算集群落地当云区域失效：地缘动荡环境下的高可用重构 Slack 重构通知系统，设置参与度提升 5 倍智能体工程的隐性技术债务 “我把所有模型都换成了DeepSeek V4”：月账单将降 90%，效果还更好阿里云智能集团高级技术专家刘少伟已确认出席AICon上海站，并分享如何构建企业 Agent 的自动化行动架构构建生产就绪的 tRPC API：Apollo Federation 的 TypeScript 替代方案 Anthropic推出面向Claude Code的基于智能体的代码审查功能北京车展直击：斑马智能甩出车载Agent短剧，比亚迪率先落地，AI让智能座舱又热起来了 Snowflake 作为智能体运行时：从静态管道迈向自主数据系统｜技术实践 Snowflake 上的本体体系：基于 Cortex Code 能力实现从架构到部署｜技术实践 Cloudflare 公布 MCP 架构方案，应对企业面临的安全与治理风险复杂的项目管理怎么做到「AI 友好」？飞书项目用「开放」给出答案 Snowflake Cortex Code 的规范驱动开发：将 SDLC 方法论引入 AI 辅助工作流｜技术实践 Copilot 不让注册了：从“随便用”到“全面限”，agent 把原有订价模型顶穿了当互联网用AI卷效率时，这家公司先问了一连串“能不能” Meta 开始记录员工每一次点击：AI 要接管工作，先监控会工作的人 Meta“Token榜”逼疯打工人，一夜烧掉公司几万刀！AI时代Token焦虑越来越离谱智源FlagOS完成DeepSeek-V4-Flash在八款芯片Day0适配，实现三重技术突破 DeepSeek V4 重磅开源！首次打通华为Ascend，也没丢掉英伟达，百万上下文夺回国产模型话语权李志飞的“新实验”：当超级个体撞上真实组织 GPT-5.5 登顶时刻，Anthropic 亲口承认 Claude 变笨了！网友群嘲：太敷衍那些没空写的小需求，龙虾真能做吗？_AI&大模型_InfoQ 中文站_InfoQ精选视频从 Pandas 到生产：使用任意 IDE 进行可扩展的 ML 数据管道与分布式处理｜ BUILD 2025_AI&大模型_王玮_InfoQ精选视频 pnpm 11 候选版本发布，带来 ESM 分发、供应链默认设置以及新的存储格式银行业PDF表格提取方案重构：基于Java的分层方案 GPT-5.5 赢了 Opus 4.7 和 Mythos？奥特曼晒黄仁勋内部信：英伟达全员用上 Codex！ Cloudflare 推出 Think：一款面向 AI 代理的持久化运行时 1850亿美元天价支出、75%代码由AI生成！谷歌正式宣告：全面转向智能体工作流 xAI落后太多，马斯克“开大”重金求购Cursor，100亿美金“分手费”都敢签！ Pulumi 新增对 Bun 运行时的全面支持姚顺雨腾讯模型首秀！不卷参数只做 “听话打工人”，Hy3 preview登场 | 附实测老板让你“忽悠”投资人，你敢发给龙虾吗？_AI&大模型_InfoQ 中文站_InfoQ精选视频 Gemini CLI 引入子代理机制，实现任务委派与并行代理工作流清华系团队星工聚将完成数千万天使轮融资，轮式机器人拿下头部制造企业亿级大单 Pretext.js 绕过 DOM 布局重排，实现 120 FPS 的高级交互体验靠“AI 云”爆红的 Vercel，栽在一个第三方AI工具手里！IPO前夕遭黑，200万美元赎金谈崩？高能研讨会｜端侧 AI 正在重写实时感知效率上限_AI&大模型_王玮_InfoQ精选视频 2050大会看这篇就够了｜报名、交通食宿指引大全 Java 近期资讯：OpenJDK JEP、Jakarta EE 12、Spring Framework、Micrometer、Camel、JBang 金融智能的架构编排：基于 Snowflake Cortex Agents 实现结构化与非结构化数据统一分析｜技术实践在AK大神爆火的任务里，摸清国产AI真实水平百灵Ling-2.6-flash 正式发布：高 Token 效率，以 1/10 消耗实现 SOTA 级 Agent 能力当 PM 懂AI，当技术懂产品：AI 时代产品力的双向进化｜PM x AI产品力领航者大会即将开幕为 AI 智能体设计记忆机制：揭秘 LinkedIn 的认知记忆智能体获奖名单公布｜2026主题征文第一期｜分享你最有价值的龙虾场景与核心 Skill_热门活动_InfoQ写作社区官方_InfoQ写作社区

Eylon Steiner王玮张琰梓 · 2026-05-26 · via InfoQ - 促进软件开发领域知识与创新的传播

2026 年，智能体将在企业级应用中取得哪些实质性突破？点击下载《2026 年 AI 与数据发展预测》白皮书，获悉专家一手前瞻，抢先拥抱新的工作方式！

Snowflake 世界中的数据工程正在经历一场重大变化。如今，越来越多的工作不再完全依赖手动完成，而是由 AI 工具辅助推进。这些工具正在出现在各个地方——IDE、命令行，以及 Snowflake 的 Web UI（Snowsight）中。对于今天的 Snowflake 数据工程师来说，工作不再只是移动数据。它更多关乎在 AI 的帮助下，构建可靠、管理良好且成本高效的系统。本文将探讨这种新工作方式的三个主要部分：使用 Cursor 和 GitHub Copilot 进行 Terraform 开发，使用 Cortex Code CLI 打通本地与云端环境，以及使用 Snowflake Cortex UI 直接在 Snowflake 内提升工作效率。

为什么 Snowflake 专业能力比以往任何时候都更加关键

将初级开发者与 Snowflake 专家结合起来，可以形成一个强大的反馈循环，在快速执行与架构完整性之间取得平衡。初级工程师可以使用 AI 快速起草管道或 Snowflake 专用 SQL，而专家则提供必要的治理层，对代码进行审计，确保其符合计算效率、安全数据共享和最佳聚类等最佳实践。这种以指导为核心的审计流程，不仅能捕捉“幻觉”代码或次优查询；它还像一个实时课堂，让初级工程师学习 Snowflake Data Cloud 的细微之处，例如管理 Warehouse credit 消耗以及利用 Dynamic Tables。最终，这种协作确保由初级工程师主导、AI 辅助的开发速度，永远不会以造成臃肿、难以管理或不安全的数据环境为代价。

掌握基础设施即代码：使用 Cursor 和 GitHub Copilot 进行 Terraform 开发

Snowflake 多层架构的管理——包括数据库、warehouse、基于角色的访问控制和网络策略——越来越多地通过 Terraform 完成，以确保可复现性和版本控制。然而，Snowflake Terraform provider 的复杂性，以及 HashiCorp Configuration Language（HCL）固有的冗长性，都会带来显著开销。Cursor 和 GitHub Copilot 等 AI 助手已经成为降低这种复杂性的关键工具，但要有效应用它们，需要对其设置方式以及基础设施任务所需的特定提示工程有细致理解。

架构设置与环境配置

对于数据工程师来说，第一步是根据所需的项目级感知能力选择合适的助手。GitHub Copilot 在行内代码补全和通用 SQL 辅助方面非常有效，但与更集成化的工具相比，它对更广泛工作区上下文的理解可能有限——尤其是在跨多个文件进行复杂 Terraform 重构时。Cursor 是一款基于 VS Code、内置 AI 能力的编辑器，它通过索引代码库并支持跨文件推理，提供更深入的项目感知能力。这使它能够更好地理解关系。

要建立生产级环境，工程师必须安装 HashiCorp Terraform 扩展，并配置 Snowflake provider。项目布局对 AI 效能至关重要；模块化结构允许 AI 解析更小、逻辑上分离的代码块，从而降低上下文窗口耗尽的可能性。

推荐配置

需要注意的一个关键细节是，Snowflake Terraform provider 遵循语义化版本控制，而主要版本发布（例如 2.0.0 及之后版本）对资源 schema 引入了重大破坏性变更。在向 AI 提示之前，确保 providers.tf 中的 required_providers 块被准确定义，是最重要的“须知事项”，因为这可以防止助手生成与旧版、不受支持的 provider 兼容的代码。

面向 Terraform 工作流的高级提示工程

为 Terraform 编写有效提示，与为 Python 或 SQL 编写提示有根本不同。目标通常是转换现有状态，或生成复杂、相互依赖的资源层级结构。数据工程师应避免使用“创建一个 Snowflake 数据库”这类通用提示，而应专注于上下文重构和以安全为中心的模式。

一个高价值工作流是消除硬编码值，也就是“魔法数字”。当工程师发现 CIDR 块、warehouse 大小或保留期限散落在代码各处时，可以通过有针对性的提示来自动完成清理。像这样的提示：“Analyze all .tf files in this workspace. Identify every hard-coded value for warehouse_size, data_retention_time_in_days, and comment. Extract these into variables in variables.tf with appropriate descriptions, and update the original resources to use these variables. Ensure terraform validate would pass after these changes,” 可以利用助手的多文件编辑能力执行全面重构。

通过提示进行安全审计同样重要。数据工程师可以利用 Cursor 的工作区感知能力，扫描权限过于宽泛的 grant。一个有效提示可能是：“Scan our Terraform configurations for any usage of the ACCOUNTADMIN role or any grant that applies ALL PRIVILEGES to the PUBLIC role. Suggest more restrictive alternatives using custom functional roles and generate the necessary snowflake_role and snowflake_grant_privileges_to_role resource blocks”。这种方法通过在误配置真正应用到 Snowflake 环境之前识别它们，将安全“左移”。

对 Terraform plan 的解读，或许是这些助手最复杂的使用方式。大型 plan notoriously 难以手动审查。通过将 plan 输出为 JSON——terraform plan -out=plan.tfplan && terraform show -json plan.tfplan > plan.json——工程师可以将该文件提供给 AI，并使用提示：“Act as a Senior DevOps Engineer. Analyze this plan JSON. List every resource marked for destruction or replacement. For each, identify the specific attribute change triggering the replacement and suggest if a create_before_destroy lifecycle block is necessary to avoid downtime”。

“架构师警告”：谨慎处理

虽然 AI 是一个巨大的力量倍增器，但它不能替代你的工程判断。项目开头的一个“幻觉”提示，可能会把结构性缺陷嵌入到整个代码库中。

在你发布到生产环境之前，请记住以下三条规则：

Experiment First：使用“沙箱”或一个虚拟 Snowflake worksheet 来测试 AI 生成的逻辑，然后再将其集成到主仓库中；
The Human Overlook：永远不要“盲目复制”代码。AI 偶尔可能会建议已弃用的 Snowflake 语法或低效的 join 模式，从而导致你的 credit 消耗飙升；
The Terraform Safety Net：如果你使用 AI 生成 HCL，请务必先运行 terraform plan。确保 AI 没有幻觉出资源删除操作，或者——但愿不会——决定启动一个 4XL Warehouse 来在你的账户里“复制自己”。

信任，但要验证。你的 Snowflake credits（以及你的睡眠时间表）都会感谢你。

用 AI agent 编写优秀的 Terraform 代码，不只是关于第一版草稿；它关乎你的意图与 agent 执行之间反复迭代的“握手”。

一旦你的 AI agent 提供了初始代码块，请按照以下步骤，从“建议的”脚本推进到生产就绪的基础设施：

💡 寻求优化：不要满足于第一版草稿。让 agent 就模块化、变量使用和命名约定提出改进建议，确保代码“干净”且可扩展；

🛡️ 审计安全性与 Bug：明确提示 agent 查找初始生成中可能遗漏的 bug、逻辑错误或安全漏洞——例如权限过于宽泛的安全组。即使在第二次或第三次迭代中，Copilot 仍然可能识别出它此前遗漏的 bug；

📝 自动化文档：通过让 agent 编写完整的 README 文件，并创建解释架构选择和资源依赖关系的设计文档来节省时间；

🤖 强制执行本地标准：切换到 CLI，运行 terraform validate 和 terraform fmt。这可以确保 AI 生成的代码在语法上正确，并遵循标准 HCL 风格；

🔍 验证意图：设计确定后，运行 terraform plan，并仔细审查输出，确保拟议的基础设施变更与你的预期设计完全一致，然后再执行 apply。

IDE 中的战略性 Token 节省

虽然许多 IDE 助手采用固定月订阅模式，但 Token 效率对于保持低延迟，以及确保模型处在其有效上下文窗口内仍然至关重要。输入上下文中过多的噪声会导致准确性下降。为了节省 Token，工程师应实施若干最佳实践：

第一是使用选择性索引和 .cursorrules。在 Cursor 中，可以定义规则，指示模型忽略大型无关目录，例如 .terraform/ 或大量日志文件。这确保模型的“注意力”纯粹集中在 HCL 源代码上。此外，工程师应使用“选择性上下文”：在发起聊天之前，只高亮相关代码块，而不是每次都发送整个文件。这可以减少 LLM 推理中的 prefill 阶段，也就是模型在生成响应之前处理输入提示的阶段。

另一种节省 Token 的机制是使用本地“记忆”或持久化指令。通过定义全局风格指南，例如“始终使用小写 Snowflake 对象名称”或“资源循环中优先使用 for_each 而不是 count”，工程师无需在每个单独提示中重复这些约束。这会缩短每次交互的长度，并确保模型更频繁地实现“一次成功”。

Cortex Code CLI：改变本地开发体验

Snowflake Cortex Code 命令行界面（CLI）是一种范式转变工具，它弥合了本地终端与 Snowflake AI Data Cloud 之间的差距。不同于执行固定命令的传统 CLI 工具，Cortex Code CLI 充当一个 Agentic shell，能够理解数据工程师的意图、规划多步操作，并与本地文件和云端 Snowflake 对象交互。

安装与多平台支持

Snowflake 最近扩展了 Cortex Code CLI，使其在既有 macOS 和 Linux 支持之外，也支持原生 Windows 环境。对于在多样化技术环境中运行的企业数据团队而言，这一扩展至关重要。

macOS / Linux

curl -LsShttps://ai.snowflake.com/static/cc-scripts/install.sh| sh~/.local/bin/cortex

Windows（原生）

irmhttps://ai.snowflake.com/static/cc-scripts/install.ps1| iex%LOCALAPPDATA%\cortex\cortex.exe

安装之后，首要“须知事项”是它与现有 connections.toml 文件的集成。如果工程师已经在使用标准 Snowflake CLI（snow），Cortex Code CLI 可以无缝继承这些连接定义。这避免了重复凭据管理带来的安全风险。在身份验证方面，CLI 支持面向交互式会话的基于浏览器的 SSO，以及面向需要严格角色绑定场景的 Programmatic Access Tokens（PAT），例如 CI/CD 管道。

与 dbt 和 Apache Airflow 的 Agentic 集成

对于数据工程师来说，Cortex Code CLI 的真正力量在于它对现代数据系统模式的深度理解，尤其是 dbt 和 Apache Airflow。CLI 可以自动完成这些项目的“样板”设置，同时遵循现有连接配置文件，例如 ~/.dbt/profiles.yml。

对于 dbt 开发者，CLI 可用于搭建完整的转换层。像这样的提示：“Explore the raw source tables in the BRONZE schema. Propose and create a set of staging models in dbt that clean and standardize these tables, adding not_null and uniqueness tests to all inferred primary keys,” 允许 CLI 通过 Snowflake SQL 调用执行 schema discovery，然后在本地生成对应的 .sql 和 .yml 文件。这将传统上需要数小时手动完成的任务，压缩成一次具备上下文感知能力的对话。

Airflow 集成同样具有变革性。数据工程工作流经常因为跨工具依赖而失败——例如某个 DAG 任务失败，是因为 Snowflake warehouse 被暂停，或某个 dbt 模型没有填充数据。Cortex Code CLI 可以监控 DAG 健康状态，通过 cortex airflow runs trigger 触发运行，并分析任务日志，以自然语言提供根因分析。它允许工程师提出这样的问题：“Trace the upstream dependencies of the failed daily_sales task and identify if the issue lies in the raw data arrival or a warehouse timeout,” 从而提供数据管道的端到端视图。

运营安全：规划与信任模型

由于 Cortex Code CLI 可以执行 shell 命令并编写 SQL，因此它包含一个基于风险级别的复杂安全架构。这是工程师必须掌握的最关键运营细节，以避免在生产环境中意外执行破坏性操作。

Cortex CLI 的风险

CLI 提供三种交互模式来管理这种风险：Confirm（默认模式，在危险操作前提示）、Plan（通过 /plan 启用，会在采取任何步骤之前显示完整执行序列）以及 Bypass（自动批准所有调用，通常不建议在生产环境中使用）。对于复杂的数据工程任务，从 /plan 开始是一项最佳实践，因为它允许工程师在 AI 修改任何本地文件或 Snowflake 对象之前，先审查其推理。

优化 CLI 中的 Token 使用与性能

CLI 中的 Token 成本由提示的复杂度和长度，以及为任务选择的模型决定。Claude 4.6 和 GPT 5.2 等前沿模型提供最高质量，但会消耗更多 credits。为了最大限度降低支出，工程师应采用以下策略：

战略性会话管理至关重要。CLI 中的每次对话都会自动保存，历史记录会作为上下文传递到后续回合。在长时间运行的会话中，每个回合的输入 Token 会显著增长。使用 /new 为不同任务启动全新会话，或使用 /rewind 回滚到错误转向之前的某个点，可以在一天的工作中节省数千个 Token。

此外，CLI 允许通过 RunSubagent 工具使用 “Subagents”。工程师不必让一个模型在同一上下文中处理研究、编码和测试，而是可以指示 CLI 启动一个特定子 agent——例如用于代码库研究的 Explore——来处理专门的子任务。这种模块化方法可以保持单个上下文窗口精简，并减少与通用规划相关的“Token 膨胀”。

Snowflake Cortex UI：在 Snowsight 中最大化平台内速度

IDE 和 CLI 面向开发者工作流，而直接集成到 Snowsight 界面中的 Snowflake Cortex UI，则旨在与 Snowflake Data Cloud 进行即时、高保真交互。这个持久化 AI 编码 agent 完全感知用户的活动工作区、UI 位置和数据目录，因此它是用于临时 SQL 开发和管理任务的、上下文最丰富的助手。

设置与可访问性功能

在 Snowsight 中访问 Cortex Code 几乎是即时的。它不需要本地安装；工程师只需在 Worksheet 或 Workspace 右下角选择 Cortex Code 图标。最关键的前提条件是分配 SNOWFLAKE.CORTEX_USER 数据库角色，该角色默认授予 PUBLIC 角色，但可能会受到组织策略限制。

Snowsight 中的 Cortex Code 深度集成到 Snowflake Intelligence 的 “agentic” 工作流中。这意味着它不只是建议代码；它使用编排来规划并执行数据探索、PII 识别和成本分析等任务。一个“重要须知”是，Snowflake 最近统一了其 AI 界面，弃用了旧版 Snowflake Copilot，转而采用能力更强的 Cortex Code agent。

加速 SQL 开发与管理工作流

Snowsight 助手擅长将自然语言转换为生产就绪的 SQL，并提供对建议变更的可视化审查。当工程师高亮一段 SQL 并请求优化时，助手会提供 “Diff View”，以便在任何更改应用到 worksheet 之前，清晰比较插入和删除内容。

对于管理任务，助手可以提供此前隐藏在复杂 ACCOUNT_USAGE 查询背后的洞察。工程师可以提示：“Show me a trend of warehouse credit consumption for the MARKETING_WH over the last 30 days and identify any queries that consumed more than 10 credits individually,” 或 “Explain the purpose of the views in the SNOWFLAKE.ACCOUNT_USAGE schema and how they relate to query history”。这种能力将助手转变为一个始终可用的虚拟 “DBA partner”。

数据工程师还可以使用助手生成用于测试的合成数据。像这样的提示：“Create a table named TEST_TRANSACTIONS with 100,000 rows. Include columns for TRANSACTION_ID, AMOUNT, MERCHANT_CATEGORY, and IS_FRAUDULENT. Ensure that ~0.5% of the rows are marked as fraudulent and that their amounts are statistically significantly higher than the average,” 可以在不暴露敏感生产数据的情况下快速创建测试环境。

Snowsight 中的高级提示技巧

为了在 UI 中实现高准确率，工程师必须将模型“锚定”到自己的具体 schema 中。最有效的做法是使用 @ 符号搜索并在提示中包含特定数据库、schema、表或视图。这会为助手提供生成可执行代码所需的精确元数据、列名和数据类型。例如，像 “Query the top 10 customers by revenue using @CUSTOMER_STAGING and @ORDERS_MART” 这样的提示，可以确保模型不会幻觉出对象名称。

此外，助手支持跨会话持久存在的 “Custom Instructions”。这里非常适合存储组织标准，例如“在表定义中始终包含 CREATED_AT 时间戳”或“在复杂 join 中使用 common table expressions（CTEs）以提升可读性”。通过将这些要求移到自定义指令中，工程师可以降低每个提示的复杂度，并确保整个团队的代码质量一致。

在 UI 中节省 Token 并管理 AI 消耗

在 Snowsight 中管理 Token 使用，是提示设计与利用平台内置可观测性功能之间的平衡。与 Cortex Code 助手的每次交互都基于 Token 消耗计费，并通过CORTEX_AI_FUNCTIONS_USAGE_HISTORY 视图进行跟踪。

一种节省 Token 的关键策略是 worksheet 级会话管理。由于每个聊天会话都与特定 worksheet 关联，工程师可以将不同任务拆分到不同 worksheet 中。这可以防止模型不得不处理冗长且无关的历史对话回合，从而尽可能降低输入 Token 数量。此外，如果某个响应不令人满意，使用“thumbs down”按钮可以提供反馈，帮助优化未来生成结果，并可能通过更少回合到达正确解决方案来节省 Token。

工程师还应使用 AI_COUNT_TOKENS 函数对提示进行基准测试。通过测试标准 “staging model” 提示与 “incremental logic” 提示的 Token 数量，团队可以开发只提供必要上下文的“精简”模板。随着组织内 AI 工作负载不断扩展，这种主动式 FinOps 方法至关重要。

AI Data Cloud 中的战略性成本管理与治理

随着组织向 AI 原生数据工程转型，基于 Token 的成本管理和 AI 模型治理成为关键架构问题。Snowflake 引入了技术创新和管理控制，以确保 AI 的采用既具备高性能，又具备财务可持续性。

技术优化：Prefill 与 Decode 阶段

理解 LLM 推理的工作方式，是优化的第一步。推理主要发生在两个阶段：prefill 阶段和 decode 阶段。在 prefill 阶段，系统处理用户输入提示并将其转换为 Token；这正是“提示膨胀”成本最高的地方。在 decode 阶段，模型逐个 Token 生成响应。

Snowflake 的 SwiftKV 技术专门优化 prefill 阶段。通过复用早期 transformer 层的“隐藏状态”，为后续层生成 KV（Key-Value）缓存，SwiftKV 消除了冗余计算。对于数据工程师来说，这意味着 Llama 3.3 和 Llama 3.1-405B 等模型可以处理大型上下文窗口——例如向 AI 提供庞大的 DDL schema——同时推理成本最高可降低 75%，并使 “time to first token” 加快 50%。

通过 Account Usage 视图实现可观测性与 FinOps

为了管理 AI 支出的“不可预测”性质，Snowflake 通过 Account Usage 视图提供全面遥测。这些视图将使用数据聚合到一小时窗口中，使工程师能够按模型、用户和查询跟踪消耗。

跟踪 AI 成本

工程师可以通过查询这些视图，使用 Streamlit in Snowflake（SiS）构建交互式监控仪表板。仪表板可以可视化输入与输出 Token 之间的比例，帮助团队识别提示是否过于冗长（高输入），或模型是否被要求生成过长响应（高输出）。这种粒度对于 chargeback 报告和容量规划至关重要。

实施按用户和按账户的支出限制

为防止未优化提示或失控查询导致“预算危机”，管理员可以实施多层级成本控制。Snowflake 允许在账户和单个用户级别配置每日 credit 限制。

-- Set an account-wide daily limit of 20 credits for the Cortex Code CLIALTER ACCOUNT SET CORTEX_CODE_CLI_DAILY_EST_CREDIT_LIMIT_PER_USER = 20;-- Set a per-user override for a lead data engineer needing more capacityALTER USER senior_engineer SET CORTEX_CODE_CLI_DAILY_EST_CREDIT_LIMIT_PER_USER = 50;-- Block your boss's access to the CLI while allowing Snowsight access ALTER USER boss SET CORTEX_CODE_CLI_DAILY_EST_CREDIT_LIMIT_PER_USER = 0;ALTER USER senior_analyst SET CORTEX_CODE_SNOWSIGHT_DAILY_EST_CREDIT_LIMIT_PER_USER;

复制代码

当用户达到其每日限制时，对该特定使用界面（CLI 或 Snowsight）的访问将在滚动 24 小时窗口内被阻止。对于更高层级的控制，工程师可以实施自动告警。可以配置一个每小时运行的 task，检查 CORTEX_AI_FUNCTIONS_USAGE_HISTORY，并在账户总支出超过月度阈值（例如 1000 credits）时发送电子邮件通知。

治理与安全最佳实践

AI Data Cloud 中最重要的安全原则，是遵循 Role-Based Access Control（RBAC）。Cortex Code 及相关 CLI 工具会遵守当前活动 Snowflake 角色的权限。数据工程师绝不应使用 ACCOUNTADMIN 角色进行日常开发；相反，他们应使用 DEVELOPER_ROLE 或 ANALYST_ROLE 等功能角色，确保 AI 只能访问当前任务所需的数据。

在托管型企业环境中，组织可以向用户工作站部署系统级 managed-settings.json 文件。该文件可以强制执行单个用户无法覆盖的策略，例如将工具访问限制在某个模式 “allowlist” 中、强制最低 CLI 版本，或完全禁用 “Bypass” 模式。这确保即使单个工程师使用 AI 加速工作，组织仍能保持一致且安全的运营姿态。

结论：编排数据工程的未来

Cursor、Cortex Code CLI 和 Snowflake Cortex UI 的集成，不仅仅代表一组生产力工具；它标志着数据工程实践方式的根本转变。通过从手动编码模式转向智能编排模式，工程师可以弥合复杂基础设施需求与快速数据交付需求之间的差距。无论是通过 Cursor 面向 Terraform 的多文件重构能力、Cortex Code CLI 提供的无缝本地到云端桥接，还是 Snowsight 助手具备上下文感知能力的高速度，AI 增强型工程师都能够构建更具韧性、治理更完善且成本更高效的系统。

在这个新时代取得成功，需要秉持 “FinOps for AI” 思维——主动管理 Token 消耗、利用技术优化，并通过 RBAC 和托管设置实施强健治理。随着 Snowflake 持续演进为一个“Snowflake 专业能力成为始终在线能力”的平台，数据工程师的角色将越来越聚焦于对这些 Agentic 系统进行战略性编排，以大规模交付可信的企业智能。

如需持续了解更多 Snowflake 相关文章，请在我的 Medium 主页关注我：Eylon’s Snowflake Articles。

我是 Eylon Steiner，Infostrux Solutions 工程经理，也是 Snowflake Data Superhero。你可以在 LinkedIn 上关注我。

订阅 Infostrux Medium Blog：https://blog.infostrux.com，获取最有趣的数据工程和 Snowflake 新闻。通过 GitHub 关注 Infostrux 的开源工作。

原文地址：https://medium.com/snowflake/the-snowflake-ai-guide-how-to-boost-developer-output-by-50-while-cutting-token-costs-in-half-d7572d0c0649

点击链接立即报名注册：Ascent - Snowflake Platform Training - China，更多 Snowflake 精彩活动请关注专区。

此内容由惯性聚合(RSS阅读器)自动聚合整理，仅供阅读参考。原文来自 — 版权归原作者所有。

推荐订阅源

InfoQ - 促进软件开发领域知识与创新的传播

为什么 Snowflake 专业能力比以往任何时候都更加关键

掌握基础设施即代码：使用 Cursor 和 GitHub Copilot 进行 Terraform 开发

架构设置与环境配置

面向 Terraform 工作流的高级提示工程

“架构师警告”：谨慎处理

IDE 中的战略性 Token 节省

Cortex Code CLI：改变本地开发体验

安装与多平台支持

与 dbt 和 Apache Airflow 的 Agentic 集成

运营安全：规划与信任模型

优化 CLI 中的 Token 使用与性能

Snowflake Cortex UI：在 Snowsight 中最大化平台内速度

设置与可访问性功能

加速 SQL 开发与管理工作流

Snowsight 中的高级提示技巧

在 UI 中节省 Token 并管理 AI 消耗

AI Data Cloud 中的战略性成本管理与治理

技术优化：Prefill 与 Decode 阶段

通过 Account Usage 视图实现可观测性与 FinOps

实施按用户和按账户的支出限制

治理与安全最佳实践

结论：编排数据工程的未来

更多