惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

G
Google Developers Blog
Security Latest
Security Latest
Recent Announcements
Recent Announcements
腾讯CDC
C
Check Point Blog
A
About on SuperTechFans
H
Help Net Security
D
DataBreaches.Net
Martin Fowler
Martin Fowler
GbyAI
GbyAI
Y
Y Combinator Blog
The GitHub Blog
The GitHub Blog
阮一峰的网络日志
阮一峰的网络日志
李成银的技术随笔
M
Microsoft Research Blog - Microsoft Research
Blog — PlanetScale
Blog — PlanetScale
V
Visual Studio Blog
V
V2EX
人人都是产品经理
人人都是产品经理
云风的 BLOG
云风的 BLOG
F
Fortinet All Blogs
The Cloudflare Blog
月光博客
月光博客
S
Securelist
F
Future of Privacy Forum
Spread Privacy
Spread Privacy
Recorded Future
Recorded Future
博客园_首页
G
GRAHAM CLULEY
F
Full Disclosure
The Hacker News
The Hacker News
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
雷峰网
雷峰网
Recent Commits to openclaw:main
Recent Commits to openclaw:main
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
大猫的无限游戏
大猫的无限游戏
Google Online Security Blog
Google Online Security Blog
Google DeepMind News
Google DeepMind News
C
Cyber Attacks, Cyber Crime and Cyber Security
Microsoft Security Blog
Microsoft Security Blog
Cyberwarzone
Cyberwarzone
NISL@THU
NISL@THU
C
Cybersecurity and Infrastructure Security Agency CISA
B
Blog
L
Lohrmann on Cybersecurity
罗磊的独立博客
T
Threat Research - Cisco Blogs
www.infosecurity-magazine.com
www.infosecurity-magazine.com
B
Blog RSS Feed
D
Docker

V2EX

暂无文章

ChatGPT Operator 好用吗?
iYume · 2025-02-11 · via V2EX

目前在调研 browser-use 框架,一个基于 langchain + function calling 的浏览器 agent 框架。 最近使用下来,需要自定义配置的地方特别多,问题也比较多:

  1. 网站需要适配特殊的定位器,select dropdown 、modal 等很多组件需要自己写函数
  2. 幻觉问题,agent 经常以为自己已经执行完了某个动作,但实际上并没完成
  3. 动作执行不规范,比如 select dropdown 有时候非要给你拆分成两次 click

我使用的模型是 deepseek-v3 ,上述问题用 system prompt 也不一定能解决,执行起来非常不稳定。 此外,感觉 browser-use 本身框架也存在一些缺陷,比如 selector map 更新的问题等。

但是像 ChatGPT Operator 这种都给你封装好了,是不是只能接入一些主流网站,有没有 Pro 用户讲讲好不好用?或者给点这方面相关的意见也行。