惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

SecWiki News
SecWiki News
I
InfoQ
The Cloudflare Blog
人人都是产品经理
人人都是产品经理
博客园 - Franky
T
Tailwind CSS Blog
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
量子位
博客园_首页
罗磊的独立博客
V
V2EX
李成银的技术随笔
大猫的无限游戏
大猫的无限游戏
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
T
True Tiger Recordings
Vercel News
Vercel News
Cyberwarzone
Cyberwarzone
Cisco Talos Blog
Cisco Talos Blog
F
Fox-IT International blog
D
Darknet – Hacking Tools, Hacker News & Cyber Security
M
Microsoft Research Blog - Microsoft Research
Know Your Adversary
Know Your Adversary
爱范儿
爱范儿
The Register - Security
The Register - Security
G
Google Developers Blog
The Hacker News
The Hacker News
Malwarebytes
Malwarebytes
S
Securelist
博客园 - 三生石上(FineUI控件)
Jina AI
Jina AI
T
Threat Research - Cisco Blogs
T
The Exploit Database - CXSecurity.com
S
SegmentFault 最新的问题
博客园 - 叶小钗
F
Fortinet All Blogs
Apple Machine Learning Research
Apple Machine Learning Research
宝玉的分享
宝玉的分享
博客园 - 聂微东
T
Threatpost
博客园 - 【当耐特】
D
Docker
P
Privacy & Cybersecurity Law Blog
www.infosecurity-magazine.com
www.infosecurity-magazine.com
G
GRAHAM CLULEY
V
Visual Studio Blog
C
Cisco Blogs
IT之家
IT之家
S
Security Archives - TechRepublic
Latest news
Latest news
阮一峰的网络日志
阮一峰的网络日志

Benson's blog

Enjoy life Internship AI on academic research How AI Will Change the Mobile Ecosystem Look ahead Goodbye 2025 Hacker News to Kindle Another project How to imporve english Introduction of Fraud detection PopTranslate Last day in netease Better idea between Copilot-typed and CLI-typed assistant Gemini-cli LLM Post-Training experience Papers I readed recently about LLM application Difference between LLMs and traditional computer technology GRPO Weekly-#26 AI Application Weekly-#25 AI infra and application Weekly-#24 First week as LLM inference engineer Weekly-#23 seeking job Weekly-#22 2025 New Year AutoSwitch Translate Goodbye 2024 Weekly-#20 Breaking of glass Cross Entropy Loss of Triton Weekly-#18 Cross Entropy Loss of Triton Weekly-#17 Triton Puzzles Weekly-#16 AutoBuilder Weekly-#15 Starting of tanble tennis Weekly-#14 Accident in life Weekly-#13 Trying of xiaohongshu Weekly-#12 summary of LLM acceleration Outline of LLM acceleration Weekly-#11 Copilot-type products Weekly-#10 Preparation for next journey Weekly-#9 Startup of YouTube Notes of flash-attention How to learn knowledge in new fields? Weekly-#8 Start Reading Notes of LoRA Acceleration of LLM - Matrix Multiplication Weekly-#8 Summary for two month Weekly-#7 Staying home Weekly-#6 Cost of PopTranslate Weekly-#5 Updating of PopTranslate Validated example of LLM acceleration Weekly-#4 First insight of LLM accelerate Weekly-#3 PopTranslate Weekly-#2 The fail of first product Weekly-#1 First week of indie develop slack迁移discord 雅思备考 2024Q3 中文博客合集 English Diary in May 五一游记 开始休假 learning english in April 离职前的状态 2024-01-01 duckdb 看懂的第一个PR learning english in October learning english in September learning english in August top hack news 收集 自动驾驶的小玩具 旅游 扬州+苏州 learning english in April small talk of learning english 新年新气象-碎碎念 2022年总结 刷剧 感染新冠 强化学习简介 特殊的日子 神经网络解释性 全局的模型无关解释方法合集 社区发现算法概览 图神经网络入门(GNN) 我的第一款 iOS APP AtCoder Beginner Contest 268 人的信息输入方式对比 重叠社区检测 人穷极一生到底在追求什么 重拾生活规划 路在何方 社区发现算法 - Louvain 《幸福的方法》 读《人类简史》有感 妙峰山骑行 黑客帝国 特征交互 特征工程 累计局部效应图 模型解释性-PDP 模型解释性 Web3 入门科普 总结 2022.4 孪生网络做 query 相似度任务
大模型调研
Benson · 2023-06-20 · via Benson's blog

背景

ChatGPT 2022.11 月问世之后引起的轰动一直在上升,但类似的做法和能力,在bert 2018年出现的时候基本就有了,一般认为 ChatGPT 的出现,是大模型大到一定程度后,能容纳的知识更加丰富,能力产生了质变,能应用几乎所有的对话类任务。

ChatGPT的训练成本过高,传言预训练一次需要200w美金,这应该也是openai 能在这个领域一骑绝尘的原因,并不是每个公司都有眼光和胆魄愿意花费这么大成本训练一个模型。

调研

如此大的模型和高昂的训练成本,使个人很难低成本参与进去,圈内玩家基本是各个巨头公司。但偶发发现最近开了一大批大模型相关的项目,就调研看了看。

开源/公开

Auto-GPT: 用户输入目标,Auto-GPT 利用 ChatGPT 生成一个机器人,利用各种prompt让GPT理解用户输入的目标,制作能实现目标的计划,一步步实施。本质还是用 prompt 扩展 ChatGPT 的使用边界。

Open-Assistant: 开源大模型,通过用户收集高质量数据,来微调模型

AgentGPT: Auto-GPT 的界面版本,让普通用户能更直接使用

llama: mate 公开 llama 65B 预训练模型,可用于研究,不可用于商业使用;给大模型的开源届提供了基石

stanford_alpaca: 斯坦福基于mate公开的大模型微调出的语言模型,命名为羊驼

lm-sys FastChat: lm-sys 参考羊驼训练的语言模型,效果逼近ChatGPT,最小的7B版本可以在单卡 28G显存的卡上微调

Lm-sys score borad: lm-sys 大语言模型榜单,模型对比竞技场

非公开

ChatGPT: ChatGPT 发布

ChatGPT plugins: 插件,丰富AI生态

GPT4: GPT4 发布,吊打各大榜单

Claude: openAI 原班人马创业训练的大模型,是目前最逼近GPT4效果的模型

不足

6个月暂定大模型研究: 大模型发展太快,相应的风险措施跟不上,开始呼吁暂停大模型的研究

无法避免大模型胡说八道:模型的预训练方式应该还是基于自回归,模型架构是 transformer,更多利用的还是基于语言的统计信息,逻辑推理能力较弱;简言之,大模型知识储备虽然吊打1000个人,但它输出的准确性并不是100%

现在的大模型架构无法支持走向AGI:现在大模型的归因和规划能力(逻辑能力)还不够,不足以走向AGI(强人工智能)

如果让大模型可控、安全

结论

大模型现在未解决的主要问题就是 逻辑能力,如果大模型已有的架构能解决此问题,那就直接实现了AGI。否则 AGI 需要另外一种新的架构,我个人稍微倾向于后者。

基于多个原因,我暂时还是看看我的自动驾驶项目吧

  1. 大模型需要的GPU门槛稍高,反正我现在没有;借用公司的也不太好
  2. 对大模型并没有什么idea要尝试;代码层面的改动也比较少
  3. 大模型缺乏逻辑能力,很难走向AGI
  4. 强化学习才是走向AGI的必经之路!