慣性聚合 高效追讀感興趣之博客、新聞、科技資訊
閱原文 以慣性聚合開啟

推薦訂閱源

博客园 - 司徒正美
V
V2EX
T
Tailwind CSS Blog
有赞技术团队
有赞技术团队
aimingoo的专栏
aimingoo的专栏
Apple Machine Learning Research
Apple Machine Learning Research
IT之家
IT之家
Blog — PlanetScale
Blog — PlanetScale
A
About on SuperTechFans
月光博客
月光博客
T
The Blog of Author Tim Ferriss
宝玉的分享
宝玉的分享
Martin Fowler
Martin Fowler
博客园 - 聂微东
The GitHub Blog
The GitHub Blog
V
Visual Studio Blog
WordPress大学
WordPress大学
酷 壳 – CoolShell
酷 壳 – CoolShell
Engineering at Meta
Engineering at Meta
GbyAI
GbyAI

ZDNet Korea

여기어때, 해양 관광 레저·티켓 할인 쿠폰 쏜다 11번가, 5월 바다여행지 숙박·체험 상품 할인 패스트파이브, 작년 매출 1500억원·영업익 60억원 혼다코리아, '뉴 파일럿 블랙 에디션' 사전 계약…7880만원 카카오엔터 추천 4월 화제의 신작 웹툰 4선 휴먼컨설팅그룹, 연구개발 허브 ‘양재센터’ 신설 더벤처스, K뷰티 '클레버스텝스' 시드 투자 민주당 "지방선거 이후 디지털자산기본법 논의 본격화" KFC, 가맹점주 대상 프랜차이즈 컨벤션 개최 스타벅스, 장애인의 날 맞아 공모전 수상작 굿즈 출시 "URL 포함된 고유가 지원금 알림 문자는 사기" 2025년 원화 결제 수출 비중 3.4%…역대 최고 삼양사, 국제베이커리페어 첫 참가…냉동생지 ‘프레팡’ 공개 문체부 콘텐츠 R&D 확대, 현장 체감은 엔비디아, '빌드 어 클로' 한국 첫 공개…"AI 에이전트 직접 구축" LS일렉트릭, 북미 데이터센터에 1700억 규모 전력 설비 공급 스타스테크, 콜라겐 스킨케어 ‘라보페’ 리브랜딩...국내외 유통망 확장 네이버 사우디 직원들 다시 사무실로…중동 사업 재궤도 올해는 결론 나오나…배달앱 사회적 대화기구 재출범부터 ‘균열’ [이종천] 2026년 통신시장, 아직 단통법 시절 ‘금난전권’ 그림자에 갇혀 있는가 KOSA, 의료·바이오 AI 인재 양성…실무형 교육 강화 빅밸류, 10년 만 첫 흑자…"올해 매출 100억원 목표" 트럼프, 호르무즈 해협 봉쇄령…"이란에 통행료 낸 선박 차단" 우리 동네 교통·안전 문제, ‘도시 데이터’로 해결 환경분야 시험·검사 전문성 ↑…산업계 수요 반영, 고난도 분석기술 교육 靑 "종전선언까지 비상대응...매점매석 금지 추가검토" "D램 가격 상승률, 1분기 70%→2분기 30~50%로 둔화 전망" "판교 정보보호클러스터 확 달라져"...9년만에 시설 대폭 개선 보안 개념이 바뀐다...'미토스 보고서' 7월 발표 벤츠, 전국 어디서나 같은 가격…다이렉트 직판제 전환 스타링크 위성 인터넷이 이동통신 결합상품으로 전기차 타이어, 내연기관보다 더 빨리 닳는 이유 [ZD브리핑] 삼성 TV 신제품 발표...AIDC 특별법 논의 속도 조선소 파운데이션 모델 개발 400억원 투입…산업현장 적용 추진 외식업 평균 차액가맹금 2600만원…가장 높은 곳은 치킨 GIST 에너지 전주기 연구체계 구축 "시동" 가맹점 수 1위는 '메가커피'...평균 매출액 1위는 '투썸' 풀무원, 파주 탄현면 일대 '평화의 숲' 가꾸기 진행 장애물 대응 "사람처럼"…4족보행로봇 상용 제어기 선보여 가맹산업 다시 성장 궤도…본부·브랜드·가맹점 수 일제히 증가 자율로봇 학습용 영상, 모자이크없이 원본 활용 가능해진다 연구개발특구, 2030까지 코스닥 400개, 매출 150조원 달성 삼성전자, 에어컨 생산라인 풀가동... 에어컨 수요 급증 대비 [SW키트] 전기차 설계 혁신, 다쏘시스템 '버추얼 트윈'서 나온다 [써보고서] 와이파이 끊어도 AI는 살아있다…구글 'AI 엣지 갤러리' 미·이란 종전협상 결렬...밴스 "핵 포기 확약 못받아" 중동 위기, 재생에너지 전환 불 지폈지만…구조적 제약 여전 KT, 온라인 전용 인터넷 요금제 출시 박윤영 KT, 부산 해저케이블 육양국 점검 미·이란 협상 긴장에도 비트코인 횡보…7만달러선 지켜
RAG果真"幻覚"乎……生成之AI,无标可循,质之难驭。
박윤지 클라이온 대표 · 2026-05-24 · via ZDNet Korea

自癸卯以降,创生之智械渐入诸业,已成共议。自民瘼咨询、内政庶务、医理诘问至金谷顾问,基于大语言模型之服务,其位日固,而其枢,几无例外,皆在RAG(检索增强生成)之术。

RAG者,使大语言模型得实时引最新之智识与组织独有之数据,以减幻象之弊,遂成补充之技。迨丙申之岁,RAG为创生之智械服务之标准架构,已非新流,乃为常态。

然实务之问,犹存未决。言RAG之引入,与RAG之得宜,非同一事也。

今之重,已自‘构建’移于‘运营’。

朴允智(Park Yoonji)为Claeon(克劳恩)公司代表

盖特纳(Gartner)曾预言,至2025年,约三十分之三十的生成式人工智能项目将停滞于概念验证(PoC)阶段。现实所见,亦无大异。初出之时,基于RAG的聊天机器人无不运行无碍,然运营数月之后,渐有报告称其回答质量有所下降。或因来源错乱,或因同一问题得异答,或因特定业务领域准确率低劣。

然问题在于,多数组织仅凭定性判断以识此质变。运营者之经验,实为唯一之性能指标,此情形所在多有。其果,分析原由、改良之道,耗时甚巨,且难以量述改之何物、如何改之,其成效几何。

RAG運營之三元結構性任務

欲使RAG運營維持可持續,必須解決三項任務

其一,無法測量性能。文檔屢屢增補,結構亦變。然此變化對於搜尋性能與回應質量之影響,無法客觀確證,手段匮乏

其二,優化之艱難。塊大小、Top-K、嵌入模型、提示、LLM組合等可調參數,數十種之多。欲手動窮盡所有組合,實非現實之所及

曰,其三,验变之缺也。若提某域之应质,则他域之质隳,所谓气球效应,于RAG之运,非所罕睹。无较变前后者之统系,则所试之效,终陷于不测之域。

此三者,非独模型之能之弊,实乃运法之空也。未补此空,欲持AI之务于公、金、医之域,其信实为核,则难以为继。

故需以标为基,以质为管。

昔彼得·德鲁克有言:"不可量者,不可驭也。"RAG之运,亦循此理。今国际间已立RAG评量之标,曰忠实、曰相关、曰文境之精。企业之境,更须加害之防、偏倚之察,此乃伦理之要。

尤以公权与规制之业为甚,一答之谬,可损制信。若言"AI所创,势所难免",此说未合。评量之基,非择之题,实责之务也。

且評質非止於發行之際,乃應為常期自動之評判循環。若察性能有損,必辨其源,在於搜檢階段抑或創造階段,然後乃可致改良之功效。

RAG之生命週期:籌劃·配布·運營·改良之循環

運營持續RAG服務之組織,其共通者,謂以項目為「建設之終點」非為「運營之始點」。

规划及开发之际,尝试诸模组合,以定技栈。临部署之先,必于类乎实运之境,从外察者之观,行验核之事。既部署,乃定期察其效能,以早辨其异。若需改良,则于试境验其变策之效,而后行之。

此四阶当循环为用,方使RAG之务,历久弥精。不然,则难脱“初成之务,质尤优”之悖论。

欲持RAG之务,恒久不辍,当视其事非“成之终局”,实乃“运之始发”。(图源=Clipart Korea)

于公AI,尤重“量信之要”。

观于公共领域生成型人工智能之项目,则知以指标为基之质量管理,于斯域尤显其要。一错于应答,则政策之信立损;一失于文书,则行政之信亦隳。

故当辨应答止于"似是而非之句"耶,抑或可据本源而验之。须能定何域逾准,究其因,作量析,使用者与司者咸信AI之果。

转折点立生成AI之市

生成式AI导入已届三载,时移世易,市井之议亦随之流转。由“初试导入”之阶,渐迁至“永续运营”之境。来日,具RAG质量管理体系之组织与未备者,非惟技之异,恐更生信义之别。

相关报道

论更优之模,更精之示,更广之境,今后必将继续活跃。然欲使诸论于实境有所成,必先备可测可述之语。

"感生指标"。吾辈以为,创生之智欲逾试验之阶,入组织之常,需同业共筑之基。

*本栏之文,或与编者旨趣有异。