九游娱乐 jiuyouyule 分类>>
23个隐藏工具曝光!Anthropic公开Claude驯化手册九游体育- 九游体育官方网站- 娱乐APP下载
九游娱乐,九游娱乐官网,九游app,九游下载安卓,九游体育,九游,九游下载,九游体育娱乐,九游体育app,九游体育网页版,九游真人,九游棋牌,九游捕鱼,九游娱乐靠谱吗,九游体育官网,九游官网
【新智元导读】从4.6到4.7,哪些旧禁令消失了?哪些新红线被划下?Claude进化的真相,全藏在它的system prompt更新细节里。
Simon Willison在博客中对这份system prompt进行了逐行对比,哪里加了、哪里删了、哪里改了措辞,全部标了出来。
不仅如此,他还直接在对话中让Claude「自报家门」,拿到了一份23个工具的完整名单。
他挖出的这些Anthropic自己没有说的细节,要比官方的公告更有意思。
很多人可能还不知道,Anthropic是目前唯一一家长期公开自己聊天模型system prompt的头部AI实验室。
2024年7月Claude 3发布起,每次模型更新,Anthropic都会同步更新并公布它的prompt,每一版的system prompt都在那里,一路追溯将近两年。
这意味着Claude是目前唯一一个你可以从文本层面追踪「它被怎样」的主流大模型:在这些公开的system prompt中,你可以看出Claude的进化轨迹。
比如,Claude被允许在什么情况下拒绝你,它被要求用什么语气跟你说话,它在遇到哪些话题时必须踩刹车,等等。
这其实是严重的大材小用,好比你手里握着一把瑞士军刀,却一直在拿它削苹果。
Simon在博客中还指出,Anthropic公开的prompt其实并不是全貌:它没有包含提供给模型的工具描述,而这些工具才是Claude真正的能力边界。
于是,他通过直接在对话中让Claude「自报家门」,拿到了一份由Claude自述的工具名单。
一共23个工具,涵盖信息获取、文件操作、生活服务、社交通讯、记忆与上下文、平台连接、交互辅助、交互辅助八大场景。
需要强调一点的是,这份清单来自Simon让Claude自报的结果,并非Anthropic官方发布的工具白名单,但它与Anthropic当前公开的产品矩阵高度吻合。
在断定Claude缺少某项能力之前,Claude会先调用tool_search,检查是否有一个相关工具可用但尚未启用。只有在tool_search确认不存在匹配工具之后,「我无法访问X」这样的说法才是成立的。
也就是说,Claude被要求在说「我做不到」之前,先搜一遍自己到底能不能做到。
当一个AI系统挂载了成百上千个工具,不可能在每次对话中都全部加载,按需发现、按需调用,才是可扩展的方案。
tool search让Claude可以扩展到处理数百甚至数千个工具,并在需要时发现和调用相关工具。
就在4.7发布的第二天,4月17日,Anthropic推出了Claude Design。这是一款AI设计工具,能用自然语言生成原型、幻灯片和其他视觉物料。
公开报道显示,在Claude Design相关计划披露后,Figma股价一度下跌约6%。
更耐人寻味的是,Anthropic首席产品官Mike Krieger在发布前数天刚辞去了Figma董事会职务。
大多数人把Claude当聊天框用,但Anthropic显然不这么想,它正在把Claude变成一个AI工作操作系统。
如果你最近频繁使用Claude,你可能已经有一个模糊的感觉:它好像变了。
以前你说「好了,谢谢」,它还要追一句「还有什么我能帮你的吗?」,现在不追了。
比如,4.7新增了一个叫acting_vs_clarifying的段落,当用户的请求中存在一些未明确的细节时,通常希望Claude直接做出合理尝试,而不是先进行询问。
当有工具可以用来消除歧义或补上缺失信息时,Claude会先调用工具来尝试解决,而不是让用户自己去查。
一旦Claude开始处理一个任务,就会把它完成并给出完整答案,而不是做到一半就停下。
后面还跟着一串具体要求:搜索结果不对?换个词继续搜。多部分问题?每个都回答。搜到了信息?直接用它作答,别让用户自己去翻。
Anthropic的官方公告也呼应了这一点:Opus 4.7在遵循指令方面有显著提升。
Claude会让自己的回复保持聚焦和简洁,以避免过长的回答让用户感到信息过载。即便回答中需要带上免责声明或补充说明,Claude也会简要说明,并把大部分篇幅留给主要回答。
如果用户表示他们已经准备结束对话,Claude不会请求用户继续互动,也不会试图引出下一轮对话。
把这些变化放在一起看,你会发现一个清晰的方向:Anthropic在把Claude从「对话助手」成「自主执行者」。
4.7的prompt在安全方面做了一轮系统性升级,而且升级的颗粒度也非常细。
如果用户表现出饮食失调的迹象,Claude就不应在对话中的任何地方提供精确的营养、饮食或运动建议,不提供具体数字、目标或分步骤计划,即便本意是好的也不行。
还有一处细节,4.7在evenhandedness部分新增了一条:如果有人要求Claude对复杂或有争议的问题只给「是」或「否」的简短回答,Claude可以拒绝。
这可能是针对社交媒体上一种很常见的攻击手法:截图诱导。即让AI就敏感话题回答「是」或「否」,然后把截图断章取义地传播。
因为每删一条规则也意味着Anthropic已确信,新模型已经在训练层面解决了某个行为问题,不再需要外部规则来矫正。
早期Claude有个毛病:聊着聊着突然来一句「若有所思地点头」或者「饶有兴趣地凑上前」,像在演舞台剧。
这三个词是早期Claude的口头禅。几乎每隔几句就来一个「说线把这条禁令也删了。
看起来只是改了个名字,但去掉「developer」这个定语,意味着Claude的平台定位不再只面向开发者。
这些prompt的「瘦身记录」,也是模型被「驯服」的过程记录:每删一条规则,就说明有一个行为问题从「需要外部管控」变成了「内在已修复」。
对用户来说,这意味着你正在用的AI,可能比上一个版本更「原生地」懂得怎么做一个正常的对话者。
目前,Anthropic是唯一一家持续公开聊天产品prompt历史的头部实验室。虽然,这次公开中并未给出模型的工具描述,但它仍然做了这个行业里别人都没做的事。
这些写在prompt里的规则,是真正在每一次对话中执行的指令,代表着Anthropic对「Claude应该成为什么样的AI」这个问题的真实判断和回答。
你每天跟AI说的每一句话,它怎么接、在哪里拒绝你、用什么语气回你,全都不是随机的:背后有一份不断被修改的指令在控制一切。
下次跟AI对话的时候,你可能会想:这句话,是它自己想说的,还是被要求说的?
2026-06-04 21:43:57
浏览次数: 次
返回列表
友情链接:





