轮达 发表于 2025-12-1 09:30:13

解密Prompt系列65. 三巨头关于大模型内景的硬核论文

这一章我们不谈应用,而是通过三巨头 Google、OpenAI、Anthropic 三篇充满脑洞的论文,深入探讨模型内部状态的可访问性与可操控性。我们将从三个维度展开:

[*]模型是否有自我认知?
[*]如何引导这种认知?
[*]如何从数学和电路层面解释这种认知?
Google:In-Context Learning 本质上是隐式梯度更新

<blockquote><ul>
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

赀倦 发表于 3 天前

东西不错很实用谢谢分享
页: [1]
查看完整版本: 解密Prompt系列65. 三巨头关于大模型内景的硬核论文