Some notes from an AI paper:


续上篇 Nature Select 团队的共情评估方法,把他们的 MAPO 训练方式也看了。这个训练方式的目的在于如何让模型在多轮交互中维持一个稳定的“共情风格(persona)”,并做出相对一致的回应。
也就是说,这个方法论的重点在于 Agent 的行为表现本身,而非理解真正的心理模型,将人机互动引导向明确的“健康/善”。
并且这两篇论文都缺乏对“共情”的可操作性定义,文中大概可以理解为“在对话中表现出理解、支持、安抚、非攻击性回应的能力”。这个定义很明确并不足够深入,而概念的模糊并不利于研究员真正解决 Agent 的人机关系结构问题。
原文:
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论