SoPilotSoPilot

🔥 Search Hot Tweets

Search and analyze hot tweets from KOL accounts list (list: https://x.com/i/lists/1961235697677017443) within 6 hours. Use SoPilot plugin to quickly comment and occupy the comment section.

Real-time Hot Tweet Analysis

马东锡 NLP

马东锡 NLP

@dongxi_nlp· 34.8K followers

Double Shot | LLM Persona, role play 两篇喜欢的文章,一起看。 “you are a helpful assistant”,这种烙印般的persona,会让 LLM 时刻想回到乐于助人的状态,而无法稳定地长期的保持其他的人格状态。 Paper 1: 模型因为对齐得太好,而无法扮演反派角色。 Paper 2: 模型随着时间推移,会慢慢忘记最初角色设定,而回到帮手状态。 在漏洞检测时,我们需要红队人格。 在金融博弈中,我们需要套利钻营人格。 并不是所有情景,都需要 helpful assistant。

43
4
2
5.5K
Posted 21d ago · Data updated 20d ago
Reply Suggestion

Est. 200 views for your reply