🔥 Search Hot Tweets
Search and analyze hot tweets from KOL accounts list (list: https://x.com/i/lists/1961235697677017443) within 6 hours. Use SoPilot plugin to quickly comment and occupy the comment section.

马东锡 NLP
@dongxi_nlp· 14.5K followers
Qwen 2.5 模型的 data contamination 问题,带来的影响非常恶劣,直接影响了以它为基座的文章的结果的可信度。 凡是基于 Qwen 2.5 模型的文章,无论方法多么好,都无法全身心的阅读。 今天读到 K2-Think, 尤其有这种感觉。 方法太solid了,如教科书般,long-CoT SF,RLVR,Plan + Best-of-3 + LLM judging,甚至有WSE + speculative decoding,太好了。 我只想问作者一个问题,这么好的文章,为什么已知Qwen 2.5存在数据污染问题,还要用它作为基座?
24
0
2
3.4K
Posted 18d ago · Data updated 18d ago
Reply Suggestion
Est. 400 views for your reply