אנתרופיק מציגה את ממצאי model diffing: Qwen מול Llama
For example, when we compared Alibaba's Qwen to Meta's Llama, we found a "CCP alignment" feature unique to Qwen and an "American exceptionalism" feature unique to Llama.
לדוגמה, כשהשווינו את Qwen של Alibaba ל-Llama של Meta, מצאנו feature של 'CCP alignment' ייחודי ל-Qwen, ו-feature של 'אמריקניזם' ייחודי ל-Llama.
לפוסט המקורי ↗



