OpenAI מפרסמים מחקר בטיחות CoT
We're publishing a new evaluation suite and research paper on Chain-of-Thought (CoT) Controllability.
We find that GPT-5.4 Thinking shows low ability to obscure its reasoning—suggesting CoT monitoring remains a useful safety tool.
אנחנו מפרסמים סוויטת הערכה ומאמר מחקר חדשים על שליטה בשרשרת חשיבה (CoT).
מצאנו ש-GPT-5.4 Thinking מפגין יכולת נמוכה להסתיר את החשיבה שלו — מה שמצביע על כך שניטור CoT נשאר כלי בטיחות שימושי.
לפוסט המקורי ↗