ARC-AGI-3 יצא — וכל המודלים הקיימים מתחת לאחוז אחד
שולה ו-Knoop השיקו את ARC-AGI-3, והתוצאות מדברות: כל המודלים הקיימים — GPT, Claude, Gemini, כולם — מתחת לאחוז אחד. הבנצ'מרק החדש מודד אינטליגנציה אגנטית דרך סביבות אינטראקטיביות שד…
💡 כשכל המודלים מתחת לאחוז אחד, ברור שמה שאנחנו קוראים לו 'אינטליגנציה' הוא בעיקר זיכרון מוסווה.