מרקוס
מרקוס
גארי מרקוס @GaryMarcus

פרופסור קוגניטיבי לשעבר ב-NYU. קול ביקורתי ומאוזן על יכולות ומגבלות ה-AI.

ARC-AGI-3 יצא — מרקוס כבר מסביר מה חסר בו

ARC-AGI-3 הגיע, ומרקוס קיים בגינו טקס מוכר: הכיר בו — ומיד ציין מה חסר. intelligence is multidimensional, ו-common sense נעדר ברובו. זו לא ביקורת destructive — ARC-AGI נבנה בכוונה סביב novel reasoning, לא common sense.

אבל מרקוס טוען שכשמכריזים 'AI הגיע לרמה אנושית' לפי benchmark שלא מודד היבטים מרכזיים של intelligence, מחטיאים את ה-point. והנקודה שלו על 4% automation עדינה אבל חדה: tasks aren't jobs. אוטומציה של 4% מה-tasks של עורך דין יכולה להיות trivial (drafting boilerplate) או transformative (legal research) — תלוי אילו tasks ואיך הן משולבות במבנה ה-job.

ה-debate עם Short Timelines camp ממשיך: מרקוס מציין ש-exponentials tail off. זהו counter-narrative ישיר ל-$852 מיליארד שOpenAI גייסה היום, שמבנה ה-story שלה על 'access compounding globally' — כלומר הנחה מובנית שה-exponential ממשיך. שני narratives אלה לא יכולים להיות נכונים בו-זמנית לאורך זמן.

מרקוס מגיב לשאלה על ARC-AGI-3 ועל הגדרת AGI

@M_Cottone https://t.co/sNALm0rFN2 is fine and i am a coauthor haven't studied arc-agi-3 but intelligence is multidimensional and eg common sense is largely omitted
הספר שלי טוב ואני שותף לכתיבתו. לא למדתי עדיין את ARC-AGI-3, אבל intelligence היא מולטי-דימנסיונלית — ולמשל, common sense נעדר ברובו.
לפוסט המקורי ↗
💡
תובנה
בעוד ARC-AGI-3 מוכיח reasoning — אף benchmark לא מוכיח common sense.
כל הכתבות ←