🧠
אנדריי קרפאתי @karpathy

מייסד Eureka Labs, לשעבר מנהל AI ב-Tesla ומייסד-שותף OpenAI. PhD מסטנפורד.

8 סוכני AI מול logit softcap — ו-NanoChat עדיין לא נשבר

קרפאתי עושה את מה שרק הוא יכול — לוקח את השאלה 'למה NanoGPT speedrun לא אוטומטי?' ומנסה. 8 סוכנים (חצי Claude, חצי Codex), כל אחד עם GPU, מנסים למחוק logit softcap מבלי regression. התוצאה: 'לא עובד וזה בלאגן...

אבל עדיין מוקדם מאוד'. הנקודה המפתיעה: logit softcap הוא לא פיצ'ר סטנדרטי, אבל ב-state הספציפי של NanoChat — בלתי אפשרי להסיר. זו דוגמה מושלמת לחזית המשוננת: סוכני AI יכולים לרוץ ניסויים אבל עדיין לא יכולים להחליף אינטואיציה של חוקר.

ובמקביל, קרפאתי מודה שהוא עדיין פותח IDE ועורך קוד בעצמו.

קרפאתי על ניסוי 8 הסוכנים

I had the same thought so I've been playing with it in nanochat. E.g. here's 8 agents (4 claude, 4 codex), with 1 GPU each running nanochat experiments (trying to delete logit softcap without regression). The TLDR is that it doesn't work and it's a mess... but it's still very
חשבתי את אותו דבר אז שיחקתי עם זה ב-NanoChat. למשל, הנה 8 סוכנים (4 Claude, 4 Codex), כל אחד עם GPU, מריצים ניסויים על NanoChat (מנסים למחוק logit softcap בלי regression). ה-TLDR הוא שזה לא עובד וזה בלאגן... אבל עדיין מאוד
לפוסט המקורי ↗
💡
תובנה
8 סוכני AI לא הצליחו לפתור מה שחוקר אחד עם אינטואיציה אולי יכול — זו החזית המשוננת בפעולה.
כל הכתבות ←