קרפתי מגדיר מחדש את הבנצ'מרק
sorry just to clarify - the real benchmark of interest is:
"what is the research org agent code that produces improvements on nanochat the fastest?"
this is the new meta.
סליחה, רק להבהיר — הבנצ'מרק האמיתי שמעניין אותי:
'מהו הקוד של ארגון מחקר סוכני שמייצר שיפורים ב-nanochat הכי מהר?'
זה המטא החדש.
לפוסט המקורי ↗