Scale AI מציגה התפתחות חדשה בפרדיגמת מחקר ולמידה

יום שלישי, 21 באפריל 2026

כתבת ראשניתוח

Scale AI Scale AI מציגה התפתחות חדשה בפרדיגמת מחקר ולמידה

נושאים

שמות מרכזיים: Frontier, Same; מספרים בולטים: 75%, 89%, 4%Frontier agents: 75–89% במשימות מוגדרות במלואן. אותן משימות עם פערים ריאליסטיים וכלי ask_human() לשימוש? 4–24%.פוסט משלים שמוסיף שכבת ראיות או מסגור נוספת

Frontier agents משיגים 75–89% במשימות מוגדרות במלואן. כשמשלבים פערים ריאליסטיים וכלי ask_human() לשימוש, התוצאה יורדת ל-4–24%. הערך המרכזי של הפריט הוא במה שהוא משנה בפועל בשדה, לא רק באופן שבו הוא ממסגר את הדיון.

כעת נדרש אות משלים שיאשר את המעבר מתובנה מעניינת לשינוי מהותי.

📌 הפוסט המומלץ

הפוסט המרכזי שמייצג את הסיפור אצל @Scale_AI

Frontier agents: 75–89% on fully-specified tasks. Same tasks with realistic gaps + an ask_human() tool they're told to use? 4–24%.

Scale AI מציגה התפתחות חדשה בפרדיגמת מחקר ולמידה. Frontier agents: 75–89% במשימות מוגדרות במלואן. אותן משימות עם פערים ריאליסטיים וכלי ask_human() לשימוש? 4–24%.

לפוסט המקורי ↗

💡

תובנה

הערך של הפריט נמדד בשינוי שהוא יוצר בפועל, לא רק באופן שבו הוא מציג את הדיון.

כל הכתבות ←