Scale AI
Scale AI
Scale AI @Scale_AI

ספקית הנתונים לאימון AI מספר 1. לקוחות: OpenAI, Meta, Waymo.

Scale AI מציגה התפתחות חדשה בפרדיגמת מחקר ולמידה

Frontier agents משיגים 75–89% במשימות מוגדרות במלואן. כשמשלבים פערים ריאליסטיים וכלי ask_human() לשימוש, התוצאה יורדת ל-4–24%. הערך המרכזי של הפריט הוא במה שהוא משנה בפועל בשדה, לא רק באופן שבו הוא ממסגר את הדיון.

כעת נדרש אות משלים שיאשר את המעבר מתובנה מעניינת לשינוי מהותי.

הפוסט המרכזי שמייצג את הסיפור אצל @Scale_AI

Frontier agents: 75–89% on fully-specified tasks. Same tasks with realistic gaps + an ask_human() tool they're told to use? 4–24%.
Scale AI מציגה התפתחות חדשה בפרדיגמת מחקר ולמידה. Frontier agents: 75–89% במשימות מוגדרות במלואן. אותן משימות עם פערים ריאליסטיים וכלי ask_human() לשימוש? 4–24%.
לפוסט המקורי ↗
💡
תובנה
הערך של הפריט נמדד בשינוי שהוא יוצר בפועל, לא רק באופן שבו הוא מציג את הדיון.
כל הכתבות ←