מוליק
מוליק
איתן מוליק @emollick

פרופסור ב-Wharton, חוקר השפעת AI על עבודה וחינוך. מחבר 'Co-Intelligence'. TIME 100 AI 2024.

מוליק טוענת ליתרון מדיד, לא רק לדמו מרשים

במקום עוד הדגמה, יש כאן טענה ישירה ליתרון מדיד מול 5.4. Interesting, OpenAI just released a free healthcare version of ChatGPT-5.4 for clinicians that beat specialty-matched physicians with unlimited time + web access on a benchmark of real & hard clinical tasks. אם היתרון הזה מחזיק גם מחוץ ל-benchmark, הוא יכריח את השוק להסביר מחדש מה בכלל נחשב איכות.

מה שצריך לעקוב אחריו עכשיו הוא האם היתרון הזה שורד מחוץ ל-eval אחד וגם בתנאי שימוש אמיתיים.

הפוסט שמחזיק את מרכז הכובד של הסיפור הזה אצל @emollick

Interesting, OpenAI just released a free healthcare version of ChatGPT-5.4 for clinicians that beat specialty-matched physicians with unlimited time + web access on a benchmark of real & hard clinical tasks.
מוליק טוענת ליתרון מדיד, לא רק לדמו מרשים. במקום עוד הדגמה, יש כאן טענה ישירה ליתרון מדיד מול 5.4.
לפוסט המקורי ↗
💡
תובנה
אם היתרון הזה מחזיק גם מחוץ ל-benchmark, הוא יכריח את השוק להסביר מחדש מה בכלל נחשב איכות.
כל הכתבות ←