איתן מוליק @emollick

פרופסור ב-Wharton, חוקר השפעת AI על עבודה וחינוך. מחבר 'Co-Intelligence'. TIME 100 AI 2024.

מוליק טוענת ליתרון מדיד, לא רק לדמו מרשים

יום חמישי, 23 באפריל 2026

תקצירניתוח

מוליק מוליק טוענת ליתרון מדיד, לא רק לדמו מרשים

נושאים

השמות שעל השולחן: Interesting, OpenAI, ChatGPT-5 · המספרים שבולטים: 5.4 במקום עוד הדגמה, יש כאן טענה ישירה ליתרון מדיד מול 5.4.מה לעקוב עכשיו: האם היתרון הזה שורד מחוץ ל-eval אחד וגם בתנאי שימוש אמיתיים

במקום עוד הדגמה, יש כאן טענה ישירה ליתרון מדיד מול 5.4. Interesting, OpenAI just released a free healthcare version of ChatGPT-5.4 for clinicians that beat specialty-matched physicians with unlimited time + web access on a benchmark of real & hard clinical tasks. אם היתרון הזה מחזיק גם מחוץ ל-benchmark, הוא יכריח את השוק להסביר מחדש מה בכלל נחשב איכות.

מה שצריך לעקוב אחריו עכשיו הוא האם היתרון הזה שורד מחוץ ל-eval אחד וגם בתנאי שימוש אמיתיים.

📌 הפוסט המומלץ

הפוסט שמחזיק את מרכז הכובד של הסיפור הזה אצל @emollick

Interesting, OpenAI just released a free healthcare version of ChatGPT-5.4 for clinicians that beat specialty-matched physicians with unlimited time + web access on a benchmark of real & hard clinical tasks.

מוליק טוענת ליתרון מדיד, לא רק לדמו מרשים. במקום עוד הדגמה, יש כאן טענה ישירה ליתרון מדיד מול 5.4.

לפוסט המקורי ↗

💡

תובנה

אם היתרון הזה מחזיק גם מחוץ ל-benchmark, הוא יכריח את השוק להסביר מחדש מה בכלל נחשב איכות.

כל הכתבות ←