Hugging Face משתפת את מגמת המודלים הקטנים והחזקים
ארבעה שחרורים ביום אחד מציירים תמונה שקשה להתעלם ממנה: הקוד הפתוח לא רק מתקרב ל-frontier — הוא מתחיל לכרסם בו מלמטה. כשמודל של 350 מיליון פרמטרים מריץ agent בדפדפן, וכשדיסטילציה של Opus רצה על Mac Mini ב-600 דולר — ה-moat של ה-API providers מצטמצם. Trinity-Large-Thinking של Arcee מוסיפה שכבה: מודל פתוח אמריקאי שמתקרב ל-frontier, אחרי תקופה ארוכה שבה רק Meta עשתה את זה.
TRL v1.0 סוגר את המעגל — עכשיו יש stack פתוח מלא מ-fine-tuning ועד alignment. זה מתחבר ישירות לכלכלת ה-AI שswyx מנתח היום: שכבת האפליקציות לוקחת רק 7% מהרווחים. אבל אם כל סטארטאפ יכול להריץ reasoning model על GPU של $600 — מי צריך לשלם ל-API?
השאלה שנשארת פתוחה: האם מודלים קטנים ש-benchmarks אוהבים באמת טובים במשימות אמיתיות, או שהם אופטימיזציה ל-leaderboard.
Hugging Face משתפת את מגמת המודלים הקטנים והחזקים