וויליסון על מודל טריליון פרמטרים על לפטופ
Here's 1T parameter Kimi running at 1.7 tok/s on an M4 Max
הנה Kimi של טריליון פרמטרים רץ ב-1.7 טוקנים/שנייה על M4 Max
לפוסט המקורי ↗
וויליסון מביא שני סיפורים שמגדירים את היום. ראשית — Kimi-K2, מודל של טריליון פרמטרים (1,029B), רץ על MacBook Pro עם M4 Max ב-1.7 טוקנים לשנייה. 524GB אחרי המרה.
אתמול 671B, היום טריליון, אותו לפטופ. זה סימן שהדמוקרטיזציה של מודלים גדולים מתרחשת מהר יותר ממה שציפינו. שנית — בעקבות מתקפת LiteLLM, וויליסון נכנס לעומק של אבטחת שרשראות אספקה: למה רגיסטרים כמו Debian/Ubuntu מגנים (ולוקח שבועות לאשר חבילות) ולמה PyPI לא יכול — ולא צריך — להבטיח אותו דבר.
ההמלצה המעשית: לעכב עדכונים אוטומטיים ב-7 ימים כהגנה מ-zero-days.
וויליסון על מודל טריליון פרמטרים על לפטופ