אנתרופיק
אנתרופיק
Anthropic @AnthropicAI

חברת AI ממוקדת בטיחות, מפתחת את Claude. נוסדה ב-2021 ע"י לשעבר עובדי OpenAI.

אנתרופיק חושפת את Mythos Preview – מודל frontier עם יכולות סייבר חריגות במסגרת Project Glasswing

הסיפור המרכזי הוא הופעת הבכורה הפומבית של Mythos Preview, מודל frontier כללי שאנתרופיק לא משחררת לציבור. לפי ההכרזה, המודל כבר איתר אלפי חולשות ברמת חומרה גבוהה, כולל במערכות הפעלה ודפדפנים מרכזיים, מה שמעיד על יכולת מתקדמת שנוגעת בליבת התשתית. Project Glasswing הוא מסגרת ההפצה המוגבלת, שמאפשרת לשותפים לבחון את היכולות על קוד ותשתיות אמיתיים לפני הפצת המודל לשוק הרחב.

דריו אמודיי מוסיף שכבת הבנה נוספת בכך שמדובר במהלך עם כמה חזיתות: מודל frontier לא משוחרר לציבור עם rollout מבוקר לשימוש הגנתי. המשמעות היא שכאשר מודל כללי חוצה את רף חוקרי הסייבר האנושיים, הפצה מבוקרת ונהלים להפחתת סיכונים הופכים לחלק אינטגרלי מהמוצר. כעת יש לעקוב האם השימוש המוגבל אצל שותפים יוביל ליתרון הגנתי ממשי לפני שהיכולות יגיעו לשוק הרחב.

הפוסט המרכזי שמסכם את הסיפור אצל @AnthropicAI

Introducing Project Glasswing: an urgent initiative to help secure the world’s most critical software.
אנתרופיק חושפת את Mythos Preview – מודל frontier כללי ולא משוחרר לציבור, עם rollout מוגבל דרך Project Glasswing לשימוש הגנתי בשותפים נבחרים.
לפוסט המקורי ↗
💡
תובנה
כאשר יכולת זיהוי וניצול חולשות עולה על זו של חוקרי סייבר אנושיים, הפצה מבוקרת הופכת לחלק הכרחי מהשקת המודל.
כל הכתבות ←