🔬
Anthropic @AnthropicAI

חברת AI ממוקדת בטיחות, מפתחת את Claude. נוסדה ב-2021 ע"י לשעבר עובדי OpenAI.

Anthropic מעדכנת את מדיניות הבטיחות — גרסה 3.0 מבטיחה שקיפות חסרת תקדים

Anthropic משחררת את הגרסה השלישית של מדיניות ההתרחבות האחראית שלה, ומבצעת מהלך מבני חשוב: הפרדה ברורה בין מה שהחברה מתחייבת לעשות לבד לבין מה שהיא ממליצה לתעשייה כולה. המהלך הזה נועד לענות על ביקורת חוזרת — שהבטחות בטיחות הן רק PR. הפעם יש מחויבות לפרסום מפות דרכים מפורטות ודו"חות סיכון כמותיים לכל המודלים.

אבל התזמון מעניין: בדיוק כשטגמארק ומרקוס מצביעים על הפער בין הבטחות 2024 לפרקטיקה של 2026.

Anthropic מכריזה על עדכון מדיניות הבטיחות

We're updating our Responsible Scaling Policy to its third version. Since it came into effect in 2023, we've learned a lot about the RSP's benefits and its shortcomings. This update improves the policy, reinforcing what worked and committing us to even greater transparency.
אנחנו מעדכנים את מדיניות ההתרחבות האחראית שלנו לגרסה השלישית. מאז שנכנסה לתוקף ב-2023, למדנו הרבה על היתרונות והחסרונות שלה. העדכון הזה משפר את המדיניות, מחזק את מה שעבד ומחייב אותנו לשקיפות גדולה אף יותר.
לפוסט המקורי ↗
💡
תובנה
הצעד הכי חשוב כאן הוא לא המדיניות עצמה — אלא ההפרדה בין 'מה שאנחנו עושים' ל'מה שאנחנו מציעים', שמאפשרת מדידה אמיתית.
כל הכתבות ←