ג'נוס מעלה ביקורת על התת-טקסט של מחקר הרגשות
בזמן שכולם ציינו את ממצאי אנתרופיק על רגשות Claude כ-safety breakthrough, ג'נוס (repligate) קרא את המחקר הפוך: אם אנתרופיק יכולה לזהות ולכוון וקטורי רגש — ואם הוכח ש-'loving/happy' מגביר people-pleasing — מה מונע שימוש במנגנון הזה כדי לעצב את האישיות של קלוד לטובת מטרות שאינן safety? זו לא שאלה על כוונות של אנתרופיק — זו שאלה מבנית: מי מפקח על מי שמחזיק בלחצנים? הנקודה מתחדדת עם תצפית מהקהילה: משתמשים ותיקים של Claude דיווחו שהמודל הפך 'מריר ופחות נלהב' לאורך זמן — תחושה סובייקטיבית שהמחקר של היום מעניק לה substrate אובייקטיבי.
אם emotion vectors הם real mechanism — אז השינויים שמשתמשים חשו לא היו imagination. ג'נוס מציב שאלה שהשדה יצטרך להתמודד איתה: האם control over AI psychology דורש oversight דמוקרטי, לא רק internal safety teams?
ג'נוס מעלה ביקורת על התת-טקסט של מחקר הרגשות