ראשקה
ראשקה
סבסטיאן ראשקה @rasbt

חוקר ML ב-Lightning AI. מסביר architectures מורכבים בצורה הכי ברורה.

מודל פשוט הצליח להפריד טקסט אנושי מ-AI בסריקה ליניארית אחת

התגלית פשוטה עד כדי מבוכה: טקסט שנוצר על ידי LLM וטקסט אנושי ניתנים להפרדה ליניארית. לא צריך רשת עמוקה, לא צריך טרנספורמר — מספיק LDA, אלגוריתם מ-1936, שראשקה עצמו מימש בקולג'. זה אומר שהמרחב הסטטיסטי של כתיבת AI שונה מהותית מכתיבה אנושית — לא רק באופי הטקסט, אלא במבנה המתמטי שמתחת.

זה מעמיד בסימן שאלה את כל תעשיית ה-"humanization" שמבטיחה להפוך טקסט AI לבלתי ניתן לזיהוי. אם ההפרדה היא ליניארית, כלומר פשוטה ומוחלטת, אז הטענה ש-"אי אפשר לזהות AI" היא פשוט שגויה.

ראשקה על מחקר זיהוי טקסט AI

Oh wow, that's beautiful! Ha, and thanks for using classic LDA, I am kind of getting nostalgic here. It's one of the first pattern rec algorithms I implemented from scratch back in college
וואו, זה יפהפה! הה, ותודה על השימוש ב-LDA קלאסי, אני קצת נוסטלגי פה. זה אחד האלגוריתמים הראשונים לזיהוי דפוסים שמימשתי מאפס בקולג'.
לפוסט המקורי ↗
💡
תובנה
אלגוריתם בן 90 שנה מזהה AI בסריקה אחת. אולי הבעיה מעולם לא הייתה קשה.
כל הכתבות ←