מודל פשוט הצליח להפריד טקסט אנושי מ-AI בסריקה ליניארית אחת

יום ראשון, 29 במרץ 2026

ראשקה מודל פשוט הצליח להפריד טקסט אנושי מ-AI בסריקה ליניארית אחת

נושאים

ראשקה: טקסט LLM וטקסט אנושי ניתנים להפרדה ליניארית — עם LDA קלאסי מחקר: מודל זיהוי AI פשוט מגלה הפרדה כמעט מושלמת בין המרחבים

התגלית פשוטה עד כדי מבוכה: טקסט שנוצר על ידי LLM וטקסט אנושי ניתנים להפרדה ליניארית. לא צריך רשת עמוקה, לא צריך טרנספורמר — מספיק LDA, אלגוריתם מ-1936, שראשקה עצמו מימש בקולג'. זה אומר שהמרחב הסטטיסטי של כתיבת AI שונה מהותית מכתיבה אנושית — לא רק באופי הטקסט, אלא במבנה המתמטי שמתחת.

זה מעמיד בסימן שאלה את כל תעשיית ה-"humanization" שמבטיחה להפוך טקסט AI לבלתי ניתן לזיהוי. אם ההפרדה היא ליניארית, כלומר פשוטה ומוחלטת, אז הטענה ש-"אי אפשר לזהות AI" היא פשוט שגויה.

📌 הפוסט המומלץ

ראשקה על מחקר זיהוי טקסט AI

Oh wow, that's beautiful! Ha, and thanks for using classic LDA, I am kind of getting nostalgic here. It's one of the first pattern rec algorithms I implemented from scratch back in college

וואו, זה יפהפה! הה, ותודה על השימוש ב-LDA קלאסי, אני קצת נוסטלגי פה. זה אחד האלגוריתמים הראשונים לזיהוי דפוסים שמימשתי מאפס בקולג'.

לפוסט המקורי ↗

💡

תובנה

אלגוריתם בן 90 שנה מזהה AI בסריקה אחת. אולי הבעיה מעולם לא הייתה קשה.

כל הכתבות ←