ג'ים פאן
ג'ים פאן
ג'ים פן @DrJimFan

Senior Research Scientist ב-NVIDIA. חוקר רובוטיקה ו-Foundation Models לעולם הפיזי.

Coding agents ירדו מהמסך ונכנסו לזרועות רובוטיות

עד היום, coding agents חיו בעולם דיגיטלי סגור — כותבים קוד, מריצים טסטים, מתקנים באגים. CaP-X מוציא אותם החוצה: agent שכותב קוד perception ו-control, מריץ על רובוט אמיתי או סימולטור, צופה בתוצאה, ומשפר. זו לא הדגמה — זה framework שלם עם benchmark, שמשחרר NVIDIA עם Berkeley, Stanford ו-CMU ב-MIT license.

המעבר מ-'agent שכותב software' ל-'agent שכותב behavior פיזי' הוא הצעד שתעשיית הרובוטיקה חיכתה לו. זה מתחבר לשיא הייצור של Figure שאדקוק מדווח עליו היום — יותר רובוטים, עכשיו עם יותר intelligence. הבחירה ב-MIT license אינה מקרית: NVIDIA רוצה שכל מפתח רובוטיקה ישתמש ב-CaP-X כ-default stack, בדיוק כמו ש-CUDA הפכה ל-default ב-training.

אם זה יצליח, NVIDIA לא רק מוכרת GPUs — היא מגדירה איך רובוטים לומדים.

ג'ים פאן מכריז על CaP-X — coding agents לרובוטיקה

The power of the Claw, in the palm of a robot hand. Agentic robotics is here! Today, we open-source CaP-X: vibe agents, alive in the physical world. They incarnate as robot arms and humanoids with a rich set of perception APIs, actuation APIs, and auto synthesize skill libraries
הכוח של ה-Claw, בכף ידו של רובוט. רובוטיקה agentic כאן! היום אנחנו משחררים בקוד פתוח את CaP-X: vibe agents שחיים בעולם הפיזי. הם מתגלמים בזרועות רובוטיות והומנואידים עם סט עשיר של perception APIs, actuation APIs, וספריות skills שמסנתזות את עצמן.
לפוסט המקורי ↗
💡
תובנה
CUDA כבשה את ה-training. CaP-X רוצה לכבוש את ה-doing.
כל הכתבות ←