hardmaru
hardmaru
דיוויד הא @hardmaru

ראש מחלקת Research ב-Sakana AI. לשעבר ב-Google Brain. חוקר creativity ב-AI.

Sakana Chat עולה לאוויר — מודל יפני מבוסס DeepSeek שמדבר בגובה העיניים

Sakana AI, הסטארטאפ היפני של hardmaru (David Ha), משיקה את המוצר הצרכני הראשון שלה: Sakana Chat. מתחת למכסה המנוע נמצא Namazu — מודל שמבוסס על DeepSeek-V3.1 עם אימון נוסף (post-training) שמותאם לשימוש יפני. החוכמה כאן היא לא לבנות LLM מאפס אלא לקחת מודל פתוח מצוין ולהפוך אותו למשהו שמתנהג טוב בשפה ובתרבות ספציפית.

חיפוש האינטרנט המובנה מקבל שבחים, והמהירות נשמרת גם אחרי יציאה מבטא. זו אסטרטגיית "localization-first" שעשויה להתאים גם לשפות אחרות.

השקת Sakana Chat עם מודל Namazu

Sakana Chatの公開です!今回開発した「Namazu」モデルは、DeepSeek-V3.1等のオープンLLMに事後学習を適用したものです。優れた性能を維持しながら、日本での利用に適した振る舞いをします。
Sakana Chat יוצא לאור! מודל Namazu שפיתחנו מבוסס על LLMs פתוחים כמו DeepSeek-V3.1 עם post-training. הוא שומר על ביצועים גבוהים תוך התנהגות מותאמת לשימוש ביפן.
לפוסט המקורי ↗
💡
תובנה
העתיד של LLMs הוא לא רק מודלים גדולים יותר — אלא מודלים שמבינים את התרבות שלך.
כל הכתבות ←