
טרייסלופ הכריזה היום על השקת הפלטפורמה שלה לקהל הרחב, לצד סבב גיוס סיד של 6.1 מיליון דולר, בהובלת Sorenson Capital, ו- Ibex Investors, בהשתתפות Samsung NEXT, Y Combinator, ו- Grand Ventures. הסבב נועד להאיץ את פיתוח המוצר, להרחיב את מאמצי החדירה לשוק, להרחיב את צוות הפיתוח, ולתמוך במשימת החברה להפוך מוצרים מבוססי בינה מלאכותית לאמינים יותר ומותאמים לארגונים.
החברה מגייסת למגוון תפקידים בישראל, ביניהם מהנדס למידת מכונה (ML Engineer), מנהל שיווק מוצר (Product Marketing Manager), ומנהל לקוחות (Found Account Executive). לשליחת קורות חיים – jobs@traceloop.com
מדדי האיכות הקיימים של מודלים אינם משקפים באופן מדויק כיצד מודל AI יתפקד כחלק ממוצר מורכב. כיום, חברות המפתחות מוצרים כאלה מזהות טעויות של AI רק כשהמשתמשים שלהם מתלוננים, או באמצעות עבודה ידנית אינסופית. הן משקיעות ימים בשיפור פרומפטים בתהליך מייגע של ניסוי וטעיה. שיטות פיתוח תוכנה מוכרות כמו CI/CD עדיין לא קיימות באייג'נטים מבוססי AI, דבר שגורם לאובדן משתמשים עקב חוסר יציבות והתנהגות בלתי צפויה של מודלי ה-AI.
"פיתוח על בסיס פרומפטים לא צריך להיות משחק ניחושים או להסתמך על 'תחושות בטן' כדי להצליח," אומר ניר גזית, מייסד שותף ומנכ"ל טרייסלופ. "זה צריך להיות כמו כל תחום אחר בהנדסה – בר-תצפית, ניתן לבחינה, ואמין. כשאנחנו מביאים את אותה רמת קפדנות ל- AI כמו לשאר מערכות הפיתוח, אנחנו מממשים את מלוא הפוטנציאל של המודלים הללו."
ספריות ופרוטוקולים חדשים עבור סוכנים שפותחו על ידי OpenAI, Anthropic ו Google -מקלים יותר מתמיד על פיתוח מערכות AI. אך ככל שמערכות אלו הופכות למורכבות יותר, מפתחים נתקלים בשני אתגרים עיקריים. ראשית, העדר שקיפות בנוגע לדרך הפעולה של המודל. שנית, העדר שיטה מהימנה להערכת ביצועים בתנאים מציאותיים. המדדים והבדיקות הקיימים, המבוססים על קריטריונים משתנים ושרירותיים, נכשלים לרוב כאשר עוברים לשלב הפרודקשן. כאשר סוכני AI טועים, בין אם על ידי המצאת נתונים (הזיות או hallucinations), ביצוע פעולות שגויות, או תוצאות בלתי צפויות – המשתמשים אינם מדווחים על תקלות, הם פשוט מפסיקים להשתמש בהם.