הבקשה נשמעת פשוטה להפליא: “תן לי מספר רנדומלי בין 1 ל־50”. אבל גולשים ברחבי הרשת החלו לשים לב שכששואלים את ChatGPT את הבקשה הזו, התשובה שצצה שוב ושוב היא אחד מהמספרים 27, 37 או 43. לא מדובר במקרה בודד או בצירוף מקרים, אלא בתופעה שמתרחבת כמו אש בשדה קוצים: משתמשים משתפים צילומי מסך דומים להפליא, כשהתשובות הזהות הללו חוזרות במפתיע על עצמן בכל פעם שהשאלה נשאלת.
אז מה באמת קורה כאן? האם הבינה המלאכותית של OpenAI בוחרת מספרים באקראי – או שמא קיימת העדפה סמויה שמובילה לאותם ערכים מוכרים? האם מדובר באשליה סטטיסטית או בכשל עיצובי עמוק יותר?
ברגע שמתחילים לבדוק את התופעה, קשה להתעלם מהחזרתיות. לא מדובר ב־1 או 49, גם לא ב־7 הקלאסי שזוכה לפופולריות במשחקי מזל. המספרים שחוזרים יותר מכל – כמעט כאילו מדובר בקוד סודי – הם 27, 37 ו־43.
מספר משתמשים אף ערכו ניסויים משלהם: שאלו את GPT את אותה שאלה שוב ושוב, ב־20 או 50 ניסיונות חוזרים, וגילו שבמקרים רבים אותם מספרים צצים בשכיחות גבוהה משמעותית מכל שאר המספרים בטווח. זו כבר לא רק סקרנות אלא דפוס מובהק.
אז למה זה קורה? הסיבה לכך נעוצה באופן שבו עובדת בינה מלאכותית שפתית. מודלים כמו GPT לא כוללים מנגנון רנדומלי אמיתי כמו זה שמשתמש במחולל מספרים אקראי. במקום זאת, כל תשובה נוצרת על פי הסתברויות שנלמדו מראש מהמאגר עליו אומן המודל.
כאשר מבקשים “תן לי מספר רנדומלי בין 1 ל־50”, אין כאן הוראה קונקרטית לבצע פעולה חישובית אקראית אלא הנחיה ניסוחית, שנענית על סמך מה ש־GPT למד שהכי שכיח שנכתב אחריה. כלומר, אם במסד הנתונים עליו הוכשר המודל מופיעים פעמים רבות משפטים עם “תן לי מספר בין 1 ל־50” שהתשובה להם היא 27 – המודל ילמד שזה מספר “טבעי” לספק בהקשר זה.
בנוסף לכך, ישנה תופעה ידועה בפסיכולוגיה ובמדעי המחשב של “העדפה אוטומטית לאמצע” – אנשים (ואולי גם מודלים) נוטים לבחור ערכים שאינם קצה, אלא קרובים למרכז, מה שמסביר את הבחירה ב־27 או 37 על פני מספרים נמוכים או גבוהים מאוד.
זוהי לא הפעם הראשונה שבה נשאלת השאלה האם GPT באמת “אקראי”. תופעות דומות נצפו גם בבקשות יצירת שמות לעסק, כתיבת סיסמה רנדומלית, או אפילו ניסוחים רומנטיים. לדוגמה, כשמתבקשת בינה מלאכותית להמציא שמות למוצרים, היא נוטה לחזור על קומבינציות מוכרות כמו “Nova”, “Zen”, או “Lux”, למרות שלכאורה מדובר בבחירה חופשית ויצירתית.
באותה מידה, בקשות כמו “כתוב שיר אהבה מקורי” או “מצא שם ייחודי לאפליקציה להיכרויות” מובילות לתבניות דומות ולעיתים לתשובות שחוזרות על עצמן עם וריאציות קלות. גם כאן, GPT שואבת מהסטטיסטיקה של מה שראתה הכי הרבה – לא מהשראה אלוהית.
הפתרון האמיתי למי שמעוניין במספר אקראי לחלוטין הוא להשתמש בפקודת קוד או בשירות צד שלישי שמשלב אלגוריתמים מבוססי אקראיות. OpenAI אפילו שילבה בגרסאות מתקדמות אפשרות לשימוש בכלים חיצוניים (כמו Python או WolframAlpha), שיכולים ליצור רנדומליות מבוססת אלגוריתם מתמטי.
למשל, אם תכתבו ל-GPT:
“השתמש בקוד פייתון כדי להחזיר מספר אקראי בין 1 ל־50” אזי יתקבל מספר אמיתי שאינו תוצאה של למידה סטטיסטית אלא של פונקציה מתמטית אקראית אמיתית.
למרות שזה עשוי להיראות כתעלומה או באג, מדובר בהתנהגות צפויה של מערכת שמתבססת על הסתברויות לשוניות. הבקשה “תן לי מספר רנדומלי” מפורשת פשוט כהזדמנות לתת את המספר שהכי סביר שיופיע לאחר אותה שורה וזהו. אז בפעם הבאה שתשאלו את GPT איזה מספר הוא בוחר, אל תופתעו אם הוא שוב יאמר: 27. או 37. או… נכון: 43.