בתחום הבינה המלאכותית (AI), הזיה או הזיה מלאכותית (נקראת גם קונפאבולציה[1] או אשליה[2]) היא תגובה שנוצרת על ידי AI המכילה מידע שקרי או מטעה המוצג כעובדה.[3][4] המונח הזה נלקח בצורה רופפת מהפסיכולוגיה האנושית, שבה הזיה כרוכה בדרך כלל בתפיסות שווא. עם זאת, יש הבדל מרכזי: הזיות AI קשורות לתגובות או אמונות לא מוצדקות ולא לחוויות תפיסתיות.[4]
לדוגמה, צ'אטבוט המופעל על ידי מודלים של שפות גדולות (LLMs), כמו ChatGPT, עשוי להטמיע טעויות אקראיות, שנשמעות סבירות בתוך התוכן שנוצר. חוקרים זיהו את הנושא הזה, ועד שנת 2023, אנליסטים העריכו שצ'אטבוטים הוזים עד 27% מהמקרים, עם טעויות עובדתיות ב-46% מהתגובות שלהם. זיהוי והפחתה של הזיות אלו מציבים אתגרים משמעותיים לפריסה מעשית ואמינות של LLMs בתרחישים בעולם האמיתי.[5][6][7] כמה חוקרים מאמינים שהמונח הספציפי "הזיית בינה מלאכותית" גורם להאנשה בלתי סבירה של מחשבים.[1]
מקור המונח
בתחילת שנות ה-2000, נעשה שימוש במונח "הזיה" בראייה ממוחשבת עם הקשר חיובי כדי לתאר את תהליך הוספת הפרטים לתמונה. לדוגמה, המשימה של יצירת תמונות פנים ברזולוציה גבוהה מקלט ברזולוציה נמוכה נקראת הזיית פנים.[8][9]
בסוף שנות ה-2010, המונח עבר שינוי סמנטי כדי לציין יצירת פלטים שגויים או טעויות עובדתית על ידי מערכות AI במשימות כמו תרגום או זיהוי אובייקטים.[8] לדוגמה, בשנת 2017, חוקרי גוגל השתמשו במונח כדי לתאר את התגובות שנוצרו על ידי מודלים של תרגום מכונה עצבית (NMT) כאשר הן אינן קשורות לטקסט המקור,[10] ובשנת 2018, המונח שימש בראייה ממוחשבת לתיאור מקרים שבהם אובייקטים שאינם קיימים מזוהים בטעות בגלל התקפות יריבות.
המונח "הזיות" בבינה מלאכותית זכה להכרה רחבה יותר במהלך בום הבינה המלאכותית, לצד השקת צ'אטבוטים בשימוש נרחב המבוססים על מודלים של שפה גדולה (LLMs). ביולי 2021, Meta הזהירה במהלך שחרורו של BlenderBot 2 כי המערכת מועדת ל"הזיות", שמטא הגדירה כ"הצהרות בטוחות שאינן נכונות".[11][12] לאחר שחרורו של ChatGPT של OpenAI בגרסת בטא בנובמבר 2022, חלק מהמשתמשים התלוננו שצ'אטבוטים כאלה מטמיעים לעיתים קרובות טעויות אקראיות שנשמעות סבירות בתוך התוכן שנוצר.[13] כלי חדשות רבים, כולל הניו יורק טיימס, החלו להשתמש במונח "הזיות" כדי לתאר את התגובות השגויות או הבלתי עקביות של המודל הזה מדי פעם.[14]
בשנת 2023, כמה מילונים עדכנו את ההגדרה שלהם להזיה כדי לכלול משמעות חדשה ספציפית לתחום הבינה המלאכותית.[3]
בעיבוד שפה טבעית
בעיבוד שפה טבעית, הזיה מוגדרת לעיתים קרובות כ"תוכן שנוצר שנראה עובדתי אך אינו מבוסס".[15] ישנן דרכים שונות לסווג הזיות. בתלות האם הפלט סותר את המקור או שלא ניתן לאמת אותו מהמקור, ההזיות מחולקות למקוריות וחיצוניות, בהתאמה.[4] בתלות האם הפלט סותר את ההנחיה או לא, ניתן לחלק את ההזיות להזיות תחום-סגור והזיות תחום-פתוח בהתאמה.
גורמים
ישנן מספר סיבות לכך שמודלים של שפה טבעית הוזים נתונים.[4]
הזיות מנתונים
הסיבה העיקרית להזיה מהנתונים היא התבדלות מקור-הפניה. סטייה זו מתרחשת 1) כתוצר-לוואי של איסוף נתונים היוריסטיים או 2) עקב האופי של כמה משימות NLG המכילות בהכרח סטייה כזו. כאשר מודל מאומן על נתונים עם סטייה ממקור-הפניה (יעד), ניתן לעודד את המודל ליצור טקסט שאינו בהכרח מבוסס ואינו נאמן למקור שסופק.[4]
הזיה מהמודל
הוכח שהזיות הן תוצר לוואי בלתי נמנע מבחינה סטטיסטית של כל מודל ג'נרטיבי לא מושלם שאומן למקסם את הסבירות לאימון, כגון GPT-3, ודורש להימנע מלמידה אקטיבית (כגון למידת חיזוק ממשוב אנושי). מחקר אחר נוקט בפרספקטיבה אנתרופומורפית ומעמיד הזיות כנובעות מבעיית איזון בין חדשנות ושימושיות. לדוגמה, תרזה אמביל ופרט מגדירים את היצירתיות האנושית כייצור של רעיונות חדשניים ושימושיים.[16] התמקדות בחדשנות ביצירתיות של מכונה יכולה להוביל לייצור של תגובות מקוריות אך לא מדויקות, כלומר שקר, בעוד שהתמקדות בתועלת יכולה לגרום לתגובות בלתי יעילות שנשמעות כאילו שוננו בעל פה.[17]
שגיאות בקידוד ופענוח בין טקסט לייצוגים עלולות לגרום להזיות. כאשר מקודדים לומדים את המתאמים השגויים בין חלקים שונים של נתוני האימון, זה עלול לגרום לדור שגוי החורג מהקלט. המפענח לוקח את הקלט המקודד מהמקודד ומייצר את רצף היעד הסופי. שני היבטים של פענוח תורמים להזיות. ראשית, מפענחים יכולים לטפל בחלק הלא נכון של מקור הקלט המקודד, מה שמוביל ליצירה שגויה. שנית, עיצוב אסטרטגיית הפענוח עצמו יכול לתרום להזיות. אסטרטגיית פענוח המשפרת את גיוון הדור, כגון דגימה של top-k, נמצאת בקורלציה חיובית עם הזיה מוגברת.[דרוש מקור][ <span title="This claim needs references to reliable sources. (March 2024)">צריך ציטוט</span> ]
^Tonmoy, S. M. Towhidul Islam; Zaman, S. M. Mehedi; Jain, Vinija; Rani, Anku; Rawte, Vipula; Chadha, Aman; Das, Amitava (2024-01-08), A Comprehensive Survey of Hallucination Mitigation Techniques in Large Language Models, arXiv:2401.01313
^Amabile, Teresa M.; Pratt, Michael G. (2016). "The dynamic componential model of creativity and innovation in organizations: Making progress, making meaning". Research in Organizational Behavior. 36: 157–183. doi:10.1016/j.riob.2016.10.001.