AI יקר, בן כמה אני נראה לך? || הטעויות של הבינה המלאכותית

חוקרים מאוניברסיטת בן-גוריון בנגב ומאוניברסיטת אונטריו המערבית בקנדה בדקו: האם יש הבדל בין שיפוט אנושי לבין AI וגילו שהבינה המלאכותית סובלת מאותן הטיות הקיימות בשיפוט אנושי של גיל, אך במידה חמורה יותר | המחקר פורסם בכתב העת Scientific Reports

בינה מלאכותית. אילוסטרציה | צילום: whiteMocca, שאטרסטוק

 נראה שהבינה המלאכותית הופכת יותר ויותר שימושית בכל תחום בו שולטת הטכנולוגיה בימינו. בכלל זה, גם אומדן גיל על פי פנים אנושיות. נתון זה עשוי לשמש בעתיד גורמים הדורשים זיהוי גיל, למשל כתנאי כניסה או רכישת אלכוהול.

הערכות האנושיות לגבי גילו של אדם על פי מראה הפנים שלו מתאפיינות באי דיוקים ובהטיות משמעותיות. ככל שהבינה המלאכותית משתלבת בחיינו, בכלל זה גם זיהוי גיל על פי מראה פנים, העלו החוקרים שאלה – האם בינה מלאכותית יכולה להתגבר על הטיות אלו?

החוקרים, פרופ' צבי גנאל מהמחלקה לפסיכולוגיה, פרופ' כרמל סופר מהמחלקה למדעי המוח והקוגניציה, שניהם מאוניברסיטת בן-גוריון בנגב, יחד עם פרופ' מלווין גודייל מאוניברסיטת מערב אונטריו בקנדה, אספו נתונים של ביצועי בינה מלאכותית במהלך השנים 2020–2022. הם סיפקו מערך מייצג של 21 טכנולוגיות בינה מלאכותית מובילות (כמו Microsoft, Amazon,  Everypixel ועוד), מסחריות ולא מסחריות, להערכת גיל מתוך פרצוף. ביצועי הבינה המלאכותית הושוו לביצועים של 30 סטודנטים וסטודנטיות לתואר ראשון מאוניברסיטת בן גוריון בנגב.

התוצאות הצביעו על כך שהבינה המלאכותית פחות מדויקת ויותר מוטה מאשר צופים אנושיים, כאשר שופטים את גילו של אדם. כך לדוגמא, בני האדם נוטים להעריך פרצופים מחייכים כמבוגרים יותר בהשוואה לפרצופים של אותם אנשים עם הבעה ניטרלית, ומדייקים פחות בשיפוטי גיל של פרצופים מבוגרים. טכנולוגיות עכשוויות של בינה מלאכותית מראות את אותן הטיות ואי דיוקים, אך במידה מוגזמת יחסית לבני אדם.

"העניין הגובר בהערכת גיל באמצעות טכנולוגיית בינה מלאכותית (AI) מעלה את השאלה כיצד AI משתווה לביצועים אנושיים והאם הוא סובל מאותן הטיות. השוואת ביצועים האנושיים עם ביצועים של טכנולוגיות הבינה המלאכותית הנחשבות כטובות ביותר הקיימות כיום הצביעה על כך שכל ההטיות ואי הדיוקים האנושיים נמצאים גם ב- AI, אך בצורה חריפה יותר", ציין פרופ' צבי גנאל. "תוצאות אלו מצביעות על כך שההערכות שלנו לגבי הגיל מפרצופים מונעות במידה רבה על ידי רמזים תמונתיים כמו קמטים, פיגמנטציה, צבע שיער ומבנה הפנים, ולא על ידי דעות קדומות או ציפיות".

מעבר לנתונים שהתקבלו מהמחקר, דפוסי השגיאות וההטיות שהתגלו בתוצאות יכולים לספק מספר תובנות לגבי האופן שבו ניתן לשפר טכנולוגיות AI להערכת גיל מפרצופים. "פרצופים מחייכים נתפסים מבוגרים יותר ובאופן פחות מדויק מפרצופים ניטרליים, פרצופי נשים נתפסים באופן פחות מדויק מפרצופי גברים. אלו נתונים שהראינו בעבר אצל נבדקים אנושיים וכעת אנו מבינים שתופעה זו קיימת ובצורה חזקה יותר גם ב-AI, ביחס לנבדקים אנושיים. עם ההבנה הזו ניתן לעשות שימוש יעיל יותר בטכנולוגיות AI  קיימות", סיכם פרופ' גנאל.

כתיבת תגובה