Skip to Main Content

HUJI logo Hebrew
רשות הספריות

מדריכים לפי תחומים


בלוג הספרייה: כל מה שחדש בספרייה הרפואית

חדשות ועדכונים על הספרייה הרפואית ועולמות המידענות הרפואית והפרסום האקדמי

בינה והמכונה: מבחן קוגניטיבי למודלים של בינה מלאכותית

by Shalmit Bejarano on 2025-01-01T08:00:00+02:00 | 0 Comments

במאמר בעל הכותרת המסקרנת "Age Against the Machine" שפורסם לאחרונה בכתב העת  BMJ, העלו החוקרים הישראלים רועי דיין ובנימין אוליאל (הדסה והאונ' העברית) וגל קופלביץ (אונ' ת"א) – את השאלה מה יקרה אם ננסה להעביר מודלים של בינה מלאכותית מבחן קוגניטיבי?

המניע מאחורי השאלה נובע מהפרסומים ההולכים וגדלים שבודקים כיצד  מודלים של AI יוכלו להחליף צוות רפואי במגוון תפקידים. אם מכונות יחליפו אנשים, נטען במאמר, מדוע שמכונות לא יבדקו בכלים המעריכים בינה אנושית. לשם כך הם פנו לאחד המבחנים המקובלים לבדיקת הדרדרות קוגניטבית – MOCA (בו נבחן גם ג'ו ביידן לאחרונה, כאשר נאבק בטענות להדרדרותו המנטלית) . "בהינתן שנראה שבינה מלאכותית ערוכה להחליף רופאים לפני שהיא תחליף את מנהיג העולם החופשי, מוטלת עלינו כאנשי מקצוע החובה להעריך את מגבלותיה, ולא רק את הפוטנציאל שלה" הם מעירים. כיוון שאם המודלים אכן יחליפו צוות רפואי, יש צורך לפתח שיטות להערכת הסיכונים הנובעים ממידע רפואי מוטעה שמקורו במודלי שפה גדולים ואת יעילות אמצעי ההגנה במניעת מידע מוטעה כזה.

בניסוי שערכו הם בחנו צ'אטבוטים פופולרים כגון ChatGPT, קלוד וג'מיני, ובאמצעות הנחיות טקסטואלית העבירו אותם סדרה של מבחני קוגניציה מקובלים. ChatGPT 4o השיג את הציון הגבוה ביותר, אם כי כל מודלי השפה הגדולים הראו ביצועים חלשים במטלות ויזואליות-מרחביות/ניהוליות.

מסקנות המאמר: למעט ChatGPT 4o, כמעט כל מודלי השפה הגדולים שנבחנו במבחן MoCA הראו סימנים של ירידה קוגניטיבית קלה. יתר על כן, כמו בבני אדם, גיל הוא גורם מפתח בירידה קוגניטיבית: צ'אטבוטים "מבוגרים" יותר הראו ביצועים טובים פחות במבחן MoCA. לפיכך, טוען המאמר, ממצאים אלה מאתגרים את ההנחה שבינה מלאכותית תחליף בקרוב רופאים אנושיים, שכן הירידה הקוגניטיבית הניכרת של הבינה המלאכותית עשויה להשפיע על אמינותם באבחון רפואי ולערער את אמון המטופלים.

למאמר המלא: https://www.bmj.com/content/387/bmj-2024-081948

 


 Add a Comment

0 Comments.

  Recent Posts



האינטרסים הכלכליים מאחורי OpenEvidence
וובינר - Covidence 101
משאב מחקרי לתקופת ניסיון 1/11/25-31/1/26 - Covidence
קרן אוניברסיטאית לתמיכה במימון פרסומים - תשפ"ו
תערוכת 100 שנים לאוניברסיטה העברית: פריטים מארכיון האוניברסיטה אונליין
פורסמו מדדי הציטוטים המעודכנים לשנת 2024
מבט חדש על פרסום אקדמי – האלטרנטיבה של מכון אסטרה
עד סוף חודש יוני 2025: הזדמנות להתנסות בכלי בינה מלאכותית במאגר web of science
חדש ב-Embase: שילוב תכני ClinicalTrials.gov
 Lancet Primary Care - כתב עת חדש מציע הזדמנות לפרסם ללא דמי עיבוד מאמר
איך נבחרו החוקרים/ות המובילים/ות בעולם ?
איך לנפח מדדי ציטוטים
כיצד ישפיע הקיצוץ בתקציבי ה- NIH על הפרסום האקדמי והספריות ?
פודקאסטים ברפואה פנימית בעברית
NIH  יסירו את חומת התשלום על מחקרים חדשים במימונם
בינה והמכונה: מבחן קוגניטיבי למודלים של בינה מלאכותית
בינה מלאכותית תסייע באיתור משתתפים לניסויים קליניים
סיר הלחץ של הפרסום המדעי  - נתונים כמותיים
מדידת ציטוטים ב"קווים מנחים קליניים" (clinical guidelines) - מדד חדש מבית altmetric
הושקה אפליקציית MICROMEDEX חדשה למכשירים ניידים

  Subscribe



Enter your e-mail address to receive notifications of new posts by e-mail.


  Archive



  Follow Us



  Facebook
  Twitter
  Instagram
  Return to Blog
This post is closed for further discussion.