ספר תקצירים - הכינוס השנתי ה 30 של החברה הישראלית לאיכות ברפואה

לבין מומחה בטיפול נמרץ ילדים במענה לשאלות חינוך ChatGPT-4 השוואה בין רפואי מחקר רב-מרכזי מחברים: מחלקת טיפול נמרץ ילדים, בית חולים שניידר לילדים ,ד״ר אביחי וייסבאך מרכז שניידר לרפואת ילדים בישראלד”ר שי יצחקי, בית הספר לרפואה על שם אדלסון, אוניברסיטת אריאל נדב פלד, מחלקת טיפול נמרץ ילדים, בית חולים שניידר לילדים ד״ר איתן קפלן, מחלקת טיפול נמרץ ילדים, בית חולים שניידר לילדיםד״ר גילי קדמון, מחלקת טיפול נמרץ ילדים, בית חולים שניידר לילדיםפרופ׳ אלחנן נחום, המחלקה לסיעוד, אוניברסיטת אריאל ד״ר יוליה גנדלר, רקע: , הוא אחד מהמודלים הבולטים בתחום מודלי השפה Generative Pre-trained Transformer 4 (ChatGPT-4) מודל ). השימוש בהם ככלי עזר לרופאים טומן בחובו פוטנציאל רב, ולכן השוואת ביצועי מודלים אלו מול רופאים LLMs הגדולים ( לספק ChatGPT-4 מומחים היא צעד חשוב לשילובם בתחום הרפואה. המחקר הנוכחי הוא הראשון שבחן את היכולת של ), תחום הדורש ידע ספציפי, הבנה בפיזיולוגיה PICU מענה לשאלות חינוך רפואי פתוחות בתחום הטיפול הנמרץ ילדים ( פדיאטרית וחשיבה קלינית מתקדמת. מטרות/שאלת המחקר: לבין מומחה בטיפול נמרץ Generative Pre-trained Transformer 4 (ChatGPT-4) להשוות בין יכולת המענה של מודל ילדים במענה לשאלות חינוך רפואי פתוחות. שיטת המחקר: שאלות חינוך רפואי שנאספו מקבוצת ווטסאפ ללימוד מתמחים בטיפול נמרץ 100 נערך מחקר השוואתי באמצעות ילדים, אשר כללו שאלות ידע עובדתי ושאלות של חשיבה קלינית. עשרה מומחים בטיפול נמרץ ילדים ממרכזים שלישוניים מול תשובת המומחה המקורית), תוך ChatGPT-4 סטים של תשובות מזווגות (תשובת 20 שונים העריכו באופן עצמאי דירוג עליונות כללית, שלמות, דיוק ופוטנציאל לשילוב של שתי התשובות. תוצאות: חשיבה 102- ידע עובדתי ו 96( הערכות מזווגות 198 לאחר שהוצאה מהמחקר שאלה אחת שדרשה אמצעי חזותי, התקבלו .)p<0.0001 ;41 לעומת 189 : היו ארוכות באופן מובהק ביחס לתשובות המומחה (חציון מילים ChatGPT-4 קלינית). תשובות ), בעוד שבהשוואות p<0.001( מהמקרים 60%- ב ChatGPT-4 בהשוואות ידע עובדתי, העדיפו המעריכים את תשובות הפגין שלמות גבוהה יותר בידע p<0.0001). ChatGPT-4( מהמקרים 67%- חשיבה קלינית העדיפו את תשובות המומחה ב מהמקרים 37%- ). שילוב של שתי התשובות נתפס כרצוי ב p<0.0001( ), אך דיוק נמוך יותר בחשיבה קלינית p=0.02( עובדתי .)31%-44% ,95% (רווח בר סמך מסקנות והמלצות: הראה פוטנציאל משמעותי ככלי לחינוך רפואי בתחומים של ידע עובדתי בטיפול נמרץ ילדים, במיוחד ChatGPT-4 מבחינת שלמות התשובה. עם זאת, הוא דורש פיקוח ובקרה במשימות הדורשות חשיבה קלינית, בהן תשובות המומחים עדיפות. לפיכך, נדרשת ביקורת מומחים טרם שימוש עצמאי במודל במסגרת חינוך רפואי בטיפול נמרץ ילדים ובתחומים רפואיים דומים אחרים שטרם נחקרו בהרחבה.

RkJQdWJsaXNoZXIy MjgzNzA=