שימוש בלמידה חישובית לזיהוי אוטומטי של נושאים חשובים המדוברים בפגישה הטיפולית
שיטות המחקר המסורתיות בתחום הפסיכותרפיה התבססו עד כה בעיקר על עדותם העצמית של המטופלים, והתמקדו במחקר איכותני. לשיטה זו חסרונות מהותיים כמו הקושי מצד המטופלים להעריך אובייקטיבית את מצבם הנפשי, חוסר נכונותם להשלים שאלונים, ומנעד התשובות המוגבל ששאלוני מחקר מאפשרים לאסוף. מעבר לזאת, בפני אלה שרצו לבצע מחקר כמותני מעמיק, עמד מחסום: הצורך לקודד או לעבד שעות רבות של שיחות בין המטפל למטופל באופן ידני לפורמט שיתאים למחקר כמותני.
מחקר פורץ דרך, שנערך במעבדה לפסיכותרפיה באוניברסיטת בר-אילן בהובלת פרופ' דנה אציל-סלונים, מראה כיצד אפשר להשתמש בטכנולוגיות מתקדמות מעולם הלמידה החישובית כדי לנתח באופן אוטומטי את הטקסט הטיפולי ולסייע לשפוך אור על דקויות חשובות שעד כה נותרו סמויות מהעין.
מטרת המחקר: לבחון מהם נושאי השיחה המנבאים תוצאות ותהליכים מוצלחים בטיפול
החוקרים השתמשו בטופיק מודלינג, שיטה ממוחשבת לזיהוי אוטומטי של נושאים מתוך טקסט, על מנת לזהות את נושאי השיחה במהלך פסיכותרפיה ולבחון אילו נושאים מנבאים שניים מהמשתנים הנחקרים ביותר בתחום הפסיכותרפיה:
1. רמות התפקוד של המטופל
רמות התפקוד של המטופל הן כלי שיכול לשמש להערכת תוצאות הטיפול הפסיכותרפי ולמתן משוב למטפלים. רמות התפקוד נקבעות בדרך כלל בהתבסס על שאלונים שאותם ממלא המטופל לפני פגישה הטיפול ואחריה.
2. קרעים בברית הטיפולית
מחקרי פסיכותרפיה רבים מראים כי איכות הקשר הטיפולי בין המטופל למטפל היא אחד המשתנים העיקריים המנבאים את הצלחת הטיפול. קשר זה, המכונה "הברית הטיפולית", כולל תנועה מתמדת בין "קרעים", מתחים ואי-הסכמות ובין פתרון אותם קרעים ומתחים והגעה להסכמה, להבנה ולסנכרון בין המטופל למטפל.
המחקר בדק אילו מנושאי השיחה שעלו במהלך טיפול פסיכותרפי יכולים לשמש לזיהוי מיטבי של רמות התפקוד של המטופל ושל קרעים בברית הטיפולית במהלך פגישות הטיפול, וכמו כן אם יש קשר בין השינויים בנושאי השיחה ובין תוצאות הטיפול.
החוקרים התבססו על שתי השערות מחקר: האחת, שזיהוי נושאי השיחה יוכל לשמש לזיהוי הן של רמות התפקוד של המטופל והן של קרעים בברית הטיפולית; והשנייה, שהשינויים בנושאי השיחה לאורך הטיפול יהיו קשורים לתוצאות הטיפול וכתוצאה מכך, דפוס שונה של נושאי שיחה יתגלה במהלך טיפול מוצלח ובמהלך טיפול פחות מוצלח.
איסוף הנתונים: המעבדה המחקרית בקליניקה הקהילתית
המחקר הנוכחי התבסס על תיעוד של 873 מפגשי טיפול שבועיים בקליניקה עם 58 מטופלים ו-52 מטפלים. ההקלטות תומללו ידנית והתיעוד הסתכם ביותר מ-5 מיליון מילים, שאותן היה צריך לקודד, לעבד ולנתח.
המשתתפים היו כולם מעל גיל 18, ומרביתם היו נשים (58.9%). האבחונים הקליניים התבססו על ראיון אבחון נוירו-פסיכיאטרי לפי ציר 1 של המהדורה הרביעית של ה-DSM.
נוסף על תוכן פגישות הטיפול, החוקרים השתמשו בכמה כלים על מנת לעקוב אחר התקדמות המטופלים ואחר משוב המטפלים:
1. סולם דירוג התוצאות (ORS) – כלי המבוסס על דירוג שנותנים המטופלים לרמות התפקוד שלהם על פני ארבעה תחומים – האישי, המשפחתי, החברתי והכללי. הצלחה בטיפול, כפי שהוגדרה במחקר זה ובמחקרים אחרים, היא עלייה של 5 נקודות או יותר בסולם ה-ORS בהתאם לדיווחו העצמי של המטופל.
2. שאלוני סוף פגישה (PSQ) למטפלים – זיהוי קרעים בברית הטיפולים התבצע לאחר כל פגישה על ידי משוב שסיפקו המטפלים (שאלון PSQ). שאלון זה הוא כלי שנמצא בשימוש נפוץ במחקרי פסיכותרפיה, והוכח כבעל יכולת לניבוי מצבים ותהליכים שונים.
3. רשימת הבדיקה המקוצרת של הופקינס לסימפטומים – את חומרת התסמינים הנפשיים שחווה המטופל בחנו החוקרים באמצעות שאלון שבועי בן 11 סעיפים.
עיבוד הנתונים: זיהוי, הגדרה וסינון
עיבוד הנתונים הצריך שילוב בין אסטרטגיות מחקר לבינה מלאכותית, שיאפשר ליצור מתוך חומרי הגלם רשימות של נושאי שיחה לזיהוי.
כדי לזהות באופן אוטומטי נושאי שיחה (Topics), יש לצמצם את מיליוני המילים בחומר הגלם לקטגוריות בעלות משמעות סמנטית. זאת עשו החוקרים בעזרת כלי בינה מלאכותית המגבשים קבוצות מילים באופן אוטומטי לפי קטגוריות שגם הן נלקחות מתוך הטקסט עצמו. אחד היתרונות המשמעותיים של אסטרטגיה זאת הוא היכולת שלה לצמצם את הנתונים הטקסטואליים לכדי טבלת נושאים, לקשר בין פגישות טיפוליות ובין הנושאים שמאפיינים אותן, ולספק תמונת התקדמות דינמית של הנושאים כפי שהם משתנים מפגישה לפגישה לאורך הטיפול.
על מנת לעבד את הנתונים נדרש תהליך של עיבוד מוקדם שכלל השמטת מילים ריקות ממשמעות סמנטית, מילים נדירות ומילים שאינן אינפורמטיביות. היות וניתוח המבוסס על שיעור גבוה של מילים נדירות או מיוחדות יכול לפגוע בארגון הנושאים ולהוביל לתוצאות שקשה לפרשן באופן סמנטי, השמיטו החוקרים מילים המופיעות פחות מ-10 פעמים במאגר הנתונים הכולל. באופן דומה, גם מילים נפוצות, שנמצאו ביותר מ-90% מהמסמכים הושמטו, הואיל והן יימצאו במרבית הנושאים וידללו את הייחוד הלשוני שלהם.
החוקרים עשו שימוש בטופיק-מודלינג על מנת לזהות באופן אוטומטי את נושאי השיחה. לצורך כך החוקרים הגדירו מראש את מספר הנושאים, ה-K, תוך הזנה של מספר ערכים מקובלים של K –
(50, 100, 200, 300) ובחינה של תוצאות התפלגות נושאי השיחה. על מנת למצוא מספר שיפיק רשימת נושאים רלוונטית, בחנו החוקרים אם הגדרת ה-K מפיקה מספר קטן מדי של נושאי שיחה לכל טקסט, או שיעור גדול של מילים שמיוחסות לנושאי שיחה מרובים על פני הטקסט, שמצביע על כך שמספר ה-K הוגדר גבוה מדי. באופן זה, גילו החוקרים כי הגדרת ה-K בערך של 200 הניבה את התוצאות הברורות ביותר לניתוח.
בהתאם, ניתחו החוקרים את המסמכים לפי מודל הסתברויות. באופן זה, הפיק המודל הממוחשב טבלה בת 200 נושאי שיחה, שבה כל נושא שיחה מהווה קבוצה של מילים שהופיעו במסמך. המילים שהופיעו בכל נושא היו קשורות סמנטית ורלוונטיות לתוכן השיחה ולנושאים שעלו בטיפול, מה שהעיד על למידת מכונה מוצלחת של הטקסטים.
לאחר שלב העיבוד בעזרת למידת מכונה, הגיעו החוקרים למצב שבו הם יכולים לבחון את השערות המחקר שהעלו.
שלב התוצאות – השערת המחקר הראשונה
השערת המחקר הראשונה ביקשה למצוא קשר בין טבלת נושאי השיחה שהציע המחשב באופן אוטומטי ובין רמות התפקוד של המטופלים וקרעים בברית הטיפולית. בהתאם להשערה זו, אכן מצאו החוקרים קשר בין שינויים בנושאי השיחה ובין רמות התפקוד, כאשר עלייה בנושאים שביטאו רמות תפקוד גבוהות (שקובצו תחת "חוויה חיובית") נקשרה לירידה בחומרת התסמינים של המטופל. עלייה בנושאים שמזוהים עם קרעים בברית הטיפולית (שקובצו תחת "טיפול") זוהו עם החמרה בחומרת התסמינים שעליהם דיווחו המטופלים.
המודל הממוחשב הצליח לחזות נכונה את רמות התפקוד של המטופל על בסיס נושאי השיחה שעלו ב-75% מהמקרים, ולחזות קרעים בברית הטיפולים ב-65% מהמקרים.
תוצאות המחקר עשויות לשפוך אור על מושגים ורעיונות שקשורים לתפקוד המטופל. לדוגמה, ארבעת הנושאים שנקשרו בתדירות הגבוהה ביותר לתפקוד נמוך הם בדידות, סבל, קשיים גופניים וכעס, והם קשורים כולם לחוויות שנתפסות כשליליות. לעומת זאת, נושאי שיחה שנמצאו קשורים לתפקוד גבוה הם הנאה, פנאי, חוויה, חגיגה ובחירה, והם קשורים כולם לחוויות שנתפסות כחיוביות.
את הצלחתו של המודל הממוחשב אפשר לראות גם בארבעת הנושאים שנמצאו קשורים במידה הרבה ביותר לקרעים בברית הטיפולית – תקשורת, הצבת יעדים, צורך בעזרה, בעיות. ממצא זה מתאים לתיאורים הקודמים בספרות המחקרית ולמאפייני הברית הטיפולית. יש לזכור כי נושאי שיחה אלה נמצאו באופן אוטומטי, מה שממחיש שוב את יכולת המודל הממוחשב לזהות היבטים משמעותיים של המפגש הקליני.
שלב התוצאות – השערת המחקר השנייה
השערת המחקר השנייה ביקשה לבדוק את האופן שבו קשורים נושאי שיחה שעלו במהלך הטיפול אל תוצאות הטיפול עצמן. החוקרים עשו זאת על ידי השוואה בין טבלאות נושאי השיחה של המחשב לבין שאלוני חומרת התסמינים שמילאו המטופלים וגם לבין המשובים שסיפקו המטפלים.
החוקרים לא מצאו קשר ישיר בין נושאים ספציפיים ובין תוצאות הטיפול, אך בהתאם להשערת המחקר, מצאו כי השינויים במסלולם של נושאי השיחה התבטאו גם בשינויים בחומרת התסמינים שעליהם העידו המטופלים לאורך מסלול הטיפול.
ביתר פירוט, הממצאים מראים כי עליה במספר נושאי שיחה שמבטאים רמות תפקוד גבוהות וקשורים לחוויות חיוביות התבטאו גם בירידה בחומרת התסמינים. אף כי במודלים קלאסיים רבים של פסיכותרפיה עיקר הדגש מושם על יכולתו של המטופל להתמודד עם חוויות שליליות ומכאיבות, בשנים האחרונות גוברת המודעות לכך שלהרחבת יכולת המטופל לחוות הן רגשות חיוביים והן שליליים יש השפעה תרפויטית.
מהמעבדה המחקרית לתובנות מעשיות: יישום הממצאים על שני מקרי בוחן
לבסוף, כדי להמחיש את השימוש במודלים של נושאי שיחה בידי קלינאים וחוקרים, בחנו החוקרים את הקשרים בין נושאי השיחה ובין רמות התפקוד והקרעים בברית הטיפולית לאורך מסלול הטיפול של מקרה אחד שרשם תוצאות טובות ומקרה אחד שלא רשם תוצאות טובות.
לשם כך, בחנו החוקרים את השינוי בהופעת נושאי השיחה לאורך מסלול הטיפול. כאן, גילו החוקרים כי במקרה של טיפול מוצלח, נושאי שיחה שביטאו רמות תפקוד נמוכות הלכו ופחתו במהלך מסלול הטיפול, ואילו נושאי שיחה שביטאו רמות תפקוד גבוהות הלכו והתגברו.
לעומת זאת, במקרה של טיפול לא מוצלח, נושאי שיחה שביטאו רמות תפקוד נמוכות הלכו והתרבו במהלך הטיפול, ואילו נושאי שיחה שביטאו רמות תפקוד גבוהות כלל לא עלו.
מההיבט של קרעים בברית הטיפולית, הרי במקרה של טיפול מוצלח זיהו החוקרים דפוס שבו נושאי שיחה שמזוהים עם קרעים בברית הטיפולית עלו בשלבי האמצע של הטיפול, אך היו נמוכים בתחילת מסלול הטיפול ובסופו.
לעומת זאת, במקרה של טיפול לא מוצלח, נושאי שיחה שמבטאים קרעים בברית הטיפולים היו נוכחים באופן בולט וחזרו שוב ושוב במהלך מסלול הטיפול.
השורה התחתונה:
שימוש בטכנולוגיות למידת מכונה מתקדמות הוא היבט חדש יחסית בתחום מחקרי הפסיכותרפיה, ולאחרונה הולכות ומצטברות העדויות לערך שיש להטמעת טכנולוגיות אלה בתחום המחקר בפסיכותרפיה על מנת להרחיב את ההבנה של המנגנונים המקדמים שינוי חיובי בטיפול.
במחקר הנוכחי, הראו החוקרים מאוניברסיטת בר-אילן, בהובלת פרופ' דנה אציל-סלונים, כי אפשר לזהות באופן אוטומטי את נושאי השיחה המדוברים במהלך טיפול וכי נושאים אלה יכולים לשמש לניבוי תהליכי הטיפול ותוצאותיו.
תאריך עדכון אחרון : 29/12/2022