ניתוח חישובי של שיח המדיניות על אסדרת רשתות חברתיות ותוכן פוגעני בישראל בשנת 2022

I. רקע ומטרות המחקר

ביום 13 באוקטובר 2021 הקים שר המשפטים את הוועדה להתאמת המשפט לאתגרי החדשנות והאצת הטכנולוגיה, במטרה לגבש אמצעים וצעדים שונים לצמצום הפער ההולך וגדל בין ההתפתחויות הטכנולוגיות לבין ההסדרים הרגולטוריים והמשפטיים בישראל. ביום 14.3.2022, פרסמה הוועדה קול קורא להתייחסות הציבור בתחום הפרסומים הפוגעניים במרחב הדיגיטלי, לרבות לגבי הדרכים שבהם תכנים פוגעניים במרחב הדיגיטלי עלולים לפגוע במשתמשים ובציבור והאופן בו המשפט והרגולציה יכולים לספק מענה לאתגרי התוכן השונים ברשתות החברתיות ופלטפורמות מקוונות. במענה לקול הקורא, הוגשו התייחסויות 16 התייחסויות מגורמים שונים, כגון חברות הטכנולוגיה המפעילות את הפלטפורמות הדומיננטיות בישראל, ארגוני חברה אזרחית וגורמים מסחריים אחרים.

על בסיס מכלול ההתייחסויות הציבוריות שהוגשו במענה לקול הקורא, איגוד האינטרנט הישראלי והמעבדה למדעי הרוח הדיגיטליים באוניברסיטה העברית ביצעו מחקר חישובי המאפשר למפות ולנתח את התוכן ששחקנים שונים בזירה הציבורית יוצקים לבעיה הרגולטרית של "פרסומים פוגעניים רשתות חברתיות", וזיהוי הנושאים בהם צריכה האסדרה הישראלית להתרכז. 

II. מתודולוגיה

II.א קורופוס המחקר: מיפוי ההתייחסויות שהוגשו לוועדה

לקול הקורא שפרסם משרד המשפטים הוגשו 16 התייחסויות, מטעם סוגים שונים של גופים מסחריים וארגוני חברה אזרחית:

מגזר פרטי: חברות הטכנולוגיה הגלובליות (מפוקחות פוטנציאליות)

Meta: התייחסות בהיקף של של 7645 מילים בשפה העברית. 

TikTok: התייחסות בהיקף של של 5685 מילים בשפה האנגלית.

Google: התייחסות בהיקף של של 5556 מילים בשפה העברית, עליה חתומה נועה אלפנט לפלר, מנהלת בכירה למדיניות ציבורית וקשרי ממשל.

Twitter: התייחסות בהיקף של של 2168 מילים בשפה האנגלית. 

מגזר פרטי: בעלי עניין נוספים

שידורי קשת בע"מ ורשת מדיה בע"מ (ביחד- הערוצים המסחריים): התייחסות  בהיקף של 3846 מילים בשפה העברית, עליה חתומות עורכות דין ממשרד קריספין, רובינשטיין, בלכר. 

U.S Chamber of Commerce: התייחסות בהיקף של של 1214 מילים בשפה האנגלית, עליה חתום Josh Kram, ועדת הסחר הישראלית- אמריקאית בלשכת הסחר האמריקאית. 

משרד עורכי דין עמית, פולק מטלון: התייחסות  בהיקף של 982 מילים בשפה העברית, עליה חתומים עו"ד הילה שרייבמן, שותפה, ועו"ד איתמר בן דוד. 

ארגון זיר"ה: התייחסות  בהיקף של 951 מילים בשפה העברית, עליה חתומה מיכל פליישר, יו"ר הארגון. 

ארגוני חברה אזרחית

איגוד האינטרנט הישראלי והמכון הישראלי לדמוקרטיה: התייחסות בהיקף של 7509 מילים בשפה העברית עליה חתומים אסף וינר, סמנכ"ל רגולציה ומדיניות באיגוד האינטרנט הישראלי ותהילה שוורץ-אלטשולר עמיתה בכירה וראש התוכנית לדמוקרטיה בעידן המידע במכון הישראלי לדמוקרטיה ,וחברה בצוות המייעץ של משרד התקשורת. 

תכלית – המכון למדיניות ישראלית: התייחסות בהיקף של 6871 מילים בשפה העברית עליה חתום  אלעד גיל, עמית בכיר וראש המחקר במכון תכלית, מרכז פדרמן לחקר הסייבר, האונ’ העברית. 

המועצה הלאומית לשלום הילד: התייחסות בהיקף של 5324 מילים בשפה העברית. 

איגוד מרכזי הסיוע לנפגעות תקיפה מינית ולנפגעי תקיפה מינית בישראל: התייחסות בהיקף של 2411 מילים בשפה העברית. 

עמותת מגן לנפגעי טרור: התייחסות בהיקף של 1911 מילים בשפה העברית. 

אעלאם – המרכז הערבי לחירות המדיה, פיתוח ומחקר: התייחסות בהיקף של 1175 מילים בשפה העברית. 

יסוד – עמותה לקידום זכויות יסוד: התייחסות בהיקף של 937 מילים בשפה העברית עליה חתומה ליאת כהן, מנכ"לית העמותה.  

ארגון העיתונאים והעיתונאיות: התייחסות בהיקף של 814 מילים בשפה העברית, עליה חתומה ענת סרגוסטי, מנהלת תחום חופש העיתונות בארגון.

II.ב תהליך העיבוד וניתוח

לצורך ניתוח קורפוס ההתייחסויות, פיתחנו גישה חישובית של קריאה בקנה מידה גדול, המבוססת על אלגוריתם מידול נושאי (topic modeling). מידול נושאי הינו אלגוריתם למידת מכונה המאפשר לזהות את הנושאים מהם מורכב קורפוס טקסט מסוים, במקרה שלנו התייחסויות שהוגשו לועדת דוידי, כאשר ״נושא״ הוא קבוצת מילים אשר מבחינה סטטיסטית נוטה להופיע יחד במסמכים עליהם התאמן המודל. 

 יתרון מרכזי במידול נושאי הוא סדר הפעולה של המודל: ראשית המכונה מזהה את הנושאים המרכיבים את הטקסטים בקורפוס – וזאת מבלי שהחוקרים מגדירים עבור המכונה את הקטגוריות הרצויות מראש (אלא רק את מספר הנושאים המבוקש) ורק לאחר שמודל למידת המכונה זיהה את הנושאים המרכיבים את הקורפוס, החוקרים יכולים לפרש את הנושאים ולהציג את התוצאות בהקשרן. מסיבה זאת, מידול נושאי מתאים במיוחד לניתוח נרטיבים מורכבים, דוגמת ההתייחסויות שהגישו הגופים השונים: האלגוריתם מאפשר לסווג מספר רב של נתונים, תוך התערבות אנושית מזערית, ובעיקר ללא רדוקציה של הטקסט לצרכי קידודו.  באופן זה, המודל החישובי אינו מבוסס על הטיות מחקריות מוקדמות לגבי מה הנושאים שמרכיבים את הטקסטים ״אמורים להיות״. 

גישת הקריאה בקנה מידה גדול מאפשרת לנו אם כן לעבד ולשפוך אור על כמות עצומה של נתונים טקסטואליים מורכבים מבלי להזדקק לניתוח פרטני של כל אחד מהטקסטים. המודל בו אנו משתמשים מחבר בין גישות הומניסטיות מוכרות של קריאה קרובה, איכותנית  עם קריאה חישובית מרחוק של מכלול הקורפוס. 

  • בשלב ראשון, נזהה את הנושאים העיקריים העולים ממאגר הטקסטים, באופן שיספק לנו סקירה שיטתית של הנושאים בהם עסקו ההתייחסויות שהונחו בפני הוועדה. לאחר תהליך הרצה לפי מספר משתנה של נושאים, קבענו את מספר הנושאים שהמודל יוציא כפלט על שמונה נושאים. 

  • בשלב שני, נעבור מרמת הקורפוס לרמת הנושא, ונזהה עבור כל נושא את קבוצת הדוברים המזוהה ביותר עם אותו נושא. מטרת השלב השני היא לקדם את הבנתנו מי מתייחס לכל אירוע. 

בשלב השלישי, נשווה בין ההתייחסויות השונות על יסוד ההרכב הנושאי של כל אחת, כך שנוכל להצביע על קווי דמיון ושוני בין עמדות הגופים השונים. לצורך כך, חישבנו את מידת הדמיון בין ההתפלגויות בעזרת מדד  Kullback-Leibler divergence שמודד את ההפרש שבין שתי התפלגויות. 

III. ממצאים ומסקנות

III.א איזה נושאים מובחנים מרכיבים את השיח הציבורי על אסדרת רשתות חברתיות ותוכן פוגעני? 

בשלב הראשון, הניתוח החישובי שלנו זיהה את 8 הנושאים הבולטים ביותר בהתייחסויות שהוגשו לקול הקורא על ידי המגזר הציבורי, הפרטי וארגוני החברה האזרחית:

  • הגודל והגלובליות של מפעילות פלטפורמות ושירותים מקוונים כבסיס לרגולציה ( להלן ״גודל וגלובליות״) 

מילות מפתח שזוהו על ידי המודל כמרכיבות את נושא זה:  שוק פלטפורמה רגולציה מפעיל ענק גוגל יצירה גדל גלובלי שרות

  • שקיפות כמרכיב של האינטרס הציבורי בעיצוב המלצות הוועדה (להלן ״שקיפות״) 

מילות מפתח שזוהו על ידי המודל כמרכיבות את נושא זה: שקיפות אינטרס מודל רגולציה אסדר עמדה ועדה שקל משפט 

  • עבירות הפצה של תכנים מיניים ומנגנוני האכיפה והאסדרה של הפלטפורמות כנגדן (להלן ״עבירות מין״) 

מילות מפתח שזוהו על ידי המודל כמרכיבות את נושא זה: תכן פרסום מיני מין הפצה הסרה סרטון בצע עברה יוטיוב

  • מאפייני המרחב המקוון עבור ילדים ונוער בסביבה המקוונת כבסיס לעיצוב המלצות הוועדה (להלן ״צרכי ילדים ונוער״)

מילות מפתח שזוהו לנושא זה: ילד מקוון מרחב נער רשת כלפי דיגיטלי המלצה יעודי סביבה.

  •  הצורך בהגנה על ילדים מפני אלימות ופגיעות ברשת (להלן ״פגיעה בילדים״)

מילות מפתח שזוהו על ידי המודל כמרכיבות את נושא זה: משתתף פגיעה מוגן רשת ילד מענה בקרב דגש אלימות צרך.

  •  צרכים ייחודיים של הזירה הישראלית: מלחמה בתוכן טרוריסטי ואתגרי שפה (להלן ״צרכים ישראליים״) 

מילות מפתח שזוהו על ידי המודל כמרכיבות את נושא זה:ערבי מרכז מיחד ישראלי פיסבוק טרור שפה הנה אודות קבוצה.  

  • ערוצים משפטיים לאסדרה מחייבת של הרשתות חברתיות(להלן ״ערוצים משפטיים״)

מילות מפתח שזוהו לנושא זה: ראי משפט חקי דיאסאיי תוכן להלן צו פרסום דין

  • תועלות חברתיות של רשתות חברתיות כגון אינסטגרם ופייסבוק: חיבוריות בין אנשים ויצירה (להלן ״תועלות חברתיות״)

מילות מפתח שזוהו לנושא זה: עברה הודעה משל פוגעני מין משמעות צרוף התנהגות לא ליק

III.ב משקל הנושאים השונים במכלול השיח ובקרב ההתייחסויות השונות:

בשלב השני, יצרנו התפלגות של הנושאים השונים המרכיבים כל התייחסות באופן המאפשר לבחון עבור כל אחד מבעלי העניין שהשתתפו בשימוע הציבורי מהם הנושאים הבולטים ביותר בהתייחסות שהוגשה מטעמו. 

מקרא: דירוג שכיחות ההתייחסות לנושא מהקטנה לגדולה – אפור, ירוק, כחול, צהוב, אדום

 מחקרנו חשף כי ישנם נושאים שזכו  להתייחסות מוגברת ובולטת יותר במסמכים השונים מאשר נושאים אחרים. לדוגמא, נושא השקיפות מופיע בצורה הדומיננטית ביותר במספר הרב ביותר של התייחסויות  כלים משפטיים וצרכי ילדים ונוער אף הם זכו להתייחסות רבה גם כן, אך קצת פחות. מנגד, הנושא של תועלות חברתיות עלה הכי מעט בהתייחסויות שנבדקו. סקירת הנושאים המצורפת להלן, מדורגת לפי ממוצע ההתייחסות לנושא בהתייחסויות בסדר יורד מהממוצע הגבוה ביותר לנמוך ביותר. 

  1. שקיפות הוא הנושא הדומיננטי ביותר בהתייחסויות לקול הקורא של ועדת דוידי, וקיבל משקל רב במיוחד במסמכים מטעם חברת גוגל, המרכז הערבי לחינוך מדיה, המועצה לשלום הילד, לשכת המסחר האמריקאית וחברת טוויטר. על אף שאלו הגורמים אשר הנושא היה הכי בולט בעמדותיהם, ניתן לראות כי כלל ההתייחסויות עסקו בנושא באופן נרחב. 
    לעומת זאת, הנושא קיבל משקל נמוך יחסית בהתייחסויות של הערוצים המסחריים, עמותת מגן לנפגעי טרור, ומרכזי הסיוע לנפגעי תקיפה מינית , בהשוואה ליתר ההתייחסויות. 
  2. ערוצים משפטיים  הוא הנושא השני הכי בולט בהתייחסויות שנבדקו, וקיבל משקל רב במיוחד בהתייחסויות של Meta, הערוצים המסחריים, לשכת המסחר האמריקאית ועמותת מגן לנפגעי טרור. 
    לעומת זאת, הנושא קיבל משקל נמוך יחסית בהתייחסות של איגוד האינטרנט הישראלי והמכון הישראלי לדמוקרטיה, בהשוואה ליתר ההתייחסויות. 
  3. פגיעה בילדים  הוא הנושא השלישי הכי דומיננטי  בהתייחסויות שנבדקו, וקיבל משקל במיוחד בהתייחסויות של  איגוד האינטרנט והמכון הישראלי לדמוקרטיה, מכון תכלית וטיקטוק.  לעומת זאת, הנושא קיבל משקל נמוך במספר לא מועט של התייחסויות. 
  4. צרכים ישראליים הוא הנושא הרביעי הכי  דומיננטי  בהתייחסויות שנבדקו, וקיבל משקל רב בהתייחסויות של עמותת יסוד לקידום זכויות יסוד ובהתייחסות של משרד עורכי דין עמית פולק מטלון. לעומת זאת, הנושא קיבל משקל נמוך יחסית בהתייחסויות של איגוד האינטרנט הישראלי והמכון הישראלי לדמוקרטיה והמועצה לשלום הילד, בהשוואה ליתר ההתייחסויות. 
  5.  צרכי ילדים ונוער  הוא הנושא החמישי הכי בולט  בהתייחסויות שנבדקו, וקיבל משקל רב יותר בהתייחסויות של  איגוד האינטרנט והמכון הישראלי לדמוקרטיה, מכון תכלית, איגוד מרכזי הסיוע לנפגעי תקיפה מינית וארגון העיתונאים והעיתונאיות, ביחס ליתר ההתייחסויות. 
  6. הגודל וגלובליות הוא הנושא השישי הכי דומיננטי  בהתייחסויות שנבדקו, וקיבל משקל רב יותר בהתייחסויות של חברת Meta ועמותת מגן לנפגעי טרור. מרבית התגובות נתנו לנושא זה משקל נמוך. 
  7.  עבירות מין הינו הנושא השביעי הכי בולט בהתייחסויות שנבדקו, וקיבל משקל רב יותר בהתייחסויות של איגוד מרכזי הסיוע לנפגעי תקיפה מינית והערוצים המסחריים לעומת יתר התגובות    
  8. תועלות חברתיות הינו הנושא הכי פחות דומיננטי  בהתייחסויות שנבדקו. נושא זה מופיע בצורה מסוימת בהתייחסויות של חברת טוויטר, חברת טיקטוק ומכון תכלית. 

III.ג חישוב מידת הדמיון והשוני בין ההתייחסויות של הגופים השונים 

בשלב השלישי, השוונו את מידת הדימיון בין ההתייחסויות השונות באמצעות מדד KL divergence שמשווה בין זוגות של התייחסויות. ככל שהתוצאה קרובה יותר ל-0, כך זוג ההתייחסויות דומה יותר מבחינת התפלגות הנושאים שלו וככל שהתוצאה קרובה יותר ל-1, כך ההתייחסויות שונות זו מזו. יוער כי בהתאם למדד KL divergence, תוצאת ההשוואה בין זוגות מסמכים אינה חייבת להיות  זהה. 

מקרא: רמת הדמיון בין ההתייחסויות מהנמוכה לגבוהה: אפור, ירוק, צהוב, אדום, סגול

הדמיון הרב ביותר בין שתי התייחסויות מבחינת הנושאים בהם עסקו נרשם בין ההתייחסות של משרד עורכי דין עמית פולק מטלון וההתייחסות של עמותת יסוד לקידום זכויות יסוד. מדובר בתוצאה מפתיעה מכיוון שמשרד עורכי הדין ככה"נ כתב את ההתייחסות עבור גורם שלא רצה להיחשף ולכן מעניין שהטענות שהועלו בהתייחסות זו, דומות לאלה שהעלתה עמותת יסוד. כפי שאפשר לראות בטבלה הקודמת, שתי התייחסויות אלה עסקו במיוחד בנושא אותו הגדרנו לצורך מחקר זה כ"צרכים ישראליים". 

דמיון רב מאוד נמדד גם בין הנושאים בהם עסקו ההתייחסויות של חברת גוגל ושל המרכז הערבי לחינוך מדיה. גם במקרה זה, מדובר בדמיון מפתיע עקב האינטרסים השונים לכאורה  ותחום הפעילות השונה של שני הגורמים. דמיון מפתיע נמצא גם בין ההתייחסויות של חברת Meta ועמדת עמותת מגן לנפגעי טרור. 

  • חוסר הדמיון הרב ביותר נמדד בין ההתייחסויות של משרד עורכי דין עמית פולק מטלון וההתייחסות של איגוד האינטרנט הישראלי והמכון הישראלי לדמוקרטיה.חוסר דמיון זה אינו מפתיע מכיוון שמשרד עורכי הדין מייצג כנראה גורם מסחרי, ולכן הגיוני התייחסות זו תהיה שונה מההתייחסות של שני ארגוני חברה אזרחית. 
  • חוסר דמיון רב נמדד גם בין ההתייחסות של איגוד האינטרנט וההתייחסות של עמותת יסוד לקידום זכויות יסוד. חוסר דמיון זה אינו צפוי מכיוון שבשני המקרים מדובר בגורמי חברה אזרחית אשר עסקו רבות בזכויות אשר יש להתחשב בהן.  ההתייחסות של איגוד האינטרנט והמכון הישראלי לדמוקרטיה רשמה גם חוסר דמיון רב להתייחסות של עמותת מגן לנפגעי טרור. 

מחקרי המשך 

בחודש אוקטובר 2021, מינה שר התקשורת ועדה לבחינת אסדרת פעילותן של רשתות חברתיות בראשות מנכ"לית המשרד, במטרה לבחון את תפקידן של רשתות חברתיות בשיח הציבורי ואת הרגולציה הקיימת עליהן, על רקע התבססותן בשנים האחרונות כאמצעי תקשורת והפצת מידע דומיננטיים בישראל. צוות הוועדה התבקש בעת מינויו לתת המלצות בדבר החלת רגולציה על פלטפורמות תוכן דיגיטליות ולגבש עקרונות לרגולציה אפקטיבית תוך בחינה השוואתית למגמות הקיימות במדינות שונות בעולם. באופן ספציפי יותר, הוועדה התבקשה לספק המלצות בדבר אסדרת שאלת האחריות והשקיפות של פלטפורמות דיגיטליות, לרבות ביחס למדיניות ולמנגנונים האלגוריתמיים של הפלטפורמות בתחומי העריכה והבקרה על התוכן. בנוסף, התבקשה הוועדה לבחון את סוגית השקיפות בקידום, סינון והסרת מנויים ו/או תכנים המופצים על ידי הפלטפורמות. ביום 14.12.2022, פרסמה הוועדה את המלצותיה. 

בהמלצותיה, הציגה הוועדה את הנחות היסוד שלה אשר כוללות את ההנחות שמפעילי הפלטפורמות החברתיות המשמעותיות מנהלים את התכנים המופצים על גבי הפלטפורמות, וכיוצא מכך ניתן לדון באחריותם לתוכן ושיש לראות בפלטפורמות החברתיות גופים קרובים לגופים דו-מהותיים. לאחר הנחות היסוד, הצביעה הוועדה על דרכי התמודדות עם תכנים פוגעניים, והמליצה על אסדרת יחסי הפלטפורמה והמשתמשים, קביעת חובות שקיפות, קביעת חובת ניהול סיכונים והקמת רגולטור ייעודי. 

בעתיד, נמשיך את את המחקר החישבוי על השיח הסובב את אסדרת הרשתות החברתיות בישראל באמצעות ההתייחסויות למסמך זה. 

 

  • Filter by:

  • Reset