איך נוצרה החלוקה ל“דפוסי הצבעה”? מה מכיל כל “דפוס הצבעה” כזה? מאיפה הנתונים?
אחד מהקבצים של משרד הבריאות על תחלואה כולל מידע לפי “אזורים סטטיסטיים”
https://data.gov.il/dataset/covid-19/resource/d07c0771-01a8-43b2-96cc-c6154e7fa9bd
מה זה “איזור סטטיסטי”? זה איזור שהגדיר הלמ"ס שמכיל בדרך כלל כמה רחובות סמוכים.
כך, המידע מפורט ברזולוציה טובה הרבה יותר משל “עיר”. במקום זאת, יש לנו רזולוציה של תחלואה (ואשפוז, תמותה וכו’) על כל כמה רחובות.
למה זה חשוב? כי הרבה מהערים אינן הומוגניות. האוכלוסייה בחלקים שונים של העיר שונה. האם נכון להתייחס לתל אביב, למשל, כעיר אחת עם מאפיינים מכלל התושבים ביחד? לא. יפו היא עם אוכלוסיה ערבית, דרום תל אביב הוא אזור ימני מובהק, ואילו בצפון תל אביב מצביעי הליכוד הם במיעוט.
איך יודעים איפה נמצא כל אזור סטטיסטי?
המידע נקבע ע“י הלמ”ס וקיים למשל, כאן: https://data.gov.il/dataset/statistical-area-2008?fbclid=IwAR1HTIXy4-Gw-h7Z_D_wOs1IIrfhExG8TVXMgLEru7oTVFcwupyXf52APfg
כך יש לנו גם נתונים רבים אחרים על האוכלוסיה בכל אזור כזה – מספר התושבים (ופילוח לפי גילים), שכבה כלכלית-חברתית, ועוד.
ועדת הבחירות המרכזית פרסמה בסמוך לאחר הבחירות את תוצאות הבחירות ברמת כל קלפי.
ניתן להוריד את הקובץ מכאן https://votes23.bechirot.gov.il/ בקובץ “תוצאות לפי קלפי”
יש גם את רשימת הקלפיות עם הכתובות שלהן, כאן: https://bechirot23.bechirot.gov.il/election/Kneset20/Pages/BallotsList.aspx.
את כתובות הקלפיות המרתי לנ"צ (בסיוע המנוע של גוגל), ואז ניתן לראות באיזה אזור סטטיסטי כל קלפי נמצאת.
את תוצאות הבחירות בכל אזור סטטיסטי ניתן לסווג למספר קטן של דפוסי הצבעה.
התהליך בוצע באמצעות clustering, ואת התיוג של שמות “שבטי ישראל” קבעתי בעצמי לאחר שבוצעה החלוקה – בהתאם לתוכן. כך למשל, כל אזור שיותר מ 45% מהקולות בו זכתה “הרשימה המשותפת” (המפלגה הערבית) נחשב כ“ערבי” וכל אזור בו העבודה-גשר-מרצ זכתה במעל 20% מהקולות נחשב כ“שמאל”.
בכל אזור מצביעים למגוון מפלגות. בתרשים הבא ניתן לראות את ההתפלגות של הקולות למפלגות השונות
איך קוראים את התרשים הזה? מי שממש לא מכיר יכול להתמקד בקו שבאמצע המלבן. בכל אחד מדפוסי ההצבעה, הקו שבאמצע המלבן של מפלגה מסויימת מלמד על אחוז הקולות שקיבלה המפלגה בכל הקלפיות שקוטלגו בדפוס הזה. בחצי מהן המספר היה גדול יותר, ובחצי קטן יותר. הקצוות של המלבן מלמדות על הערך באחוזון ה 25% של הקלפיות וה 75% שלהן.
למשל, במפלגות החרדיות (Ultra Orthodox) אפשר לראות שהקו הזה, עובר למפלגת יהדות התורה בכ־50%, ושהמפלגה השניה בגודלה היא ש"ס שאצלה הקו נמצא בכ־25%. הליכוד המפלגה השלישית בגודלה בקלפי אופיינית שתקוטלג בניתוח כחרדית, ושאר המפלגות קיבלו בבחירות לכנסת ה־23 מעט מאוד קולות.
כדי לפשט, אפשר לתאר את החלוקה באופן הבא:
1. אזורים סטטיסטיים שיותר מ־45% מהקולות בהם ניתנו ל“רשימה המשותפת” מסווגים כ“ערביים”.
2. מהאזורים שנותרו (שאינם מסווגים כערביים) אם למעלה מ 20% ניתנו ל“עבודה-גשר-מרצ” אז קוטלגו כ“שמאל”.
3. מהנותרים, אם הקולות של יהדות התורה וש“ס יחדיו היו למעלה מ 40% האזור קוטלג כ”חרדי“.
4. מהנותרים, אם יותר מ־15% מהקולות ניתנו למפלגת”ימינה" האזור סווג כ“דתי”.
5. מהנותרים, אם סך הקולות ל“ליכוד” פחות סך הקולות ל“כחול לבן” היה יותר מ 20% מהקולות - סווג כ“ליכוד”.
6. במצב ההפוך (“כחול לבן” פחות “ליכוד” משאיר יותר מ 20%) סווג כ“כחול לבן”.
7. במצב שנותר - הפרש קטן מ 20% בין “כחול לבן” וה“ליכוד” סווג כ“תיקו”.
זהו, עכשיו עכשיו לחזור לבלוג “כמותית”: https://quantitatively.club/
או ל“דשבורד הקורונה” של הבלוג: https://quantitatively.club/wp-content/uploads/2020/10/covid-dashboard.html