פתרון תשחצים. כל התשובות בחינם. התשובות להגדרה "קורלציה" הן:
המצפן של הנתונים: איך אנחנו מוצאים סדר בתוך הכאוס
המוח האנושי שלנו הוא מכונה מופלאה לאיתור דפוסים. כשאנחנו רואים עננים אפורים, אנחנו מצפים לגשם. כשאנחנו לומדים יותר למבחן, אנחנו מצפים שהציון יעלה. החיפוש הזה אחר הקשר בין אירועים הוא הבסיס להבנת העולם. בשפה המקצועית של עולם הנתונים, למערכת היחסים הזו קוראים "קורלציה" (או בעברית: מִתְאָם). זהו לא סתם מושג טכני, אלא הכלי שמאפשר למדענים, חוקרים וכלכלנים להבין האם שני דברים קשורים זה לזה, או שהם מתרחשים במקביל במקרה. קורלציה היא הדרך שלנו למדוד את "הריקוד המשותף" של המשתנים. הסקאלה שעליה נמדד הקשר הזה נעה בין 1- ל-1. דמיינו את זה כך: המספר 1 מייצג "חברות מושלמת" - כשאחד עולה, השני עולה איתו יד ביד. המספר 0 מייצג "אדישות מוחלטת" - אין שום קשר בין הדברים. ואילו המספר 1- מייצג "הפכים משלימים" - כמו נדנדה, כשהאחד עולה למעלה, השני חייב לרדת למטה בדיוק באותו קצב.
מלכודת הדבש: למה קשר לא אומר שמצאנו את הסיבה
כאן מגיעה האזהרה החשובה ביותר שכל חובב נתונים חייב להכיר, אזהרה שצריכה להופיע באותיות קידוש לבנה לפני כל מחקר: "מתאם אינו מעיד על סיבתיות". זה ששני דברים קורים יחד, לא אומר שאחד גרם לשני. העולם מלא במה שמכונה "מתאם מזויף". קחו דוגמה קלאסית: אם נבדוק נתונים, נגלה שיש מתאם חיובי מובהק בין גובה של ילדים לבין רמת הידע הכללי שלהם. האם זה אומר שגובה גורם לחוכמה? בוודאי שלא. יש כאן "גורם שלישי" שמתערב והוא הגיל. ככל שילד גדל בגיל, הוא גם גובה פיזית וגם צובר ידע. אם לא נדע לבודד את המשתנים הללו, אנחנו עלולים להסיק מסקנות שגויות לחלוטין. היכולת להבדיל בין קשר סטטיסטי לבין סיבה ותוצאה היא ההבדל בין הבנה אמיתית לבין אשליה אופטית של נתונים.
הסרגל של פירסון: לחפש את הקו הישר
במאה ה-19, החלו חוקרים כמו סר פרנסיס גולטון וקרל פירסון לנסות ולכמת את התורשה האנושית. פירסון פיתח את המדד המפורסם ביותר בעולם הסטטיסטיקה שנקרא על שמו: "מתאם פירסון". המדד הזה הוא למעשה סוג של סרגל שבודק עד כמה הנתונים שלנו מסתדרים בקו ישר. הוא עובד מצוין עם מספרים כמותיים כמו גובה, משקל, שכר או טמפרטורה. כשמתאם פירסון מראה תוצאה גבוהה, זה אומר שאנחנו יכולים למתוח קו ישר דמיוני שיעבור דרך רוב הנקודות בגרף. אבל לפירסון יש מגבלה אחת שחשוב להכיר: הוא "עיוור" לקשרים מורכבים יותר. אם הנתונים מתנהגים בצורה של קשת או מעגל, פירסון עשוי להגיד לנו שהמתאם הוא אפס, למרות שיש קשר ברור וחזק בין המשתנים, פשוט כי הוא לא ליניארי (לא ישר).
השיטה של ספירמן: כשלא הכל מדיד, הכל מדורג
לא תמיד החיים מסתדרים במספרים מדויקים. לפעמים אנחנו רוצים לבדוק קשרים שמבוססים על דירוג, העדפה או טעם אישי. כאן נכנס לתמונה צ'ארלס ספירמן עם פתרון חכם: במקום להסתכל על הערך המדויק, בואו נסתכל על הדירוג (המיקום) של הנתון. מתאם ספירמן בודק את סדר הדברים. דמיינו תחרות טעימות פיצה שבה השופטים מדרגים את הפיצות מ-1 עד 10. ספירמן יבדוק האם יש קשר בין מחיר הפיצה לבין המיקום שהיא קיבלה בתחרות. הוא מחפש "קשר מונוטוני" - כלומר, האם ככל שהמחיר עולה, גם הדירוג עולה (גם אם הקפיצות לא אחידות). השיטה הזו עמידה יותר בפני נתונים חריגים ומאפשרת לנו לנתח מצבים שבהם אין היגיון לחפש קו ישר, אלא מגמה כללית של עלייה או ירידה.
המדד של קרמר: לפצח את קוד הקטגוריות
עד עכשיו דיברנו על מספרים ודירוגים, אבל מה קורה כשהשאלות שלנו הן קטגוריות? למשל, האם יש קשר בין צבע העיניים (כחול, חום, ירוק) לבין העדפה למוזיקה מסוימת? אלו משתנים שאי אפשר למדוד במספרים ואי אפשר לדרג אותם בסדר עולה. לשם כך קיים "מדד קרמר" (Cramer's V). המדד הזה מתבסס על מבחן סטטיסטי שנקרא "כי-בריבוע", והוא בודק את הפער בין המציאות לבין הציפייה. הוא שואל: "אם לא היה שום קשר בין הקבוצות, איך התוצאות היו מתפזרות?". ככל שהפער בין מה שציפינו לראות (במצב של חוסר קשר) לבין מה שקיבלנו בפועל גדול יותר, כך מדד קרמר יהיה גבוה יותר ויעיד על קשר חזק בין המשתנים. זהו כלי קריטי בסוציולוגיה ומדעי החברה, שם רוב השאלות עוסקות בשיוך קבוצתי ולא במספרים יבשים.
האשליה של המספרים: רביעיית אנסקום
לסיום, בואו ננפץ מיתוס: מספרים לא מספרים את כל הסיפור. בשנת 1973, הסטטיסטיקאי פרנסיס אנסקום הדגים זאת בצורה מבריקה שזעזעה את העולם האקדמי. הוא יצר ארבע קבוצות של נתונים שנקראות "רביעיית אנסקום". כשמזינים את הנתונים למחשב, מקבלים תוצאות זהות לחלוטין: אותו ממוצע ואותו מתאם פירסון בדיוק. המחשב יגיד לכם שהקבוצות זהות. אבל - וזה אבל ענק - כשמציירים את הנתונים האלו על גרף, מקבלים ארבע תמונות שונות לגמרי! גרף אחד מראה פיזור תקין, השני יוצר קשת, השלישי הוא קו ישר מושלם למעט חריגה אחת בודדת, והרביעי הוא בלגן מוחלט עם נקודה קיצונית שמושכת את כל הממוצע. השיעור של אנסקום הוא נצחי: מתאם הוא כלי עזר מצוין, אבל הוא לעולם לא יחליף את העין האנושית ואת הצורך להסתכל על הנתונים בצורה ויזואלית לפני שמסיקים מסקנות נחרצות. בהצלחה !
מודעות
תשובה 2 אותיות:
תשובה 3 אותיות:
תשובה 4 אותיות: מתאם
תשובה 5 אותיות:
תשובה 5 אותיות:
תשובה 6 אותיות:
תשובה 7 אותיות:
תשובה (מיוחד מ-8 אותיות):
כדי למצוא תשובות נוספות - השתמשו בתיבת החיפוש בראש הדף.
יש לכם פתרון אחר להציע? כתבו לנו בתיבת התגובות!
עזרנו לכם למצוא את הפתרון לתשבץ? תפרגנו לנו בלייק!
תשובה 7 אותיות:
תשובה (מיוחד מ-8 אותיות):
כדי למצוא תשובות נוספות - השתמשו בתיבת החיפוש בראש הדף.
יש לכם פתרון אחר להציע? כתבו לנו בתיבת התגובות!
עזרנו לכם למצוא את הפתרון לתשבץ? תפרגנו לנו בלייק!
אין תגובות:
הוסף רשומת תגובה
יש לכם פתרון אחר להציע ? רשמו אותו כאן. תודה!