תוחלת ושונות- לא רק מושגים מתמטיים וסטטיסטיים.

שלום, נעים מאוד. 
במאמר זה אעסוק בשני מושגים מהעולם הסטטיסטי, שנקראים "תוחלת" ו"שונות". נתחיל בהגדרת מושגים אלו, נבין מאיפה הם הגיעו, מה הרעיון שעליהם מתבסס רוב עולם ניהול הסיכונים, ונבין איך כל זה קשור לחיי היום יום שלנו.

נתחיל בהגדרות: תוחלת (expected value)- הוא הממוצע המושקלל של ניסוי מסוים, כאשר אנחנו עושים אותו אינסוף פעמים. לדוגמא, נגיד ואנחנו מטילים מטבע הוגן (שסיכוי עץ ופלי שווים ל50%) אינסוף פעמים, נצפה מהמטבע ליפול 50% מהזמן על עץ ופלי בהתאמה. עוד דוגמא, היא קליעת עונשין לסל- שחקן NBA כמו סטף קרי לדוגמא, יהיה עם תוחלת הצלחת קליעה של מעל מ90% מהזמן. זאת אומרת, שאם סטף קרי יזרוק לדוגמא מיליון זריקות עונשין, נצפה שמעל 900 אלף יכנסו לסל, או במילים אחרות מעל ל9 מתוך עשר כדורים יכנסו לסל.
נעזוב את התוחלת ועוד נחזור אלייה.

שונות ( variance)-במילים פשוטות, שונות היא המרחק היחסי מהתוחלת (המרחק היחסי ממה שאמור לקרות בטווח הארוך),ערכייה נעים כאשר הערך המינימלי שלה הוא אפס, בשונה מתוחלת שיכולה לקבל ערכים שליליים.

נסביר בעזרת המשך לדוגמאות הקודמות- בדוגמא העץ או פלי, תשאלו את עצמכם, כאשר אנחנו זורקים מטבע פעם אחת, האם התוצאה הצפויה תהייה קרובה לתוחלת הניסוי (נזכיר שהתוחלת שווה ל50% פלי ועץ בהתאמה), או רחוקה ממנה ? מי שענה לעצמו שהיא רחוקה, צודק! בהטלה יחידה התוצאה לעץ תהייה 0/100 (או שייצא עץ או שייצא פלי), ולכן המרחק היחסי מהתוחלת הוא מאוד גדול. נמשיך להסביר בעזרת סטף קרי, שכמו שציינו מקודם תוחלת הקליעה שלו מהעונשין היא מאוד גבוהה, ולצורך הדוגמא נגיד שהיא 95% מהזמן. עכשיו סטף מגיע לקו, וזורק זריקה אחת. ישנם שתי אופציות, סטף קולע/מחטיא. תשאלו את עצמכם, איפה השונות יותר גדולה, כאשר סטף קולע/מחטיא ? מי שענה לעצמו שכאשר הוא מחטיאצודק! בזריקה יחידה התוצאה תהייה 0%/100%, והתוחלת של סטף היא 95%. כאשר סטף קולע, המרחק היחסי מהתוחלת (לעומת פספוס) הרבה יותר קטן, לכן, כאשר סטף יחטיא זריקת עונשין, נאמר שהשונות פה הייתה גדולה, וכאשר יקלע, נאמר שהשונות הייתה קטנה.
אסיים בדוגמא מסכמת ממשחק שכנראה כולנו מכירים, משחק הרולטה. כידוע לרובכם, בשולחן רולטה יש 37 (בחלק מהמדינות 38) מספרים שונים, המחולקים עפ"י צבעים טורים וכו.. שבעל קזינו בוחר לשים רולטה בקזינו שלו, זה בגלל שהוא יודע בוודאות שבתוחלת הרולטה תהיי רווחית עבורו, לא משנה האם ירוויח בלילה הנ"ל, נסביר. נקח את הדוגמא הפשוטה במשחק הרולטה, נשים על צבע שחור, כאשר סיכויי הפגיעה שלנו במספר שחור הם 18/37=48.65% (ישנם 18 כדורים שחורים מתוך סה"כ 37 כדורים בשולחן). במובני תוחלת, חישוב זה מראה לנו שאם נסובב את הרולטה אינסוף פעמים, או לצורך דוגמא 1,000,000 פעמים, ייצא שחור בקירוב 486,500. מי ששיחק יודע, שכאשר נפגע בשחור, נכפיל את ההימור שלנו (במידה ושמנו 100 דולר- נקבל 200). במילים פשוטות- אנחנו נותנים ל"בנק" 100 דולר, והוא אומר לנו שקצת פחות מחצי מהפעמים, הוא יחזיר לנו 200. לא צריך הרבה הבנה בשביל להבין שזוהי השקעה רעה, כאמור נשקיע 100 ונקבל פחות מחצי מהזמן 200, . אז איך שונות משפיעה פה ? כל סיבוב רולטה באשר הוא, מביא איתו שונות מאוד מאוד גדולה. נסביר- שמתי 100 דולר על מספר 8. בתוחלת, מי שכבר הבין איך לחשב, אני אפגע 1/37=2.7% מהזמן במספר בודד, וזוהי התוחלת שלי. בטווח הארוך, אם אזרוק 1,000,000 פעמים, ייצא בקירוב 27,000 פעמים 8. עכשיו, נגיד ופגענו במספר, השונות פה מאוד גדולה- התוחלת שלנו היא 2.7%, ופגענו, משמע בניסיון הזה קיבלנו 100% (בדומה לדוגמא של סטף קרי). עכשיו, נסתכל על כל מהמר ברולטה כאל ניסוי בודד, ונבין שבסיבוב יחיד, ישנה שונות מאוד גדולה ומפוזרת בין כלל השחקנים. אבל נחשו מה ? לקזינו- ממש לא אכפת. הקזינו מבין שבתוחלת הוא מרוויח כסף על המהמרים, ושאנחנו חושבים על זה יש בזה היגיון, אחרת איך קזינו היה יכול להתקיים לאורך זמן (לאלו ממכם שמכירים את המשחק 21 (בלאקג'ק), תשאלו את עצמכם למה קזינואים לא נותנים ל"סופרי קלפים" להיכנס לקזינו ? כי בתוחלת האנשים האלה מרוויחים כסף על הקזינו) ?
דוגמת חישוב מתמטי של תוחלת רווח/הפסד במקרה שנשים על הצבע השחור: כאמור לעיל, נפגע בכדור שחור בהסתברות של 18/37=48.65%, ובשבר עשרוני 0.4865, ניקח את התוצאה הזו ונכפיל בסכום הזכייה שלנו (200 דולר), וייצא לנו 0.4865*200= 97.3 . לחישוב הסופי ניקח את התוחלת שלנו, שהיא גם הזכייה שלנו לטווח הארוך (97.3) ונוריד את ההשקעה שלנו (100 דולר). משמע התוחלת שלנו במידה ונשים 100 דולר על צבע ברולטה, תהייה: 97.3-100= 2.7- דולר לכל סיבוב.
כמו שאמרנו, לא השקעה שהיינו רוצים להשתתף בה.

לאחר שהסברנו את המושגים בצורה בסיסית אך מפורטת, נעבור לחלק שבו נבין איך המושגים הנ"ל יכולים להשפיע לנו על חיי היומיום. כמובן שיש אינסוף דוגמאות, אני אדבר על כמה כיוונים שונים.
דוגמא ראשונה- בואו ניקח את עצמינו לזמנים בהם לא היה וויז, ונהגים היו צריכים לנסוע עם מפות, או אפילו לזכור את הדרך בעזרת שילוט. באותם זמנים, כמו היום, קיימים אנשים שקמים בבוקר, וצריכים להגיע לעבודה. דבר כלכך בסיסי, מה הקשר עכשיו תוחלת ושונות ? אז באופן מודע או בלתי מודע, כולם בזמנו היו עושים את החישוב הזה. נגיד שאני רוצה להגיע ממקום א' למקום ב', ויש לי שתי דרכים לעשות זאת, דרך כביש 1/כביש 2 (רק לצורך הדוגמא). בזמנים ללא תכנית ניווט, כל אדם היה בראש מנסה להבין מה תוחלת זמן הנסיעה בכביש 1 לעומת כביש 2, שבמילים פשוטות מה הזמן הנמוך ביותר שייקח לי להגיע לעבודה אם אני אסע את הדרך הזאת אינסוף פעמים ? (על השאלה הזאת אני עונה בעזרת מידע שרכשתי בכל הדרכים האפשריות) וכמובן בוחר את המסלול הנמוך ביותר. נגיד נסעתי 50 פעמים בכל דרך, ושמתי לב שבדרך א' לוקח לי פחות זמן מדרך ב', כמובן שאבחר בדרך א' כדרך הנסיעה המועדפת עליי. אז מה הקשר פה לשונות ? השונות תבוא ליידי ביטוי, אם ביום מסוים הייתה תאונה גדולה בדרך א', ובאותו יום אם הייתי בוחר בדרך ב' הייתי מגיע יותר מהר לעבודה. האם זה אומר שזהו, מעכשיו דרך ב' היא היותר טובה ? ממש ממש לא! עדיין דרך א' היא המהירה יותר, ולכן אמשיך לנסוע בה גם מחר ומחרותיים...

מה אני מנסה להדגיש פה ? הרבה פעמים בחיים אנחנו משנים דפוסי התנהגות, החלטות, מחשבות על הקרובים שלנו והדרך שבחרנו, ואנחנו לא מבינים שהיה פה יום עם שונות גדולה.
לסיכום, החשיבה בצורה של תוחלת ושונות, יכולה לעשות לנו הרבה סדר בחיי היומיום. מההחלטות הכי קטנות, כמו באיזה דרך אנחנו נוסעים לעבודה, ועד להחלטות הכי גדולות, כמו בחירת הקרובים אלינו וניהול סיכונים כלכלי. להבין שגם אם משהו שאמור לקרות לא קרה, זה בסדר, ככה העולם צריך לעבוד- יכולה להקל עלינו ולתת לנו דרך נוחה יותר לחשוב על החיים, שהשאלה המובילה היא, האם עשיתי החלטה שהיא נכונה/רווחית בתוחלת (בטווח הארוך, שאעשה את ההחלטה "אינסוף פעמים", בלי קשר לתוצאה שקרתה באותו רגע ? גם אם היא יצאה רחוקה מאוד מהתוחלת ובמילים אחרות, עם שונות גדולה) ?
תודה רבה לכם על הקריאה!