סטטיסטיקה היא מחקר על נותנים.
כשנרצה להשתמש בסטטיסטיקה, נצטרך קודם כל לאסוף נתונים, לארגן אותם באופן שהכי מתאים לסיטואציה, כך שנוכל להשתמש בהם בשביל להסיק מסקנות על הסיטואציה הנתונה.
לשם הבנת העקרונות המרכזיים של הסטטיסטיקה, חשוב להבהיר ולהגדיר תחילה מספר מושגים:
יש מספר דרכים להציג את הנתונים הסטטיסטיים, לרבות טבלאות, רשימות, גרפים, דיאגרמות ועוד.
אנחנו יודעים שהמילה סטטיסטיקה יכולה להישמע מעט מאיימת ולא מובנת, אולי בגלל הסיבה שהיא פשוט לא מזכירה לנו אף מילה אחרת מחיי היומיום שלנו.
סטטיסטיקה היא באמת שפה משל עצמה, אבל אחרי שתקראו את המאמר הזה, תוכלו לראות איך תוך כמה דקות ספורות תדעו את כל מה שאתם צריכים בנושא כדי לפתור תרגילים מבלי למצמץ.
לא מאמינים? הישארו איתנו!
סטטיסטיקה היא מחקר על נותנים.
לא, אנחנו לא מצפים מכם להיות מדענים ולחקור תופעות טבע, אלא פשוט לבצע ניתוח סטטיסטי שדרכו נוכל לגלות דברים חשובים.
גם לחיים, אבל בעיקר למבחן הקרוב.
השלב הראשון הוא איסוף וארגון נתונים.
דמיינו לכם שמתבצע איזשהו מחקר.
לדוגמה, מחקר על הציונים במבחן מסוים בכיתה שלכם.
הדבר הראשון שיש לעשות הוא לארגן את כל הנתונים - כלומר, את כל הציונים שהתקבלו בבחינה.
אם במקום להסתכל על כל ציון בנפרד, נארגן את כל הציונים בצורה מסודרת, נוכל להמשיך להסיק מסקנות על המחקר.
הנה כמה דרכים לארגן את הנתונים באופן הטוב ביותר -
פשוט נרשום את כל הנתונים שהתקבלו ברשימה אחת.
לדוגמא: רשימת ציוני הבחינה-
90,80,70,100,80,50,60,90,70,80
נשרטט טבלה בעלת שתי עמודות.
עמודה ראשונה בה מופיע הנתון - הציון
ועמודה שנייה, בה מופיע מספר הפעמים שהתקבל הנתון. בדוגמה שלנו - מספר התלמידים שקיבלו את הציון.
לדוגמה:
ציון | 50 | 60 | 70 | 80 | 90 | 100 |
מספר התלמידים |
1 | 1 | 2 | 3 | 2 | 1 |
אין מה לפחד מהמילה דיאגרמה כי המשמעות שלה היא פשוט תרשים שאתם יכולים לצייר בקלות על מערכת הצירים.
על ציר ה- X - ציינו את הנתון שלכם.
בדוגמה שלנו- הציון.
על ציר ה- Y - ציינו את מספר הפעמים שהנתון מופיע.
בדוגמה שלנו- מספר התלמידים שקיבלו את הציון.
טיפ מאיתנו ליצירת דיאגרמה בקלות:
התייחסו לטבלה בה הצגתם את הנתונים כטבלה של ציר X ו- Y .
כתבו מעל הציון את האות X ומעל מספר התלמידים את האות Y.
מקמו את הנקודות על מערכת הצירים ולאחר מכן ציירו מלבנים מתאימים.
לדוגמה:
זה הזמן להביא מצרכים מהמטבח!
סתם… ממש לא.
דיאגרמת עוגה נראית ממש כמו עוגה, או פיצה.
הגודל של כל פרוסה בעוגה מתאר את הכמות של כל נתון.
ככל שכמות הפעמים שהנתון מופיע תהיה גדולה יותר, כך פרוסת העוגה תהיה גדולה יותר ולהיפך.
בדוגמה שלנו - ככל שמספר התלמידים שקיבלו את הציון הזה, יהיה גבוה יותר, כך הפרוסה של הציון תהיה גדולה יותר.
לדוגמה:
בדיוק כמו דיאגרמת העמודות,
תוכלו ליצור גרף בקלות אם רק תתייחסו אל הטבלה כטבלה של X ו - Y.
שוב, ציירו את שני הצירים, ציינו ליד ציר ה X את הנתון - הציון ובציר ה- Y את הכמות - מספר התלמידים שקיבלו את הציון וסמנו את הנקודות המתאימות.
הפעם, במקום לצייר מלבנים מתאימים, פשוט מתחו קו שעובר בין כל הנקודות.
לדוגמה:
הערה חשובה:
לא משנה באיזו דרך תבחרו לארגן את הנתונים שלכם, כל הדרכים טובות ומייצגות את אותו הדבר.
פשוט שימו לב אם ישנה בקשה להצגה ספציפית.
מעולה! ארגנתם את הנתונים בצורה מקצועית וטובה! עכשיו אפשר לעבור לניתוח הנתונים ולהסיק מתוכם את מה שביקשו מאיתנו.
שכיחות בסטטיסטיקה מציגה לנו כמה פעמים התקבל כל נתון.
טיפ: זכרו שהמילה שכיח היא מילה נרדפת לנפוץ. כשתראו את המילה שכיחות,
זכרו לשאול - עד כמה נפוץ היה הנתון.
בדוגמה שלנו - כמה פעמים התקבל כל ציון, כמות הפעמים שהתקבל ציון מסויים או מספר התלמידים שקיבלו ציון מסויים.
השכיחות של הציון 100 היא - 1.
השכיחות של הציון 90 היא - 2.
השכיחות של הציון 80 היא 3 .
וכן הלאה...
שכיחות יחסית בסטטיסטיקה מתארת את היחס בין השכיחות לכמות הנתונים.
חשבו על זה כך: אם השכיחות של הציון 50 היא 2, כלומר - שני תלמידים קיבלו את הציון 50,
אך כמות התלמידים היא 4, נוכל להסיק שחצי מהכיתה נכשלה במבחן.
אך אם כמות התלמידים היא 20 תלמידים, נוכל להסיק שרק עשירית מהתלמידים נכשלו במבחן. (במידה וכל שאר הציונים גבוהים יותר כמובן).
על מנת לחשב שכיחות יחסית לנתון מסוים -
ניקח את השכיחות של הציון ונחלק אותה בכמות הנתונים שנאספו.
בדוגמה שלנו -
נאספו 10 ציונים.
השכיחות היחסית של הציון 100 היא: \(\frac{1}{10}\) או 10%.
השכיחות היחסית של הציון 90 היא: \(\frac{2}{10}\) או 20%.
השכיחות היחסית של הציון 80 היא: \(\frac{3}{10}\) או 30%.
וכן הלאה…
טיפ: רוצים להיות בטוחים שאתם צודקים?
סך כל השכיחויות היחסיות של כל הנתונים, תמיד יצא 1 או 100%.
שכיח, טווח הנתונים, ממוצע וחציון.
הערך הנפוץ ביותר, זה שהתקבל הכי הרבה פעמים.
כדי למצוא את השכיח, בדקו לאיזה ערך יש את השכיחות הגבוהה ביותר.
זהו איזה ערך התקבל הכי הרבה פעמים.
בדוגמה שלנו נשאל - איזה ציון התקבל הכי הרבה פעמים?
התשובה היא - 80.
לכן השכיח הוא 80. השכיחות שלו היא - 3,
היא הגבוהה ביותר מבין השכיחויות המוצגות.
הערה -
יכולים להופיע כמה שכיחים במחקר אחד.
במידה והיה מתקבל ציון נוסף גם הוא עם שכיחות זהה ל- 3 בדוגמה שלנו, היינו מציינים גם אותו כשכיח.
התחום בין הנתון הגבוה ביותר לנמוך ביותר.
בדוגמה שלנו, טווח הנתונים הוא טווח הציונים: 50-100.
כאשר 50 הוא הציון הנמוך ביותר ו100 הוא הציון הגבוה ביותר.
הערך המייצג את הקבוצה המסוימת שנחקרה.
איך נחשב אותו?
על ידי משוואה פשוטה:
\(\frac{סכום~הנתונים}{כמות~הנתונים}\)
סכום הנתונים יהיה: הנתון הראשון כפול השכיחות שלו + הנתון השני כפול השכיחות שלו + הנתון השלישי כפול השכיחות שלו וכן הלאה…
בעצם, נכפול כל נתון בשכיחות שלו ונחבר את כולם יחד.
את התוצאה שנקבל נחלק בכמות הנתונים וכך נדע מהו הממוצע.
בדוגמה שלנו:
נחשב את סכום הנתונים לפי הטבלה הבאה ונחלק את הסכום בכמות הנתונים.
ציון | 50 | 60 | 70 | 80 | 90 | 100 |
מספר התלמידים |
1 | 1 | 2 | 3 | 2 | 1 |
\(\frac{50x1 + 60x1 +70x2 + 80x3 + 90x2 + 100x1}{1+2+3+2+1+1}=\frac{770}{10}=77\)
לכן, ממוצע הציונים הוא 77.
העשרה:
אם נוסיף ציון גבוה מהממוצע לרשימת הציונים, הממוצע יעלה. אם נוסיף ציון נמוך מהממוצע לרשימת הציונים, הממוצע ירד.
חציון הוא הנתון האמצעי. איך תזכרו את זה?
חישבו על כך שחצי מהנתונים גבוהים ממנו וחצי מהנתונים נמוכים ממנו (או שווים לו).
החציון שאנחנו מחפשים, נמצא באמצע.
איך נמצא את החציון?
בשלב הראשון:
נסדר את רשימת הנתונים בסדר עולה ונשאל האם כמות הנתונים זוגית או אי זוגית.
לדוגמה:
100, 90, 90, 80, 80, 80, 70, 70, 60, 50
במקרה של כמות נתונים זוגית, אין איבר אחד שחצי מהנתונים גבוהים ממנו וחצי נמוכים ממנו ולכן,
נוסיף 1 לכמות האיברים ונחלק ב- 2.
כלומר: \(10+1=11\)
\(11÷2=5.5\)
בשלב השני:
נחשב ממוצע של שני האיברים האמצעיים, כלומר במיקומים 5 ו- 6.
\(80+80=160\)
\(160÷2=80\)
החציון שלנו הוא 80.
טיפ: אם כמות הנתונים בטבלה היא כמות גדולה, אין צורך שתסדרו את כולם ברשימה.
תוכלו להתבונן בטבלה ולראות איזה איבר נמצא באיזה מיקום.
ציון | 50 | 60 | 70 | 80 | 90 | 100 |
מספר התלמידים |
1 | 1 | 2 | 3 | 2 | 1 |
כאן אנחנו רואים ש-
50 תופס את המקום הראשון,
60 תופס את המקום השני,
70 תופס את המקום השלישי והרביעי
ו- 80 תופס את המקום החמישי השישי והשביעי.
הגענו למקומות שרצינו (החמישי והשישי) ולכן אין צורך להמשיך, אפשר לחשב ממוצע שיתן לנו את החציון.
במקרה של כמות נתונים אי זוגית נעשה את אותו הדבר -
נוסיף 1 לכמות האיברים ונחלק ב- 2.
אך הפעם אין צורך לחשב ממוצע של שני האיברים האמצעיים כי יש רק אחד כזה.
לצורך העניין, אם היו לנו בדוגמה 11 ציונים,
היינו מחשבים כך:
\(1+11=12\)
\(12÷2=6\)
שימו לב, החציון אינו 6 אלא הציון שנמצא במקום השישי ברשימה שלכם. 6- זהו רק מיקום החציון.
בשורה התחתונה..
עכשיו, כשאתם יודעים את כל מה שאתם צריכים כדי לפתור תרגילים בסטטיסטיקה נותר לכם רק לתרגל.
לא סתם אמרנו שסטטיסטיקה היא שפה.
אל תפחדו או תירתעו ממנה ותראו איך לאט לאט המילה הזו כבר לא כל כך מאיימת. להפך, עכשיו כשאתם מבינים דבר או שניים בסטטיסטיקה, אולי אפילו יעלה לכם חיוך קטן כשתפגשו אותה במבחן.