חנות און ליין לטכנאים

«חזרה לאינדקס המונחים

היסטוגרמה היא כלי חיוני בסטטיסטיקה ובניתוח נתונים, המספק ייצוג חזותי של התפלגות נתונים מספריים. זוהי בעצם סוג של דיאגרמת עמודות שבה גובה העמודות מראה את התדירות (השכיחות) של נקודות נתונים הנופלות לתוך טווחים ספציפיים, הנקראים תאים (Bins).

העמודות בהיסטוגרמה תמיד צמודות (נוגעות זו בזו), וזהו הבדל מפתח מול דיאגרמת עמודות רגילה, שבה העמודות מייצגות קטגוריות נפרדות ובדרך כלל מופרדות.

דוגמה

נניח שאספת את גילאי 100 אנשים ורצית להמחיש את ההתפלגות.

טווח גילאים (תא) ספירה (תדירות)
0–10 15
11–20 25
21–30 30
31–40 18
41–50 12

היסטוגרמה תשרטט את הטווחים הללו על ציר ה-X, והעמודה עבור הטווח '21–30' תהיה הגבוהה ביותר, ותגיע לגובה של 30. זה מראה מיד שקבוצת הגיל הנפוצה ביותר היא 21–30.

️ איך היסטוגרמה פועלת?

  1. איסוף נתונים: אוספים מערך של נקודות נתונים מספריות (למשל, ציוני מבחנים, משקלים, זמני המתנה).
  2. קביעת טווח: מוצאים את הערכים המינימליים והמקסימליים כדי להבין את הפיזור הכולל.
  3. הגדרת תאים (מרווחים): מחלקים את כל טווח הנתונים לסדרה של מרווחים. זהו השלב הקריטי ביותר, מכיוון שמספר ורוחב התאים משפיעים באופן משמעותי על מראה ההיסטוגרמה.
    • מעט מדי תאים (תאים רחבים): מפשטים יתר על המידה את הנתונים ומסתירים מאפיינים חשובים.
    • יותר מדי תאים (תאים צרים): יוצרים גרף קופצני ומבולגן שקשה לפרש.
  4. מניית תדירויות: סופרים כמה נקודות נתונים נופלות לתוך כל תא.
  5. שרטוט הגרף: בונים את גרף העמודות, כאשר גבולות התאים נמצאים על ציר ה-X והתדירויות על ציר ה-Y. העמודות חייבות להיות צמודות.

שימושים בהיסטוגרמה

היסטוגרמות משמשות בעיקר לניתוח נתונים ראשוני (exploratory data analysis) כדי:

סוגי צורות התפלגות

צורת ההיסטוגרמה חושפת מידע מכריע על הנתונים:

יתרונות ו- חסרונות

יתרונות

חסרונות

«חזרה לאינדקס המונחים