אלגוריתם מיון

מיון הוא אלגוריתם לסידור נתונים על פי ערכי מפתח, למשל סידור רשימה של אנשים לפי שם המשפחה שלהם. ישנן דרכים רבות למיין ערכים. דרכים אשר שונות זו מזו ברמת הפשטות, היעילות והמהירות שלהן.

מבחינים בשני סוגי מיון: מיון עולה (הערך הקטן ביותר ראשון) ומיון יורד (הערך הגדול ביותר ראשון). (ניתן לבצע מיון בטבלה הבאה לפי כל אחד מהשדות על ידי לחיצה על כותרת השדה)

מספר זהות שם משפחה שם פרטי
55555555 תמם ראובן
11111111 שפירא אברהם
33333333 אוחנה גל
22222222 ברקוביץ טל

מיון נחוץ מאוד כאשר עוסקים בעיבוד מידע במסדי נתונים, דבר שמפשט ומייעל עבודה עם נתונים ובכללה איתור תוכן, פעילות בין טבלאות ופעילויות אריתמטיות. כך בדרך כלל במסדי נתונים שדה חשוב לפעילות מכל סוג, יכלל באינדקס שהוא שדה ממוין, וכל תוכן שיוכנס לתוכו ימוין אוטומטית מאחרי הקלעים.

באלגוריתמים הדבר נחוץ כי לעיתים קרובות פעולות על קלט ממוין הן מסיבוכיות נמוכה יותר. למשל, ניתן למצוא את הערך המקסימלי והמינימלי (או בכלל, ה- בגודלו) במערך ממוין בסיבוכיות זמן של ולמצוא איבר כללי במערך בסיבוכיות לוגריתמית. (באמצעות חיפוש בינארי, למשל)

אלגוריתמי מיון מבוססי השוואות

ישנם אלגוריתמי מיון רבים, הנבדלים זה מזה בסיבוכיות הזמן והזיכרון שלהם, בפשטות מימושם ובהנחה על הפעולות הבסיסיות. חלוקה מקובלת היא בין אלגוריתמי המיון המבוססים על פעולת השוואה בין האיברים הנתונים לבין אלה המאפשרים פעולות כלליות על האיברים. כל אלגוריתמי המיון המבוססים על פעולת השוואה דורשים לפחות פעולות השוואה במקרה הגרוע על-מנת לבצעם.

ניתן להגיע למסקנה זו על ידי התבוננות ב"עץ השוואות" המתאר מיון כללי, בו כל קודקוד מסמן השוואה בין שני איברים, כל קשת מסמלת תוצאה אחרת של אותה השוואה וכל עלה מייצג את סיום פעילות האלגוריתם ואת הסדר בו יש לסדר את הנתונים.

מאחר שקיימות לכל איברים דרכים לסדרם, הרי שמספר העלים בעץ יהיה , ומכיוון שדרגת העץ חסומה, לפי משפט מתורת הגרפים גובה העץ (מספר ההשוואות שהאלגוריתם יאלץ לעשות לפני שיגיע לעלה) יהיה . ניתן לראות ש- (באמצעות נוסחת סטירלינג) ומכאן נובע החסם.


רשימת אלגוריתמי מיון

מיונים מבוססי השוואות:

  • מיון בועות (bubble sort), הידוע גם בכינוי מיון החלפה הוא מיון פשוט, שבו מושווים שני איברים סמוכים במערך המתמיין. מיון זה הפועל בסיבוכיות של . המיון קיבל את שמו מהדרך בה מבעבעים אלמנטים במערך. מבחינת צריכת זיכרון האלגוריתם חסכוני, והוא דורש .
  • מיון הכנסה (insertion sort) הוא אלגוריתם מיון השוואתי פשוט. הוא יעיל עבור מערכים קטנים ועבור מערכים ממוינים או כמעט ממוינים. סיבוכיות הזמן של האלגוריתם היא . מבחינת צריכת זיכרון האלגוריתם חסכוני, והוא דורש .
  • מיון בחירה (selection sort) הוא אלגוריתם השוואתי פשוט אך לא יעיל, שבו נמצא בכל צעד האיבר בעל הערך הקטן ביותר, והוא מועבר למקומו. סיבוכיות הזמן של האלגוריתם היא . מבחינת צריכת זיכרון האלגוריתם חסכוני, והוא דורש .
  • מיון ערימה (heap sort) הוא אלגוריתם מיון אשר נעזר במבנה נתונים הקרוי ערימה כדי לממש את מיון הבחירה בצורה יעילה יותר. האלגוריתם בונה ערימה מהקלט ואז שולף בכל פעם את האיבר שבראש הערימה, שהוא האיבר הגדול ביותר בערימה, אל הפלט. סיבוכיות האלגוריתם היא . יתרונו לעומת מיון מיזוג הוא שאינו דורש זיכרון נוסף פרט לזיכרון שבו מאוחסן הקלט.
  • מיון מהיר (quicksort) הוא אלגוריתם מיון השוואתי אקראי מהיר במיוחד. זהו אלגוריתם רקורסיבי הפועל בשיטת הפרד ומשול. סיבוכיות הזמן הממוצע של האלגוריתם הוא פעולות, אך במקרה הגרוע עלול לדרוש פעולות.
  • מיון מיזוג (mergesort) הוא אלגוריתם מיון רקורסיבי קל למימוש המתבסס על קלות מיזוגם של מערכים ממוינים. סיבוכיות הזמן במקרה הגרוע היא פעולות, אך זוהי גם הסיבוכיות במקרה הטוב ביותר. סיבוכיות המקום היא .
  • Shell sort מיון "של" על שמו של הממציא. אלגוריתם ה-Shell Sort פועל בשלבים, בהם הוא ממיין תאי מערך הרחוקים זה מזה מרחק שהולך וקטן בכל שלב, כשהמיון עצמו מתבצע בצורת מיון הכנסה.
  • מיון מסרק (comb sort) הוא אלגוריתם מיון שמשפר את מיון בועות. הרעיון הבסיסי הוא להעלים צבים- ערכים קטנים המופיעים לקראת סוף הרשימה, היות שבמיון בועות הללו מאטים מאוד את המיון. (ארנבים- ערכים גדולים סביב תחילת הרשימה- לא מהווים בעיה במיון בועות).
  • רשת מיון (sorting network) מאפשרת למיין מספר קבוע מראש של קלטים. היתרון הגדול של רשת מיון הוא שהיא נוחה למיקבול (כלומר לחלוקה למשימות היכולות להתבצע במקביל). כך, כשהמיון נעשה על מחשב המאפשר בצוע מקבילי ניתן להגיע באופן מעשי לביצועים של .
  • מיון ספגטי (spaghetti sort) דורש עיבוד מקבילי ורץ בזמן ליניארי.

מיונים עם הנחות נוספות על הקלט:

  • מיון מנייה (counting sort) הוא אלגוריתם למיון מספרים שלמים המתבסס על העובדה שהמספרים נמצאים בטווח חסום כדי לבצע את המיון בזמן מהיר יותר מזה שמסוגלים לו אלגוריתמי המיון מבוססי ההשוואות. בצורה אינטואיטיבית, די למיון לעבור על קבוצת האיברים שרוצים למיין ולמנות את מספר המופעים של כל אחד מהאיברים, ומכאן שמו של האלגוריתם.
  • מיון סלים (bucket sort) הוא מיון של קבוצת מספרים ממשיים כאשר ידוע שפיזור האיברים אחיד (קרי, מקיימים התפלגות אחידה בדידה).
  • מיון בסיס (radix sort) הוא אלגוריתם למיון מספרים, המסתמך על מידע נוסף שאומר שכמות הספרות שבאמצעותן מיוצג כל מספר חסומה על ידי קבוע. (למשל: כמות הספרות של המספר 1234567 היא 7).

במיונים הללו (מנייה, סלים, בסיס) בעזרת מידע נוסף על הקלט סיבוכיות האלגוריתם יורדת אל מתחת לסיבוכיות המינימלית של אלגוריתם מיון מבוסס השוואות עד ל במקום .

  • מיון חיצוני הוא שם כולל לקבוצה של אלגוריתמי מיון המסוגלים להתמודד עם כמויות גדולות של מידע. מיון חיצוני נדרש כאשר המידע שצריך למיין לא נכנס לזיכרון הראשי של המחשב (לרוב ה-RAM) ומשתמשים בהתקן זיכרון איטי יותר (לרוב דיסק קשיח).

לקריאה נוספת

  • דונלד קנות, Sorting and Searching, כרך 3 בסדרה The Art of Computer Programming.

קישורים חיצוניים

ויקישיתוף מדיה וקבצים בנושא אלגוריתם מיון בוויקישיתוף