בשפת הסף, בצורתה הבסיסית, קיימת התאמה בין ההוראות שכותב המתכנת ובין ההוראות המופקות מהן בשפת מכונה, כלומר, כל הוראה יחידה באסמבלי מתורגמת להוראה אחת או יותר בשפת מכונה. לכן, כמו שפת המכונה, גם שפת הסף פועלת באופן ישיר על תאי הזיכרון של המחשב, על האוגרים הפנימיים של המעבד ועל יציאות הקלט/פלט של המחשב, ובפרטנות רבה. כתוצאה מכך, לכל סדרת מעבדים יש שפת סף משלה, כתלות בסט הפקודות של המעבד.
תכנות בשפת סף נחשב לקשה הרבה יותר מבשפות התכנות העיליות, בין היתר משום ששפת סף אינה אינטואיטיבית וקלה לקריאה כמו השפות העיליות. תכנות בשפת סף, במיוחד כזה הנחשב ליעיל, מחייב להכיר היטב את חומרת המחשב, בעוד שבשפות עיליות המהדר דואג להתאימן לחומרה. מעבר לכך, לשם ביצוע כל פעולה, ולו הפשוטה ביותר, עשויות להידרש הוראות שפת סף רבות. לדוגמה, כדי להציב במשתנה A את סכומם של המשתנים B ו־C, מספיקה בשפה עילית פקודה יחידה מצורה דומה ל־ A := B + C. באסמבלי, לעומת זאת, הפעולה תהיה ארוכה יותר, לדוגמה:
movax,B – העבר את הערך B אל אוגר ax
addax,C – הוסף את הערך C לערך שנמצא באוגר ax
movA,ax – העבר את הערך שנמצא באוגר ax אל הכתובת של המשתנה A
התכנות בשפת סף היה נפוץ למדי ואפילו דומיננטי, למרות הקושי שבו, עד לתחילת שנות ה־70 של המאה העשרים, וזאת בשל משאבי המחשב המוגבלים שעמדו לרשות המתכנתים ובשל היכולת ליצור קוד יעיל במהירות־הביצוע וחסכוני בזיכרון, יותר מקוד שנוצר בשפות עיליות. בעקבות השתכללות המהדרים של השפות העיליות, לא נותר עוד הבדל משמעותי שיצדיק את הטרחה שבכתיבה בשפת סף, והשימוש בה נדיר כיום. כיום היא משמשת בעיקר כותבי מערכות הפעלה, מפתחים של חלקי תוכנה שדרושים להם ביצועים מהירים במיוחד או תקשורת ישירה עם רכיבי חומרה (כמו מנהלי התקנים), וכן כותבי וירוסים מתוחכמים.
המהדר של שפת הסף, המתרגם את קובצי ההוראות לשפת מכונה, נקרא אסמבלר (Assembler).
בגלל ששפת סף תלויה בקוד המכונה שספציפי למערכות מחשוב שונות, כל שפת סף יכולה לשמש רק לארכיטקטורת מחשב מסוימת.
אסמבלי במעבדי 8086
הקדמה
נכון לשנת 2020, חלק גדול מהמעבדים בשוק מבוססים על סדרת 8086 של אינטל, וגם שפת הסף שלהם מבוססת על שפת הסף של המעבד אינטל 8086.
היות ששפת אסמבלי עוסקת בגישה ישירה לזיכרון ולהתקנים חיצוניים (באמצעות out ו־in), רצוי להכיר מספר עקרונות מנחים בסיסים:
ארכיטקטורת פון נוימן – על פי ארכיטקטורה זו, אשר פותחה על ידי מדען המחשב והמתמטיקאי ג'ון פון נוימן במאה ה־20, הנתונים וההוראות מאוחסנים באותו זיכרון. המחשב עצמו מחולק ל־4 רכיבים מרכזיים:
זיכרון – מכיל נתונים, כתובות, והוראות
מעבד – מקבל, מפרש ומריץ את ההוראות מהזיכרון
התקנים חיצוניים (I/O – Input/Output) – כגון מקלדת, עכבר, רמקול, מיקרופון או דיסק און קי.
אפיקי נתונים (Busses) – פסים אלו אחראים להעברת נתונים, הוראות, ופקודות בקרה בין המעבד, הזיכרון, וההתקנים החיצוניים. בעבר, רוחב של אפיק נתונים היה בגודל "מילה" (16 סיביות) או 32 סיביות ("מילה כפולה" – Double Word), אך במחשבים רבים היום הוא כבר 64 סיביות.
הגדרת סביבת עבודה
כתיבת הקוד בשפת סף מחולקת למספר שדות הנקראים מקטעים (segments). במקטע אשר מיועד ליצירת משתנים, יש ליצור משתנים. במקטע אשר נועד להגדרת מחסניות, יש להגדיר מחסניות. במקטע אשר מיועד לכתיבת קוד, יש לכתוב קוד, וכן הלאה. המקטעים נקראים בשמות שונים בסביבות עבודה שונות. טקסט זה יכיל את 3 המקטעים העיקריים:
מקטע המידע – data segment, נקרא לעיתים DATASEG
מקטע המחסנית – stack segment
מקטע הקוד – Code Segment, אשר נקרא לעיתים CODESEG
אחת מסביבות העבודה הנוחות ביותר ללמידת שפת סף היא Emu8086 אשר פועלת במערכת ההפעלה Windows. סביבה זו היא בעצם אמולציה של המעבד הישן 8086 של אינטל (אשר פתח את סדרת מעבדי x86).
אוגרים (Registers) הם יחידות זיכרון של המעבד שבאמצעותן מתבצעות פעולות שונות. למעבד לוקח זמן מאוד קצר לגשת אליהם ולכן שימוש בהם הוא יעיל.
האוגרים בטבלה להלן נכונים לדור הבסיסי של מעבד 8086 – כיום נעשו שינויים – הוסיפו ושינו אוגרים בהתאם להתפתחות הטכנולוגיה. למשל ax, שגודלו 16 סיביות הוא חלק מאוגר eax שגודלו 32 סיביות (Double Word). עם זאת, האוגרים המצוינים בטבלה עדיין תקפים מפאת עקרון התאימות לאחור של מעבדי אינטל (קוד שנכתב למעבד ישן יותר יהיה ניתן להרצה על מעבד חדיש יותר). כל אחד מארבעת האוגרים ax, bx, cx ו־dx מורכב מ־2 אוגרים של 8 ביט – h (high) ו־l (low). שינוי של אחד מהאוגרים הקטנים יוביל לשינוי אוגר גדול, ולהפך – שינוי של אוגר גדול יוביל לשינוי של האוגרים הקטנים. לדוגמה, אם נשנה את al, ערך ax ישתנה בהתאם, ולהפך.
מייצג שורה של ״דגלים״ אשר נדלקים בהתאם להתרחשותם של אירועים שונים בתוכנה. לדוגמה, דגל האפס (zero flag) "יוּרם" (יהפוך מ־0 ל־1) כאשר תוצאה של פקודה כלשהי תהיה 0.
פקודות מובנות באסמבלי יכולות לקבל בין 0 ל־2 ערכים. הן מבצעות פעולות לוגיות ואריתמטיות כגון השמה, חיבור, חיסור, כפל, חילוק, השוואה, קפיצות (jmp), קפיצות מותנות (je, jne, jb, ja וכו׳).