Un llenguatge d'assemblador (en anglèsassembly language i l'abreviació asm) és un llenguatge de programació de baix nivell.[1] Consisteix en un conjunt de mnemònics que representen instruccions bàsiques del processador, que tenen una correspondència pràcticament d'un a un entre les instruccions en assemblador i les instruccions del codi màquina de l'arquitectura. Així, cada arquitectura de processador té el seu propi llenguatge assemblador, a diferència de la majoria de llenguatges de programació d'alt nivell, que solen ser portables a través de múltiples arquitectures però requereixen, llavors, ser interpretats o compilats.[2][3]
Un programa utilitari anomenat assemblador és usat per traduir sentències del llenguatge assemblador al codi de màquina del computador objectiu. L'assemblador realitza una traducció més o menys isomorfa (un mapatge d'un a un) des de les sentències mnemòniques a les instruccions i dades de màquina. Això està en contrast amb els llenguatges d'alt nivell, en els quals una sola declaració generalment dona lloc a moltes instruccions de màquina.
Molts sofisticats assembladors ofereixen mecanismes addicionals per facilitar el desenvolupament del programa, controlar el procés d'assemblatge, i l'ajuda de depuració. Particularment, la majoria dels assembladors moderns inclouen una facilitat de macro (descrita més a baix), i es diuen macro assembladors.
Va ser usat principalment en els inicis del desenvolupament de programari, quan encara no es comptava amb potents llenguatges d'alt nivell i els recursos eren limitats. Actualment s'utilitza amb freqüència en ambients acadèmics i d'investigació, especialment quan es requereix la manipulació directa de maquinari, alt rendiment, o un ús de recursos controlat i reduït. També és utilitzat en el desenvolupament de controladors de dispositiu (en anglès, device drivers) i en el desenvolupament de sistemes operatius, a causa de la necessitat de l'accés directe a les instruccions de la màquina. Molts dispositius programables (com els microcontroladors) encara compten amb l'assemblador com l'única manera de ser manipulats.
Història
La primera versió d'un codi de llenguatge assemblador es troba a l'obra de 1947 Coding for A.R.C. del matrimoni de matemàtics Kathleen Booth i Andrew Donald Booth.[4]
Els llenguatges d'assemblador, considerats llenguatges de segona generació, van ser creats durant la dècada de 1950. La seva facilitat respecte als llenguatges de primera generació era òbvia. No era el mateix recordar 10110000 01100001 (llenguatge màquina), que MOV AL, 0x61 (llenguatge d'assemblador).
Inicialment la traducció assemblador-màquina havia de fer-se a mà, però aviat van aparèixer programes traductors (degut en part a la forma exageradament mecànica de la traducció). Més endavant van sergairebé arraconats pels llenguatges de tercera generació que reduïen la complexitat dels programes i la dependència en l'arquitectura de la màquina.
Els seus principals inconvenients són:
La complexitat creix exponencialment com més gran sigui el programa.
El seu principal avantatge és la seva eficiència d'execució.
Actualment només es fan servir per fer programes que interaccionin directament amb el maquinari o amb un gran requeriment d'eficiència.
Els llenguatges d'assemblador van ser desenvolupats per primer cop als anys 1950, quan van ser referits com a llenguatges de programació de segona generació. Per exemple, el SOAP (Symbolic Optimal Assembly Program) era un llenguatge d'assemblador de 1957 per al computador IBM 650. Els llenguatges d'assemblador van eliminar molta de la propensió a errors i del consum de temps de la programació dels llenguatges de primera generació, que es necessitava amb els primers computadors, alliberant als programadors del tedi de recordar codis numèrics i càlculs de direcció. Durant un temps van ser àmpliament utilitzats per a tota mena de programació. Tanmateix, durant els anys 1980 (1990 en els microcomputadors), el seu ús havia sigut en gran part suplantat pels llenguatges d'alt nivell, en la cerca d'una productivitat millorada en programació.
Avui en dia, tot i que els llenguatges d'assemblador són majoritàriament gestionats i generats per compiladors, encara s'utilitzen per a la manipulació directa del maquinari, accés a instruccions especialitzades del processador, o per a resoldre problemes d'acompliment crític. Els usos típics són controlables/conductors (drivers) de dispositius, sistemes encastats de baix nivell, i sistemes de temps real.
Històricament, un gran nombre de programes han sigut escrit completament en llenguatges d'assemblador. Els sistemes operatius van ser quasi exclusivament escrits en llenguatges d'assemblador fins l'àmplia acceptació del llenguatge de programació C en els anys 1970 i principis dels 1980. A més, moltes aplicacions comercials van ser escrites en llenguatges d'assemblador, incloent una gran quantitat del software escrit per grans corporacions per a mainframes d'IBM. Els llenguatges COBOL i FORTRAN van desplaçar molt d'aquest treball de forma eventual, tot i que un gran nombre de grans organitzacions van conservar les infraestructures d'aplicacions en llenguatges d'assemblador fins ben entrats els anys 90.
La majoria dels primers microcomputadors van confiar en els llenguatges d'assemblador codificant a mà, incloent la majoria dels sistemes operatius i de les grans aplicacions. Això es deu al fet que aquests sistemes tenien greus limitacions de recursos, van imposar idiosincràtiques arquitectures de memòria i de pantalla, i van proporcionar serveis de sistema limitats i amb errors. Cal destacar la falta de compiladors de primera classe de llenguatge d'alt nivell adequats per al ús en un microcomputador. Un factor psicològic també podria haver-hi tingut un paper important: la primera generació de programadors de microcomputadors va conservar una actitud d'aficionat.
En un context molt més comercial, les principals raons per a utilitzar els llenguatges d'assemblador era crear programes de mida i sobrecàrrega mínima, i major velocitat i confiabilitat.
Els típics exemples de programes grans en els llenguatges d'assemblador en aquell temps són els sistemes operatius IBM PC DOS i aplicacions primerenques com la full de càlcul Lotus 1-2-3, i quasi tots els jocs populars per a la família Atari 800 de computadors personals. Fins i tot als anys 1990, la majoria dels videojocs de consolar van ser escrits en assemblador, inclosa la majoria de jocs per a la Megra Drive/Genesis i el Super Nintendo Entertainment System. Segons alguns experts de la indústria, el llenguatge d'assemblador era el millor llenguatge de programació disponible per obtenir el millor acompliment del Sega Saturn, una consola per a la qual era notòriament desafiant desenvolupar i programar jocs. El popular joc de arcade NBA Jam (1993) n'és un altre exemple. L'assemblador ha sigut durant un llarg temps, el llenguatge de desenvolupament primari en els computadors Commodore 64, Atari ST, així com el ZX Spectrum. Això va ser així en gran part perquè els dialectes del BASIC en aquests sistemes oferien insuficient velocitat d'execució, així com característiques per aprofitar completament el maquinari disponible. Alguns sistemes, més notablement l'Amiga, fins i tot tenen IDEs amb característiques de depuració i macros molt avançats, com podrien ser el freeware ASM-One assemblar, comparables a les del Microsoft Visual Studio (el ASM-Uno precedeix a aquest).
L'assemblador per al VIC-20 va ser escrit per Don French i publicat per French Silk. Amb 1639 bytes de longitud, el seu autor creu que és més petit que s'ha escriut mai. L'assemblador suportava l'adreçament simbòlic usual i la definició de cadenen de caràcters o cadenes hexadecimals. També permetia expressions de direccions que podien combinar-se amb les operacions d'adició, subtracció, multiplicació, AND lògic, OR lògic, i exponenciació.
Característiques
Els programes escrits en assemblador s'assemblen en fitxers objectes fent servir un programa assemblador. Aquest fitxer posteriorment s'enllaça, mitjançant un programa enllaçador, amb altres possibles llibreries o fitxers objecte formant un executable. Normalment els programes assemblador són capços d'enllaçar els executables, o venen acompanyats d'un programa enllaçador que s'encarrega de dur a terme la tasca.
El propòsit per al que s'han creat aquest tipus de llenguatges és el de facilitar l'escriptura de programes, ja que escriure directament en codi binari, que és l'únic codi assimilat per l'ordinador, és a la pràctica impossible. El llenguatge té una estreta relació amb l'arquitectura en què s'executa el programa.
El fet de diferenciar entre assemblar llenguatges d'assemblador i compilar qualsevol altre llenguatge és pel fet que el programa assemblador és molt més senzill, ja que en els casos més senzills només ha de traduir etiquetes pel codi binari corresponent a la instrucció, per altra banda els compiladors són molt més complexos, ja que han d'interpretar un llenguatge molt més proper a nosaltres, necessitant eines matemàtiques molt més complexes com teoria de llenguatges i expressions regulars per al reconeixement sintàctic del llenguatge en concret.
Per altra banda, un assemblador (de l'anglès assembler) es refereix al programa informàtic que s'encarrega de traduir aquest codi font simbòlic escrit en un llenguatge d'assemblador, en el fitxer objecte que conté el codi màquina, executable directament pel microprocessador pel qual s'ha generat. L'evolució dels llenguatges de programació a partir dels llenguatges d'assemblador va originar l'evolució d'aquests programes assembladors, que feien el mateix que avui dia es coneix com a compiladors. El programa llegeix el fitxer escrit en llenguatge d'assemblador i substitueix cadascun dels mnemotècnics que apareixen pel seu codi d'operació corresponent en sistema binari per la plataforma que es va escollir com a destí en les opcions específiques de l'assemblador.
Els fitxers de codi font en assemblador són fitxers de text ASCII i solen portar l'extensió .ASM
El codi escrit en llenguatge d'assemblador posseeix una certa dificultat per a ser entès, ja que la seva estructura s'assembla al llenguatge de màquina, és a dir, és un llenguatge de baix nivell.
El llenguatge d'assemblador és difícilment portable, és a dir, un codi escrit per a un microprocessador pot necessitar ser modificat per a ser utilitzat en una màquina diferent. Al canviar a una màquina amb una arquitectura diferent, generalment és necessari reescriure’l completament.
Els programes fets per un programador expert en un llenguatge d'assemblador són generalment molt més ràpids i consumeixen menys recursos del sistema (memòria RAM i ROM) que el programa equivalent compilat des d'un llenguatge d'alt nivell. Al programar amb molta cura en llenguatge d'assemblador es poden crear programes que s'executen més ràpidament i ocupen menys espai que el amb el llenguatge d'alt nivell.
Amb un llenguatge d'assemblador es té un control molt precís de les tasques realitzades per un microprocessador, pel que es poden crear segments de codi difícils i/o ineficients de programar en un llenguatge d'alt nivell, ja que, entre altres coses, en el llenguatge d'assemblador es disposa d'instruccions del CPU que generalment no estan disponibles en els llenguatges d'alt nivell.
També es pot controlar el temps en què tarda una rutina en executar-se, i impedir que s'interrompi durant la seva execució.
Tipus de programes assembladors
Podem distingir entre tres tipus d'assembladors:
Assembladors bàsics. Són de molt baix nivell, i la seva feina consisteix bàsicament a oferir nombres simbòlics a les distintes instruccions, paràmetres i coses com les formes d'adreçament. A més, reconeix una sèrie de directives (o meta instruccions) que indiquen certs paràmetres de funcionament de l'assemblador.
Assembladors modulars, o macro assembladors. Descendents dels assembladors bàsics, foren molt populars en les dècades dels 50 i els 60, abans de la generalització dels llenguatges d'alt nivell. Fan tot el que pot fer un assemblador, i a més a més proporcionen una sèrie de directives per definir i invocar macroinstruccions (o simplement, macros). Vegeu X86.
Assembladors modulars 32-bits o d'alt nivell. Són assembladors que van aparèixer com a resposta a una nova arquitectura de processadors de 32 bits, molts d'ells mantenint la compatibilitat podent treballar amb programes amb estructures de 16 bits. A més a més de realitzar la mateixa feina que els anteriors, permetent també l'ús de macros, permetent utilitzar estructures de programació més complexes pròpies dels llenguatges d'alt nivell.
Exemples de llenguatge assemblador
Exemple per a l'arquitectura x86
El següent és un exemple del programa clàssic Hola món escrit per a l'arquitectura de processador x86 (sota el sistema operatiu DOS).
; ---------------------------------------------; Programa que imprimeix un string en la pantalla; ---------------------------------------------.modelsmall; model de memòria.stack; segment del stack.data; segment de dadesCadena1DB'HolaMón.; string a imprimir (finalitzat a $).code; segment del codi; ---------------------------------------------; Inici del programa; ---------------------------------------------programa:; ----------------------------------------------------------------------------------------------; inicia el segment de dades; ----------------------------------------------------------------------------------------------MOVAX,@data; càrrega en AX la direcció del segment de dadesMOVDS,AX; mou la direcció al registro de segment por mitjà de AX; ----------------------------------------------------------------------------------------------; Imprimeix un string en pantalla; ----------------------------------------------------------------------------------------------MOVDX,offsetCadena1; mou a DX la direcció del string a imprimirMOVAH,9; AH = codi per indicar al MS DOS que imprimeixi a la; pantalla, el string en DS:DXINT21h; crida al MS DOS para executar la funció (en aquest ; cas especificada a AH); ----------------------------------------------------------------------------------------------; Finalitza el programa; ----------------------------------------------------------------------------------------------INT20h; crida al MS DOS para finalitzar el programaendprograma
Exemple pel computador virtual (POCA)
Una selecció d'instruccions per a una computadora virtual) amb les corresponents direccions de memòria en les quals se situaran les instruccions.[5] Aquestes direccions NO són estàtiques. Cada instrucció s'acompanya del codi en llenguatge assemblador generat (codi objecte) que coincideix amb l'arquitectura de computador virtual, o conjunt d'instruccions ISA.
ARC és un subconjunt del model d'arquitectura basat en el processador SPARC. ARC (A RISC Computer) conté la majoria de les característiques importants de l'arquitectura SPARC.
Direcció
Etiqueta
Instrucció
Comentaris
.begin
.org 2048
a_start:
.equ 3000
! Direcció de memòria de l'arranjament comença en 3000
2048
ld [lenght], %r1
! S'estableix la longitud de l'arranjament en el registre
ORG8030HincludeT05SEG:SETBTR0JNBuSEG,T05SEG; aquesta subrutina és utilitzadaCLRTR0; per realitzar una compta deCPLuSEG; 0,5 segons mitjaçant laMOVR1,DPL; interrupció del timer 0.INVOKEMOVR2,DPHCJNER2,#07H,T05SEGCJNER1,#78H,T05SEGMOVDPTR,#0RET
↑Principles of Computer Architecture (POCA) – ARCTools computadora virtual disponible para descarga y ejecución del código, acceso el 24 de agosto de 2005
↑Murdocca, Miles J. y Heuring, Vincent P.:Principles of Computer Architecture (2000), Prentice Hall, ISBN 0-201-43664-7
Bibliografia
Robert Britton: MIPS Assembly Language Programming. Prentice Hall, 2003. ISBN 0-13-142044-5
John Waldron: Introduction to RISC Assembly Language Programming. Addison Wesley, 1998. ISBN 0-201-39828-1
ASM Community Book "An online book full of helpful ASM info, tutorials and code examples" by the ASM Community