У Вікіпедії є статті про інші значення цього терміна: Мова (значення).
Мо́ва програмува́ння (англ.Programming language) — це штучна мова, створена для передачі командмашинам, зокрема комп'ютерам. Мови програмування використовуються для створення програм, які контролюють поведінку машин, та для запису алгоритмів.
Суворіше визначення: мова програмування — це система позначень для опису алгоритмів і структур даних[1], певна штучна формальна система, засобами якої можна виражати алгоритми[2]. Мову програмування визначає набір лексичних, синтаксичних і семантичних правил, що задають зовнішній вигляд програми та дії, які виконує виконавець (комп'ютер) під її управлінням.[3]
З часу створення перших програмованих машин було створено понад дві з половиною тисячі мов програмування[4]. Щороку до них додаються нові. Деякими мовами вміє користуватись тільки невелике число їхніх розробників, інші стають відомі мільйонам людей. Професійні програмісти зазвичай застосовують у своїй роботі декілька мов програмування.
Означення
Мова програмування — це нотація для запису програм, які є специфікаціями якогось обчислення або алгоритму[5].
Перші мови програмування з'явилися задовго до появи перших комп'ютерів. Ще в XIX столітті існували «програмовані» ткацькі верстати та піаніно-програвачі, спосіб програмування яких нагадує так звані предметно-орієнтовані мови програмування. На початку XX століття починають використовувати перфокарти та механічну обробку даних. У 1930—1940 рр. виникає лямбда-числення та машина Тюринга, які застосовували математичну абстракцію для опису алгоритмів. Лямбда-числення згодом здійснило вплив на проєктування мов програмування[6].
У 1940 роках створюються перші електричні двійкові комп'ютери. Вважається, що першу мову програмування високого рівня — Планкалькюль (нім.Plankalkül) розробив німець Конрад Цузе в період 1943—1945 років, але в той час вона не була реалізована і нею не зацікавилися. Реалізацією мови зайнялися і здійснили її лише в 1998—2000 роках[7].
Наприкінці 1940-х — початку 1950-х років застосовували інтерпретовані системи кодування, коли певні команди мови програмування кодували числами, які вже інтерпретувалися машинним кодом. Ці системи називалися «автоматичним програмуванням» і були простішими для програмування, ніж машинні коди, але могли мати значно меншу (до 50 разів) швидкодію, через що перевагу часто надавали машинним кодам. До таких систем належали — Short Code для BINAC (1949) і UNIVAC I (1952), Speedcoding[en] для IBM 701, розроблена Джоном Бекусом у 1954 році.
Першою багатоконцептуальною (імперативною та декларативною) мовою програмування високого рівня була Адресна мова програмування (реалізована 1955 року на ЕОМ «Київ»). Мова має опосередковану адресацію вищих рангів (вказівники є аналогом). В ЕОМ «Київ» апаратно була реалізована «штрих-операція», аналогом якої є розіменування вказівників. Операція багаторазового розіменування вказівників (Multiple indirection) була реалізована груповими операціями модернізації адрес задля прискорення обробки деревоподібних форматів (Абстрактні типи даних є частковим випадком, оскільки деревоподібні формати припускають наявність у вузлах «дерева» процедур обробки даних, як в ООП). Адресна мова програмування має вичерпні засоби декларативного програмування. До найпотужнішого декларативного засобу належить «мінус штрих-операція», яка є оберненою до розіменування вказівника. Використання «мінус штрих-операції» нагадує використання первинних і зовнішніх ключів в реляційних базах даних: по заданому первинному ключу визначити місце розташування (адреси) в іншій таблиці, зовнішні ключі яких збігаються з заданим первинним ключем[8].
Першою широковживаною компільованою мовою став розроблений групою Джона Бекуса Фортран, анонсований 1954 року та випущений 1957 року для IBM 704. Основним призначенням Фортрану були швидкі наукові обчислення, оголошувалося, що швидкодія згенерованого компілятором коду майже не відрізнятиметься від написаного вручну машинного коду. Уже у квітні 1958 року близько половини програм для IBM 704 були написані на Фортрані. Випущений 1958 року Фортран II дозволяв незалежну компіляцію підпрограм, що давало змогу створювати більші програми, оскільки через низьку надійність IBM 704 не можна було скомпілювати без збоїв велику програму (понад 300—400 рядків) одразу. Розроблений у 1960—1962 роках Фортран IV був однією з найпоширеніших мов того часу і лишався стандартною версією Фортрану до появи 1978 року Фортрану 77.
Наприкінці 1950-х років почали розробляти різні мови програмування. 1958 року декілька значних груп комп'ютерних користувачів у США, включаючи SHARE — групу науковців-користувачів IBM і USE (UNIVAC Scientific Exchange, група науковців-користувачів UNIVAC) запропонували ACM заснувати робочу групу зі створення універсальної мови програмування. Також ще 1955 року німецьке Товариство прикладної математики й механіки (GAMM) заснувало комітет зі створення універсальної мови програмування. У кінці травня 1958 року було проведено зустріч у Цюриху між ACM і GAMM, на матеріалах якої у грудні опубліковано ALGOL 58 Report. На його основі було створено 3 значні реалізації — MAD (1961), NELIAC (1963), JOVIAL (1963). З них лише JOVIAL отримав поширення, ставши на чверть століття офіційною мовою програмування у Військово-морських силах США. SHARE та IBM почали створення власної реалізації ALGOL, але припинили, врахувавши витрати на створення і просування Фортрану.
Упродовж 1959 року ALGOL 58 широко обговорювався, була запропонована нотація для опису синтаксису мов програмування — форма Бекуса — Наура. 1960 року проведено чергову зустріч і опубліковано ALGOL 60 Report. ALGOL вплинув на багато мов програмування і став стандартною мовою для публікації алгоритмів, але через ряд причин не одержав широкого розповсюдження — він був заскладним, і не було реалізацій, які підтримували його повністю, відсутність стандартного введення-виведення зумовила появу різних несумісних реалізацій, деякі неоднозначності опису мови так і не були розв'язані. Окрім того, широкого вжитку уже набув Фортран, і IBM не підтримала ALGOL.
1959 року було проведено зустріч у Пентагоні для створення мови CBL (Common Business Language), засновано комітет з її створення, і 1960 року опубліковано початкову специфікацію COBOL 60, який невдовзі став першою мовою, ухваленою у Міністерстві оборони США. 1968 року COBOL було стандартизовано ANSI.
У 1964 році було створено спрощену мову BASIC (Beginners All-purpose Symbolic Instruction Code) для навчання програмуванню студентів, які переважно спеціалізувалися у вільних мистецтвах, а не технічних науках.
Тоді як науковці переважно використовували Фортран, а бізнес — COBOL, 1963 року в IBM вирішили створити універсальну платформу IBM/360 і мову програмування. У стислі терміни до 1965 року було розроблено мову PL/I, яка поєднувала можливості Фортрану, ALGOL і COBOL, і виявилась заскладною, хоча і була у широкому вжитку в 1970-х у наукових і бізнес-задачах, також її підмножини (PL/C, PL/CS) використовувалися для навчання програмуванню.
На початку 1960-х років було створено перші мови із динамічною типізацією — APL і SNOBOL.
1965 року Ніклаус Вірт і Тоні Гоар запропонували комітету з розвитку мови ALGOL свою версію, яку згодом назвали ALGOL-W і застосовували для навчання в деяких університетах. Пропозиція була відхилена через незначну кількість змін на користь значно складнішого ALGOL 68.
У ALGOL 68 з'явилися визначення структур даних і динамічні масиви. ALGOL 68 став першою мовою із формальною специфікацією, яка, однак, була складною для розуміння.
1971 року Вірт опублікував опис мови Pascal, яка у 1970-х стала загальновживаною для навчання студентів.
1975 року Міністерство оборони США утворило міжнародну групу для створення нової мови програмування для власних потреб, конкурс 1979 року виграла мова Ада.
2014 року на конференції розробників WWDC 2014 було представлено мову Swift.
2014 року презентовано перший офіційний реліз мови програмування Crystal[10].
Елементи
Синтаксис
Синтаксис мови програмування визначає те, як буде виглядати програма цією мовою, зокрема, як пишуться оператори, оголошення й інші мовні конструкції[11]. Наприклад, оголошення масиву V з десяти елементів у форматі цілих чисел у мові С буде виглядати так:
Термін семантика стосується значення мови, на відміну від її форми (синтаксису). Наприклад, термін «семантика оператора» означає дію, яку виконує оператор під час виконання програми. Таким чином, семантика мови програмування — це сукупність семантик окремих елементів, дозволених синтаксисом мови.
Статична семантика
Статична семантика описує обмеження на структуру текстів мови які важко або неможливо виразити звичайними структурними формалізмами[5]. Для компільованих мов, статична семантика, по суті, це правила які можуть бути перевіреними на етапі компіляції. Наприклад перевірка того що кожен ідентифікатор задекларований до того як використовується (в мовах які потребують таких декларацій) або що варіанти в операторі switch різні[12]. Багато важливих обмежень цього типу, такі як перевірка використання ідентифікатора в правильному контексті (наприклад заборона додавання чисел до функцій), або що виклики підпрограма мають правильну кількість і типи аргументів можуть бути забезпеченні визначенням їх як правил логіки яка називається системою типізації. Інші форми статичного аналізу, такі як аналіз потоку даних[en] також можуть бути частиною статичної семантики. Такі мови програмування як Java та С# мають як частину своєї статичної семантики definite assignment analysis[en] — форму аналізу потоку даних.
Коли дані описані, комп'ютер має отримати інструкції щось робити з даними. Наприклад, семантика може описувати стратегії обчислення за якими отримуються значення виразів, або спосіб яким інструкції визначають потік керування. Динамічна семантика мови (також відома як семантика виконання, англ.execution semantics) визначає як і коли різні конструкції мови повинні задавати поведінку програми. Існує багато способів задання семантики виконання. Для опису семантики виконання мов, які часто застосовуються на практиці, використовується природна мова. Велика частина досліджень мов програмування стосується формальної семантики мов програмування.
Типи даних
Область зберігання даних в апаратній частині комп'ютера (пам'ять, регістри та зовнішні запам'ятовувальні пристрої) зазвичай мають доволі просту структуру в вигляді послідовності бітів, згрупованих в байти або слова. Проте в віртуальному комп'ютері, як правило, організовано складнішим чином — в різні моменти виконання програми використовуються такі форми зберігання даних, як стеки, масиви, числа, символьні рядки та інші. Один або декілька однотипних елементів даних, об'єднаних в одне ціле в віртуальному комп'ютері в певний момент виконання програми, заведено називати об'єктом даних. При виконанні програми існує багато об'єктів даних різних типів. Тип даних — це деякий клас об'єктів даних разом з набором операцій для створення і роботи з ним[13]. В кожній мові програмування є певний набір вбудованих примітивних типів даних. Додатково в мові можуть бути передбачені засоби, що дозволяють програмісту визначати нові типи даних.
Мови програмування високого рівня оперують сутностями ближчими людині, такими як об'єкти, змінні, функції. Мови програмування нижчого рівня оперують сутностями ближчими машині: байти, адреси, інструкції. Текст програми мовою високого рівня зазвичай набагато коротший ніж текст такої самої програми мовою низького рівня, проте програма має більший розмір.
Ділянка застосування
Універсальні та спеціалізовані. Спеціалізовані мови теж бувають Тюрінг-повні, та все ж їх ділянка застосування обмежена, як, наприклад, у мови shell.
Імперативні мови ґрунтуються на ідеї змінної, значення якої змінюється присвоєнням. Вони називаються імперативними (лат.imperative — наказовий), оскільки складаються із послідовностей команд, які звичайно містять присвоєння змінних <code><назва_змінної> = <[[вираз]]></code>, де вираз може посилатися на значення змінних присвоєних попередніми командами.
Програма компільованою мовою за допомогою компілятора (особливої програми) (компілюється) в машинний код (набір інструкцій) для даного типу процесора, що записується у об'єктний модуль. З одного або кількох об'єктних файлів компонувальник формує виконуваний файл, який може бути запущений на виконання як окрема програма. Іншими словами, компілятор переводить вихідний текст програми з мови програмування високого рівня в двійкові коди інструкцій процесора.
Якщо програма написана скриптовою мовою, то інтерпретатор безпосередньо виконує (інтерпретує) вихідний текст без попереднього перекладу. При цьому програма залишається мовою оригіналу і не може бути запущена без інтерпретатора. Процесор комп'ютера, у зв'язку з цим, можна назвати інтерпретатором для машинного коду.
Поділ на компільовані і інтерпретовані мови є умовним. Так, для будь-якої традиційно компіляційної мови, як, наприклад, Паскаль, можна написати інтерпретатор. Крім того, більшість сучасних «чистих» інтерпретаторів не виконують конструкції мови безпосередньо, а компілюють їх в деяке високорівневе проміжне представлення (наприклад, з розіменуванням змінних і розкриттям макросів).
Для будь-якої інтерпретувальної мови можна створити компілятор — наприклад, мова Лісп, початково інтерпретована, може компілюватися без обмежень. Створюваний під час виконання програми код може так само динамічно компілюватися під час виконання.
Як правило, скомпільовані програми виконуються швидше і не вимагають для виконання додаткових програм, оскільки вже переведені на машинну мову. Разом з тим, при кожній зміні тексту програми потрібно її перекомпіляція, що уповільнює процес розробки. Крім того, скомпільована програма може виконуватися тільки на тому ж типі комп'ютерів і, як правило, під тією ж операційною системою, на яку був розрахований компілятор. Щоб створити виконуваний файл для машини іншого типу, потрібна нова компіляція.
Інтерпретовані мови володіють деякими специфічними додатковими можливостями (див. вище), крім того, програми на них можна запускати відразу ж після зміни, що полегшує розробку. Програма скриптовою мовою може бути найчастіше запущена на різних типах машин та операційних систем без додаткових зусиль.
Однак інтерпретовані програми виконуються помітно повільніше, ніж компільовані, крім того, вони не можуть виконуватися без програми-інтерпретатора.
Деякі мови, наприклад, Java та C#, перебувають між компільованими і інтерпретованими. А саме, програма компілюється не в машинну мову, а в машинно-незалежний код низького рівня, байт-код. Далі байт-код виконується віртуальною машиною. Для виконання байт-коду зазвичай використовується інтерпретація, хоча окремі його частини для прискорення роботи програми можуть бути трансльовані в машинний код безпосередньо під час виконання програми за технологією компіляції «на льоту» (Just-in-time compilation, JIT). Для Java байт-код виконується віртуальною машиною Java (Java Virtual Machine, JVM), для C# — Common Language Runtime.
Подібний підхід у деякому сенсі дозволяє використовувати плюси як інтерпретаторів, так і компіляторів. Слід згадати, що є мови, які мають і інтерпретатор, і компілятор (Форт (Forth)).
Процедури та функції
Підпрограми діляться на процедури та функції: Синтаксично процедури та функції складаються з заголовка (що містить ключове слово procedure або function, ім'ям, за яким може слідувати опис передаваних параметрів в дужках, тип повертаного значення через символ двокрапки для функцій і крапки з комою для процедур), після заголовка слідує 'тіло', після якого ставиться символ ;.
Тіло процедури, як і програми, своєю чергою може містити описи процедур і функцій. Таким чином, процедури і функції можуть бути вкладені один в одного як завгодно глибоко, при цьому тіло програми — саме верхнє в ланцюжку.
Причому вміст секцій опису змінних, типів, констант, зовнішнього тіла (процедури, функції, програми), розташованих перед описом процедури/функції, доступні усередині неї. Також, в більшості діалектів з процедури можна звертатися до параметрів зовнішньої процедури.
Услід за заголовком процедур/функцій замість тіла може поміщатися ключове слово forward, це робиться в тому випадку, якщо опис процедури/функції розташовується в програмі після її виклику, і пов'язано з підтримуваною в Паскалі можливістю компіляції програми за один прохід.
Процедури відрізняються від функцій тим, що функції повертають якесь значення, а процедури — ні.
Об'єктно-орієнтоване програмування (ООП) — це технологія створення складного програмного забезпечення, яке засноване на представленні програми у вигляді сукупності об'єктів, кожен з яких є екземпляром певного класу, а класи утворюють ієрархію зі спадкоємством властивостей.
Основна перевага ООП — це значне спрощення процесів створення та модифікації програмних систем. Набагато легше маніпулювати 100 об'єктами, кожен з яких сам відповідає за свою поведінку і обробку даних пов'язаних з ним, ніж тисячами функцій розкиданих по різних модулях.
Основні недоліки в ООП — це деяке зниження швидкодії через складнішу організацію програмної системи, а також, як правило, помітне збільшення об'єму бінарного коду (особливо при використанні стандартних бібліотек класів в невеликих програмах) через те, що більшість сучасних компіляторів і компонувальників не здатні виявити і видалити весь код, що доводиться на невживані класи, віртуальні методи і інші елементи ООП.
Існує кілька підходів до визначення семантики мов програмування.
Найбільш широко поширені наступні три різновиди семантик: операційна, дериваційна (аксіоматична) і денотаційна (математична)[джерело?].
При описі семантики в рамках операційного підходу зазвичай виконання конструкцій мови програмування інтерпретується за допомогою деякої уявної (абстрактної) ЕОМ.
Дериваційна семантика описує наслідки виконання конструкцій мови за допомогою мови логіки і завдання перед- і постумов.
Денотаційна семантика оперує поняттями, типовими для математики — множини, відповідності, а також судження, твердження та ін.
Перші комп'ютери доводилось програмувати двійковими машинними кодами. Проте програмувати таким чином — доволі трудомістке і важке завдання[14]. Для спрощення цього завдання почали з'являтися мови програмування низького рівня, які дозволяли задавати машинні команди в зрозумілішому для людини вигляді. Для перетворення їх у двійковий код були створені спеціальні програми — асемблери.
Прикладом мови низького рівня є мова асемблера. Мови низького рівня орієнтовані на конкретний тип процесора і враховують його особливості, тому для перенесення програми на асемблері на іншу апаратну платформу її потрібно майже цілком переписати. Певні відмінності є і в синтаксисі програм під різні компілятори. Щоправда, центральні процесори для комп'ютерів фірм AMD та Intel практично сумісні й відрізняються лише деякими специфічними командами. А ось спеціалізовані процесори для інших пристроїв, наприклад, відеокарт, телефонів містять суттєві відмінності.
Переваги
За допомогою мов низького рівня створюють ефективні й компактні програми, оскільки розробник отримує доступ до всіх можливостей процесора.
Вади
Програміст, що працює з мовами низького рівня, має бути високої кваліфікації, добре розуміти будову мікропроцесорної системи, для якої створює програму.
Результівна програма не може бути перенесена на комп'ютер або пристрій з іншим типом процесора; часто труднощі виникають і при перенесенні програми для іншої операційної системи
Значний час розробки великих і складних програм.
Мови низького рівня, як правило, використовують для написання невеликих системних програм, драйверів пристроїв, модулів стиків з нестандартним обладнанням, програмування спеціалізованих мікропроцесорів, коли найважливішими вимогами є компактність, швидкодія і можливість прямого доступу до апаратних ресурсів.
компілятори — перетворюють текст програми в машинний код, який можна зберегти і після цього використовувати уже без компілятора (прикладом є виконувальні файли з розширенням *.exe).
інтерпретатори — перетворюють частину програми в машинний код, виконують і після цього переходять до наступної частини. При цьому щоразу при виконанні програми використовується інтерпретатор.
Можна сказати є зрозумілішими людині, ніж комп'ютеру. Особливості конкретних комп'ютерних архітектур в них не враховуються, тому створені програми легко переносяться з комп'ютера на комп'ютер. Здебільшого достатньо просто перекомпілювати програму під певну комп'ютерну архітектурну та операційну систему. Розробляти програми на таких мовах значно простіше і помилок допускається менше. Значно скорочується час розробки програми, що особливо важливо при роботі над великими програмними проєктами.
Наразі у середовищі розробників вважається, що мови програмування, які мають прямий доступ до пам'яті та регістрів або мають асемблерні вставки, потрібно вважати мовами програмування з низьким рівнем абстракції. Тому більшість мов, які вважалися мовами високого рівня до 2000-го року зараз вже такими не вважаються.
Недоліком мов високого рівня є більший розмір програм у порівнянні з програмами мовою низького рівня. Сам текст програм мовою високого рівня менший, проте, якщо взяти у байтах, то код початково писаний на асемблері буде компактніший. Тому в основному мови високого рівня використовуються для розробок програмного забезпечення комп'ютерів, і пристроїв, які мають великий обсяг пам'яті. А різні підвиди асемблеру застосовуються для програмування інших пристроїв, де критичним є розмір програми.
Інколи в літературі та в інтернеті згадують про п'ять поколінь мов програмування[17][18][19][20], щоправда, даний поділ є спірним і суперечним. В професійній літературі з програмування доволі рідко згадують про покоління мов програмування, а більше зосереджуються на функціональній класифікації мов програмування. Крім того, саме віднесення певних мов до різних поколінь різниться у різних авторів.
Поділ на покоління мов програмування почав поширюватись з появою високорівневих мов програмування і до того не застосовувався. Високорівневі мови програмування почали вважатися третім поколінням, асемблерні мови — другим, а машинний код — першим поколінням. Сучасні спроби класифікація мов на четверте і п'яте покоління проводяться різними авторами по різному по різних ознаках і різниця між мовами третього, четвертого та п'ятого покоління часто доволі нечітка. Крім того, багато компаній розробники мов програмування та середовищ програмування для них використовують маркетинговий хід проголошуючи певну мову (мову та інтегроване середовище розробки для неї) п'ятим поколінням.
↑Rojas, Raúl, et al. (2000). «Plankalkül: The First High-Level Programming Language and its Implementation». Institut für Informatik, Freie Universität Berlin, Technical Report B-3/2000. (full text) [Архівовано 18 жовтня 2014 у Wayback Machine.]
↑Future Tense. 29 квітня 2011. Архів оригіналу за 18 вересня 2012. Процитовано 17 квітня 2012. At Mozilla Summit 2010, we launched Rust, a new programming language motivated by safety and concurrency for parallel hardware, the “manycore” future which is upon us.
Pratt T.W., Zelkovitz M.V. Programming languages, design and implementation (4th ed.). Prentice Hall, 2000 (англ.) (Пратт Т., Зелкович М., Языки программирования: разработка и реализация.- Спб.: Питер, 2002.-688 с.)(рос.)
Gabbrielli, Maurizio (2010). Programming languages principles and paradigms. London, New York: Springer,. ISBN9781848829145.
Robert W. Sebesta: Concepts of Programming Languages, 9th ed., Addison Wesley 2009.