Состоит из 28 букв и используется для письма справа налево. Арабский алфавит происходит от набатейского письма и окончательно сложился в VI веке[1][2][3].
Ход написания слов такой:
пишут основные части букв, не требующие отрыва пера от бумаги;
добавляют части, которые требуют отрыва пера: отвесную черту букв ط и ظ, верхнюю наклонную черту буквы ك и точки, присущие многим буквам;
Арабское письмо произошло от набатейского письма, развившегося из арамейского письма, которое, в свою очередь, восходит к финикийскому. Арабский алфавит включил в себя все буквы арамейского, а также буквы, отражающие специфически арабские звуки — са (ﺙ), ха (خ), заль (ذ), дад (ض), за (ظ), гайн (غ).
Некоторые исследователи самым ранним из сохранившихся образцов арабского письма считают набатейскую царскую надпись 328 года. По мнению других, эта надпись по сути является арамейской и лишь отражает некоторые характерные черты арабского языка, а самый ранний пример истинно арабского письма датируется 512 годом[5]. Согласно Большой российской энциклопедии, арабская языковедческая традиция относит становление собственно арабского письма к началу VI века[1]. Согласно В. Истрину, древнейшие надписи собственно арабским письмом относятся к VI веку[6].
Обозначение согласных
В арабской письменности каждая из 28 букв, кроме алифа, обозначает один согласный звук. Начертание меняется в зависимости от положения внутри слова (в начале, в конце или в середине, с учётом того, что слова пишутся справа налево). Все буквы одного слова пишутся слитно, за исключением шести букв (алиф, даль, заль, ра, зайн, вав), которые не соединяются со следующей буквой.
Алиф — единственная буква арабского алфавита, не обозначающая согласный звук. В зависимости от контекста она может использоваться для обозначения долгого гласногоа̄ (см. ниже) либо как вспомогательный орфографический знак, не имеющий собственного звукового значения.
Порядок букв
Исторически буквы арабского алфавита располагались в том же порядке, что и в финикийском. Шесть букв, не имевших соответствия в финикийском алфавите, были помещены в конец:
أ ب ج د ﻩ و ز ح ط ي ك ل م ن س ع ف ص ق ر ش ت ث خ ذ ض ظ غ
Этот порядок называется «абджад», по четырём первым буквам: алиф, ба, джим, даль. До перехода к индийским («арабским») цифрам, приведённым выше, для обозначения чисел использовались буквы, и их числовое значение соответствовало их порядку в абджаде. Вскоре после перехода к индийским цифрам порядок алфавита был изменён на современный. Тем не менее арабское слово, обозначающее «алфавит» — أبجدية абджадия — до сих пор напоминает о старом порядке.
В персидском алфавите (и производных от него) порядок букв несколько иной — сначала ва̄в, затем ха̄’. Кроме того, в персидской и пакистанской версиях арабского алфавита отличается начертание буквы ка̄ф — она пишется всегда как в начальной или срединной позиции.
Обозначение гласных
Три долгих гласных звукаарабского языка (а̄, ӯ, ӣ) обозначаются буквами алиф, уау и йа, соответственно. Краткие гласные на письме, как правило, не передаются. В случаях, когда необходимо передать точное звучание слова (например, в Коране и в словарях), для обозначения гласных звуков используются надстрочные и подстрочные огласовки (харакат):
َфатха — наклонная черта, которая ставится над буквой, если за ней следует звук «а»;
ِкасра — черта, которая ставится под буквой, если за ней следует звук «и»;
ُдамма — надстрочный знак, похожий на маленькую запятую и обозначающий звук «у»;
ْсукун — кружок, который ставится над буквой, если после неё нет гласного звука.
В других языках, где используются алфавиты на основе арабского, гласные передаются либо методом матрес лекционис (в персидском передаются только долгие гласные — через алиф, йа и уау), либо с помощью дополнительных знаков (как в уйгурском). Отсутствие средств передачи гласных в арабском языке, для которого это было естественным явлением (в семитских языках гласные не входят в состав основы слова и чередуются при словообразовании и словоизменении), привело в XX в. в ряде мусульманских стран (Турция, Средняя Азия, Индонезия, Малайзия и др.) к вытеснению арабского алфавита иными алфавитами, располагавшими средствами последовательной передачи гласных (латиницей, кириллицей и др.).
Дополнительные знаки
28 букв, приведённых выше, называются хуруф (араб.حروف, ед. ч. حرف харф). Кроме них, в арабском письме используется ещё три дополнительных знака, не являющихся самостоятельными буквами алфавита.
Хамза (гортанная смычка) может писаться как отдельная буква, либо на букве-«подставке» (алиф, вав или йа). Способ написания хамзы определяется контекстом в соответствии с рядом орфографических правил. Вне зависимости от способа написания, хамза всегда обозначает одинаковый звук.
Та-марбута («завязанная та») является формой буквы та. Она пишется только в конце слова и только после огласовки фатха. Когда у буквы та-марбута нет огласовки (например, в конце фразы), она читается как ха. Обычная форма буквы та называется та̄’ мафтӯх̣а (араб.تاء مفتوحة, «открытая та»).
Алиф-максура («укороченный алиф») является формой алифа. Она пишется только в конце слова и сокращается до краткого звука «а» перед алиф-васла следующего слова (в частности, перед приставкой аль-). Обычная форма буквы алиф называется ’алиф мамдӯда (араб.ألف ممدودة, «удлинённый алиф»).
В персидском языке конечная форма буквы йа пишется без двух подстрочных точек, то есть совпадает с алиф максура; в свою очередь, алиф максура в персидском не используется и заменяется обычным конечным алифом, или, хотя и реже, в малочисленных заимствованиях при ней стоит уменьшенная форма алифа, похожая больше на вертикальную васлу. Конечная буква каф совпадает по написанию со срединной (арабский вариант конечной каф считается устаревшим). Помимо этого, в персидском языке имеются свои знаки для звуков «г» (каф с надстрочной чертой), «ж» (ра с тремя надстрочными точками), «п» (ба с тремя подстрочными точками вместо одной), «ч» (джим с тремя точками вместо одной).
Система латинизации арабского письма определена в международном стандарте ISO 233.
Лигатуры
В арабском письме есть большое количество способов слитного написания нескольких букв (лигатур).
Одна лигатура — лям-алиф — является стандартной, и написание этой пары букв иначе, чем при помощи лигатуры, не допускается. Остальные лигатуры необязательны, и их использование зависит от выбранного каллиграфического стиля.
Для обратной совместимости со старым программным обеспечением в Юникоде существует блок «Arabic Presentation Forms-A» (U+FB50…U+FDFF), где зарегистрировано более 300 двухбуквенных лигатур, более 100 трёхбуквенных и несколько словных — например, для слов «Аллах», «акбар», «Мухаммед», «расул» (пророк), «риал» (денежная единица Ирана и ряда арабских стран) и т. д. Существуют также специфические символы, состоящие из отдельных словных лигатур и обозначающих целую фразу — с̣алла̄-Лла̄́ху ‘алайхи ва-саллам — «да благословит его Аллах и приветствует», а также «Басмала».
Выравнивание
В отличие от неслитного письма, в котором для выравнивания ширины строк применяется разрядка слов и межсловных пробелов, арабское письмо позволяет растягивать строки за счёт удлинения связок между буквами. Удлинённая связка называется кашида (перс.كشيده) или татвиль (араб.تطويل). Символ кашиды определён в Юникоде как U+0640, и его можно вставлять в текст для указания предпочтительных мест удлинения связки — подобно «мягкому переносу» в текстах на европейских языках. Средства разметки текста (например, CSS) позволяют указывать, в каких пропорциях удлинение строк должно происходить за счёт кашиды по сравнению с расширением межсловных пробелов[7].
В каллиграфии для растяжения строк используется также особая форма буквы каф, называемая «каф росчерком» или «куфическим каф». Несмотря на то, что это графическая форма обычного каф, она закодирована в Юникоде отдельным символом (U+06AA). Подобно межбуквенным связкам, эта форма буквы каф может растягиваться до любой ширины.
Важное место в арабской культуре письма занимает искусство каллиграфии; в основном по причине религиозного запрета на изображение живых существ (аниконизма) каллиграфия стала одним из основных видов сакрального искусства в мусульманском мире. Имеется несколько стилей каллиграфического письма.
Каллиграфические стили
Один из самых древних стилей — куфи, или куфический (араб.كوفي, от названия города Куфа).
Шрифт, ставший стандартным средством записи для арабского языка — насх (араб.نسخ «копирование»).
Некоторые каллиграфические стили использовались только в декоративных целях, то есть для каллиграмм — художественных произведений каллиграфов. Таков шрифт су́люс (араб.ثلث «треть») с его широкими, свободными росчерками.
Распространение арабского алфавита шло параллельно с распространением ислама. Со временем арабский алфавит стал восприниматься как «истинно исламский» и многие языки Азии и Африки стали использовать его на письме (в том числе и те, которые ранее использовали другие системы письма — например, персидский или яванский). В регионах, где преобладали другие языки, группы населения, исповедующие ислам, стремились сохранить арабский алфавит, несмотря на принятие нового языка, пример — белорусский арабский алфавит. При этом арабский алфавит пополнялся дополнительными буквами для обозначения звуков, отсутствовавших в арабском языке.
В Юникоде зарегистрировано 135 букв (не считая позиционных форм), отсутствующих в арабском алфавите, но используемых в различных системах письма на основе арабской. Ряд букв этого «расширенного арабского алфавита» используются и в арабских текстах для транслитерации звуков, отсутствующих в классическом арабском языке — например таких, как русские звуки «в», «г», «п», «ц», «ч».
В Индонезии и Малайзии в настоящее время используется латиница, но некоторое количество религиозной литературы продолжает издаваться с использованием арабской графики.
До приобретения популярности Юникодом существовало более 20 различных систем кодирования знаков арабского письма. Первой кодировкой, позволяющей работать с арабским текстом, была семибитная кодировка CUDAR-U (1981). Годом позже появилась другая семибитная кодировка ASMO-449, принятая в 1987 г. как международный стандарт ISO-9036. Основанная на ней восьмибитная кодовая страница, нижняя половина которой совпадала с ASCII, — ASMO-708 (1986), была принята в 1987 г. как ISO 8859-6 и стала первым стандартом де-факто на представление арабского текста в компьютерных системах. Однако ввиду того, что стандарт ISO 8859-6 регламентировал лишь около половины позиций кодовой страницы, появились и использовались многочисленные «односторонне совместимые» со стандартом кодировки. Такие модификации ISO 8859-6, несовместимые одна с другой, использовались в операционных системахDOS и Macintosh. В числе расширений стандарта ISO также есть кодировка ASMO-449+, нижняя половина которой совпадает с ASCII, а верхняя — с ASMO-449. В частности, все знаки пунктуации присутствуют в ней в двух вариантах: для письма слева направо (в нижней части) и для письма справа налево (в верхней).
Наиболее распространённая арабская кодовая страница, несовместимая со стандартом ISO, — это CP-1256, используемая в ОС Microsoft Windows. Она содержит в своей верхней половине, вдобавок к символам арабского письма, буквы расширенной латиницы, что позволяет сочетать в одном тексте французский и арабский языки.
В Юникоде буквы арабского алфавита, арабские цифры, знаки пунктуации и другие вспомогательные знаки арабского письма находятся в диапазоне от U+0600 до U+077F, исключая поддиапазон U+0700—U+074F. Большую часть представленных здесь символов составляют знаки «расширенного арабского алфавита» для систем письма на основе арабского алфавита. Арабские формы представления (лигатуры и позиционные варианты написания букв) находятся в диапазоне от U+FB50 до U+FEFF, исключая поддиапазон U+FE00—U+FE70. В общей сложности, символами арабского письма в Юникоде занята 1001 кодовая позиция в 4 блоках.
Ниже сведены в таблицу символы основного арабского блока.
0
1
2
3
4
5
6
7
8
9
A
B
C
D
E
F
0600
؋
،
؍
؎
؏
0610
ؐ
ؑ
ؒ
ؓ
ؔ
ؕ
؛
؞
؟
0620
ء
آ
أ
ؤ
إ
ئ
ا
ب
ة
ت
ث
ج
ح
خ
د
0630
ذ
ر
ز
س
ش
ص
ض
ط
ظ
ع
غ
0640
ـ
ف
ق
ك
ل
م
ن
ه
و
ى
ي
ً
ٌ
ٍ
َ
ُ
0650
ِ
ّ
ْ
ٓ
ٔ
ٕ
ٖ
ٗ
٘
ٙ
ٚ
ٛ
ٜ
ٝ
ٞ
0660
٠
١
٢
٣
٤
٥
٦
٧
٨
٩
٪
٫
٬
٭
ٮ
ٯ
0670
ٰ
ٱ
ٲ
ٳ
ٴ
ٵ
ٶ
ٷ
ٸ
ٹ
ٺ
ٻ
ټ
ٽ
پ
ٿ
0680
ڀ
ځ
ڂ
ڃ
ڄ
څ
چ
ڇ
ڈ
ډ
ڊ
ڋ
ڌ
ڍ
ڎ
ڏ
0690
ڐ
ڑ
ڒ
ړ
ڔ
ڕ
ږ
ڗ
ژ
ڙ
ښ
ڛ
ڜ
ڝ
ڞ
ڟ
06A0
ڠ
ڡ
ڢ
ڣ
ڤ
ڥ
ڦ
ڧ
ڨ
ک
ڪ
ګ
ڬ
ڭ
ڮ
گ
06B0
ڰ
ڱ
ڲ
ڳ
ڴ
ڵ
ڶ
ڷ
ڸ
ڹ
ں
ڻ
ڼ
ڽ
ھ
ڿ
06C0
ۀ
ہ
ۂ
ۃ
ۄ
ۅ
ۆ
ۇ
ۈ
ۉ
ۊ
ۋ
ی
ۍ
ێ
ۏ
06D0
ې
ۑ
ے
ۓ
۔
ە
ۖ
ۗ
ۘ
ۙ
ۚ
ۛ
ۜ
۞
۟
06E0
۠
ۡ
ۢ
ۣ
ۤ
ۥ
ۦ
ۧ
ۨ
۩
۪
۫
۬
ۭ
ۮ
ۯ
06F0
۰
۱
۲
۳
۴
۵
۶
۷
۸
۹
ۺ
ۻ
ۼ
۽
۾
ۿ
Клавиатура
С арабскими раскладками клавиатуры ситуация такая же несогласованная, как и с кодировками: хотя с 1987 г. существует стандартная раскладка ASMO-663 [1], используются многочисленные нестандартные раскладки. Наиболее популярна сейчас раскладка, используемая в IBMOS/2 и MicrosoftWindows. Различные несовместимые с ней и друг с другом раскладки использовались в компьютерах MSX, в арабской версии MS-DOS, в системах на основе Linux. Для «ноутбука за 100 долларов» также разрабатывается новая раскладка клавиатуры, несовместимая с уже существующими.
-->Арабская клавиатура, очевидно, должна быть двуязычной (латиница/арабский), чтобы возможно было вводить в компьютер пути файловой системы и веб-адреса. Здесь также возникает неоднозначность: обычно латинская часть арабской клавиатуры размечается как QWERTY, но в странах Магриба, где среди языков, пользующихся латиницей, преобладает французский, латинская часть клавиатуры размечается в соответствии с французской раскладкойAZERTY.
Пример
Статья 1 Всеобщей декларации прав человека:
Без огласовок
يولد جميع الناس أحرارًا متساوين في الكرامة والحقوق. وقد وهبوا عقلاً وضميرًا وعليهم أن يعامل بعضهم بعضًا بروح الإخاء.
«Все люди рождаются свободными и равными в своем достоинстве и правах. Они наделены разумом и совестью и должны поступать в отношении друг друга в духе братства».