אלגוריתם דו-כיווניות של יוניקוד

אלגוריתם דו-כיווניות של יוניקוד מאפשר קביעת כיוון זרימת מלל במערכות מחשב, מימין לשמאל או משמאל לימין.

כדי לעמד מלל דו-כיווני כהלכה משתמש האלגוריתם בנתון סוג הכיווניות של תווים כדי לנתח את הטקסט ולפרק אותו לקטעים או רצפים של תווים, בעלי כיווניות מסוימת. לכל תו ניתן לקבוע כיווניות חזקה ימין-לשמאל, חזקה שמאל-לימין, חלשה ימין לשמאל, חלשה שמאל-לימין, ונייטרלי. באלגוריתם, תווים מטווח יוניקוד לעברית, ערבית, אשורית ודומותיהן נחשבים בעלי כיווניות ימין-לשמאל חזקה. תווי האלף-בית הלטיני נחשבים בעלי כיווניות שמאל-לימין חזקה. תווי מספרים נחשבים בעלי כיווניות שמאל-לימין חלשה. תווי פיסוק וניקוד נחשבים נייטרליים מבחינת כיוונם.

תווים נייטרליים

בהכללה, קובע האלגוריתם את כיווניותם של תווים נייטרליים בהתאם להקשר שבו הם נמצאים: אם הם נמצאים בין שני תווים בעלי כיווניות חזקה אחת, הם יירשו אותה. לדוגמה, כאשר תווי פיסוק נייטרליים כמו פסיק ונקודה נמצאים בין תווים בעלי כיווניות ימין-לשמאל חזקה הם מקבלים אותה גם הם וממוקמים משמאל לתו האחרון במילה.

תווים יורשים כיווניות
תווים יורשים כיווניות

מקרה מורכב מעט יותר הוא כזה שבו התו הקודם הוא בעל כיווניות מסוימת, אך עוקבו הוא בעל כיווניות אחרת. במקרה זה, יורש התו הנייטרלי את הכיווניות של התו הבא לפניו ברצף:

תווים יורשים כיווניות
תווים יורשים כיווניות

ובכיוון ההפוך:

תווים יורשים כיווניות
תווים יורשים כיווניות

מקרה מורכב עוד יותר מתרחש כאשר ישנו רצף של תווים נייטרליים מסוגים שונים הדורש הכרעה כיצד יש לסדרם. כאן, אלגוריתם דו-הכיווניות כשל לעיתים ורק בגרסתו האחרונה תוקנו בעיות כמו רצפים של תו>מקף>מספר/תו לטיני. קודם לכן, האלגוריתם שיבש את הסדר ודרש מיישומים שביקשו לתמוך בכיווניות נכונה במקרה נפוץ זה (בעברית) ליישם פתרונות "עוקפי-יוניקוד". בגרסת "אופיס 2000" של ערכת התכנות המשרדיות של מיקרוסופט הוגדרה כיווניות כללית לפסקה, ובהתאם לה התנהגו התווים הנייטרליים כאילו הם בעלי כיווניות ימין-לשמאל או שמאל לימין. בגרסה הנוכחית של האלגוריתם פתרונות כאלו אינם נחוצים. לדוגמה, המשפט הבא יוצג נכון באלגוריתם יוניקוד בגרסתו העדכנית:

תווים יורשים כיווניות
תווים יורשים כיווניות

בעיות באלגוריתם

באלגוריתם ישנן עדיין מספר בעיות בשימוש בעברית (ובערבית). לדוגמה, רצף מלל כזה:

תווים יורשים כיווניות
תווים יורשים כיווניות

יוצג בשימוש רגיל באופן שגוי:

תווים יורשים כיווניות
תווים יורשים כיווניות

מקרה אחר קיים עם הטקסט הבא:

תווים יורשים כיווניות
תווים יורשים כיווניות

המוצג באופן שגוי כך:

תווים יורשים כיווניות
תווים יורשים כיווניות

בעיה נוספת נפוצה בכתיבת מספרי טלפון:

תווים יורשים כיווניות

הטקסט יוצג כאשר הקידומת מימין למספר הטלפון:

תווים יורשים כיווניות

כדי לפתור בעיות אלו ניתן לעשות שימוש בתווים סמויים מיוחדים המכניסים כיווניות ימין-לשמאל או שמאל-לימין. תוצאה נוספת אפשר לקבל כאשר מכניסים רווחי אפס בעלי כיווניות או תווים השוברים או מאחדים "הקשריות" (בערבית). זה אינו פתרון שמשתמשים רגילים יכולים לעשות בו שימוש בנקל, ועדיין נדרשת השלמה תוכנתית לחסר.

תווי כיווניות סמויים

תקן יוניקוד מגדיר שני תווי כיווניות סמויים. תווים אלו אינם נראים במסמך ותפקידם לקבוע את כיווניות הטקסט שנמצא לפניהם ואחריהם.

  • תו LRM (Left-to-Right Mark) – בעל כיווניות חזקה שמאל-לימין.
  • תו RLM (Right-to-Left Mark) – בעל כיווניות חזקה ימין-לשמאל.

תו נייטרלי שיוצב בסמוך לתו LRM, יירש את כיווניותו שהיא שמאל-לימין, ואילו תו נייטרלי שיוצב בסמוך לתו RLM, יירש את כיווניותו שהיא ימין-לשמאל.

אופני השימוש בתווי כיווניות סמויים בפסקה עברית:

  • כשרושמים בתוך פסקה עברית את השם הלועזי של חברת Yahoo!‎, סימן הקריאה יופיע משמאל לשם ("Yahoo!"), מכיוון שאחריו יש אות עברית, אבל הוא אמור להופיע מימין. כדי לגרום לו להופיע מימין, אפשר להוסיף אחריו את התו LRM. התו מורה, למעשה, שהכיווניות של ימין לשמאל תימשך גם אחרי סימן הקריאה.
    בדומה לכך, כשרושמים בתוך פסקה עברית את הפונקציה המתמטית f(x)‎, ייראה הסוגר הסופי כמו סוגר פותח כך: f(x), מכיוון שאחריו יש אות עברית, אבל הוא אמור להופיע בקצה הימני של הביטוי. כדי לגרום לו להופיע נכון בקצה הביטוי, אפשר להוסיף אחריו את התו LRM.
  • כאשר בתוך פסקה עברית יש רשימה של מילים לועזיות שמופרדת בפסיקים, למשל Alice, Bob, Carlos, הפסיקים יופיעו מימין לכל מילה, כי לפניהם ואחריהם יש אותיות לועזיות, וגם סדר המילים יהיה הפוך, אבל הפסיקים אמורים להופיע משמאל לכל מילה: Alice‏, Bob‏, Carlos. כדי לגרום למילים ולפסיקים להופיע בסדר הרצוי יש להוסיף לפני הפסיק את התו RLM. התו מורה שהכיווניות של שמאל-לימין תיפסק לפני הפסיק ובמקומה תהיה הכיווניות ימין-לשמאל, כך שהפסיק יופיע משמאל למילים כרגיל בכיווניות של ימין-לשמאל.
  • בעת כתיבת מספר טלפון עם קידומת בפסקה עברית כמו בדוגמה "(02) 9876543", שהקידומת מופיעה מימין למספר, וכן בכתיבת מספר שלילי עם סימן מינוס לפניו, שסימן המינוס מופיע מימין למספר, יש להוסיף לפני הקידומת או המינוס את התו LRM. התו גורם לכיווניות להיות משמאל-לימין באופן מוחלט (כיווניות שמאל-לימין 'חזקה'), החל ממקום הקלדת התו.

תווים אלה עדיין אינם כלולים במקלדת עברית תקנית. בטיוטת התקן הישראלי לפריסת מקלדת עברית ניתן להוסיף תו LRM באמצעות הצירוף AltGr+9, ותו RLM באמצעות הצירוף AltGr+0.[1] תקן זה מיושם בחלקו במערכת ההפעלה Windows, החל מ־Windows 8.[2]

בנוסף, מערכות הפעלה ויישומים שונים מאפשרים הזנת תווי LRM ו-RLM במגוון דרכים:

  • במערכת הפעלה Windows מגרסה 8 ובפריסות מקלדת בלינוקס משנת 2013, בפריסת מקלדת עברית תקנית: LRM מוזן באמצעות AltGr+( (סוגר שמאלי) במקלדת הנומרית ו־RLM מוזן באמצעות AltGr+) (סוגר ימני).
  • ב־HTML תווים אלה מוכנסים כך: ‎, ו-‏.

ראו גם

קישורים חיצוניים

הערות שוליים

Read other articles:

Kue adremNama lainTolpitTempat asalIndonesiaDaerahBantul, YogyakartaSunting kotak info • L • BBantuan penggunaan templat ini  Media: Kue adrem Adrem atau disebut juga tolpit (lakuran dari kontol kejepit[1]) adalah salah satu makanan ringan traditional khas Bantul. Makanan ini terbuat dari bahan baku utama tepung beras dan gula jawa yang digoreng. Adrem banyak diproduksi di daerah Sanden dan dapat ditemukan di pasar-pasar tradisional di Bantul dan sekitarnya.[...

 

Artikel ini bukan mengenai lempar lembing. Ilustrasi seseorang yang berusaha melempar seekor kambing Lempar kambing (dalam bahasa Spanyol: Lanzamiento de cabra desde campanario atau Salto de la cabra) adalah sebuah festival di Manganeses de la Polvorosa, provinsi Zamora, Spanyol. Festival ini dirayakan pada hari Minggu keempat bulan Januari. Dalam festival ini sekelompok pemuda akan melemparkan seekor kambing hidup dari atap sebuah gereja. Kerumunan di bawah kemudian akan mencoba menangkap ka...

 

Koordinat: Coordinates: Unable to parse latitude as a number:-7,7346631 Candi Tegowangiꦕꦤ꧀ꦝꦶꦠꦼꦒꦺꦴꦮꦔꦶCandi TegowangiInformasi umumGaya arsitekturCandi Jawa TimuranLokasiDesa Tegowangi, Kecamatan Plemahan, Kabupaten Kediri, Jawa TimurKotaKabupaten KediriNegara IndonesiaRampungAbad ke 14Desain dan konstruksiArsitekMajapahit Candi Tegowangi merupakan candi yang terletak di Desa Tegowangi, Kecamatan Plemahan, Kabupaten Kediri, Jawa Timur, Indonesia. Menurut Kitab Par...

Hürriyet Daily NewsTipeSurat kabar harianFormatLembar lebarPemilikDoğan Media GroupRedaksiMurat YetkinDidirikanMaret 1961Pandangan politikSekuler, Tengah-kiriLiberalPusatHürriyet Medya Towers, Güneşli, 34212 Istanbul, TurkiISSN1300-0721Situs webwww.hurriyetdailynews.com Hürriyet Daily News, awalnya Hürriyet Daily News and Economic Review dan Turkish Daily News, adalah harian berbahasa Inggris tertua saat ini di Turki, yang didirikan pada 1961. Surat kabar tersebut diterbitkan oleh Doğ...

 

American football player and coach (1893–1970) Dick RauchRauch in 1924Born:(1893-07-15)July 15, 1893Harrisburg, Pennsylvania, U.S.Died:October 9, 1970(1970-10-09) (aged 77)Harrisburg, Pennsylvania, U.S.Career informationPosition(s)Center, Guard, TackleUniform number14 (1925) 29/30 (1928)CollegePenn StateCareer historyAs coach1921–1922Penn State (assistant)1923Colgate (assistant)1924–1926Pottsville Maroons1928New York Yankees1929Boston BulldogsAs player1924–1926Pottsville Maroons1...

 

HynerpetonRentang fosil: 360 jtyl PreЄ Є O S D C P T J K Pg N ↓ Akhir Devonian Klasifikasi ilmiah Kerajaan: Animalia Filum: Chordata Superkelas: Tetrapoda Genus: Hynerpeton Nama binomial Hynerpeton bassettiDaeschler et al., 1994 Hynerpeton (pengucapan bahasa Inggris: [haɪˈnɜrpətɒn], hewan menyeramkan (herpeton) dari Hyner) adalah karnivora basal tetrapod yang hidup di danau-danau pada periode Devonian Akhir sekitar 360 juta tahun lalu. Seperti kebanyakan tetrapoda prim...

Si ce bandeau n'est plus pertinent, retirez-le. Cliquez ici pour en savoir plus. Cet article ne cite pas suffisamment ses sources (décembre 2014). Si vous disposez d'ouvrages ou d'articles de référence ou si vous connaissez des sites web de qualité traitant du thème abordé ici, merci de compléter l'article en donnant les références utiles à sa vérifiabilité et en les liant à la section « Notes et références ». En pratique : Quelles sources sont attendues ?...

 

この項目には、一部のコンピュータや閲覧ソフトで表示できない文字が含まれています(詳細)。 数字の大字(だいじ)は、漢数字の一種。通常用いる単純な字形の漢数字(小字)の代わりに同じ音の別の漢字を用いるものである。 概要 壱万円日本銀行券(「壱」が大字) 弐千円日本銀行券(「弐」が大字) 漢数字には「一」「二」「三」と続く小字と、「壱」「�...

 

Golfo de Omán خليج عمان · دریای عمان Océano o mar de la IHO (n.º id.: 40) Fotografía satelital del golfo de OmánUbicación geográficaContinente AsiaOcéano Mar Arábigo (océano Índico)Coordenadas 25°N 58°E / 25, 58Ubicación administrativaPaís Emiratos Árabes Unidos Emiratos Árabes UnidosIrán IránOmán OmánPakistán PakistánAccidentes geográficosOtros accidentes Península arábigaCuerpo de aguaMares próximos Mar Arábigo y g...

У этого термина существуют и другие значения, см. Аболиционизм (значения). Плакат XVIII века со схемой перевозки рабов на парусном корабле Аболициони́зм (англ. abolitionism от лат. abolitio «отмена») — движение за отмену рабства и освобождение рабов. В XVIII в. против рабства в�...

 

2011 studio album by Jon StevensChanging TimesStudio album by Jon StevensReleased9 September 2011GenreRock music, Soul music, R&BLabelCircle Music, Universal Music AustraliaJon Stevens chronology The Works(2005) Changing Times(2011) Testify!(2011) Singles from Changing Times Just a ManReleased: August 2011 Changing Times is the seventh studio album by Australian singer-songwriter, Jon Stevens. The album was released digitally only on 9 September 2011. It was later released on CD ...

 

Символизм крестаLe symbolisme de la croix Жанр метафизика, эзотеризм, исследование традиционных символов Автор Рене Генон Язык оригинала французский Дата первой публикации 1931 Издательство Véga Символизм креста («Le symbolisme de la croix», Véga, 1931) — книга французского философа Рене Генона, по...

Questa voce sull'argomento dipartimenti della Francia è solo un abbozzo. Contribuisci a migliorarla secondo le convenzioni di Wikipedia. Senna MarittimadipartimentoSeine-Maritime LocalizzazioneStato Francia Regione Normandia AmministrazioneCapoluogoRouen Presidente del Consiglio dipartimentaleDidier Marie (PS) Data di istituzione4 marzo 1790 TerritorioCoordinatedel capoluogo49°26′38″N 1°06′12″E49°26′38″N, 1°06′12″E (Senna Marittima) Superficie6 ...

 

Roman emperor from 286 to 305 For other people named Maximian, see Maximian (disambiguation). MaximianPortrait head, Musée Saint-Raymond[1]Roman emperor (in the West) Augustus1 April 286 – 1 May 305 (with Diocletian in the East)[2]PredecessorDiocletian (alone)SuccessorConstantius ICaesar21 or 25 July 285 – 286Augustus (rebelled)Late 306 – 11 November 308310 (briefly)BornMaximianusc. 250Sirmium (present-day Sremska Mitrovica, Serbia)Diedc. ...

 

Logo keluarga berencana Keluarga berencana (disingkat KB) adalah gerakan untuk membentuk keluarga yang sehat dan sejahtera dengan membatasi kelahiran. Dalam arti lain, gerakan ini dapat didefinisikan sebagai perencanaan jumlah keluarga dengan pembatasan yang bisa dilakukan seperti menggunakan alat-alat kontrasepsi atau penanggulangan kelahiran meliputi kondom, spiral, IUD, dan sebagainya. Selain itu, gerakan KB juga dapat dapat dimaknai sebagai upaya peningkatan kepedulian dan peran masyaraka...

1990 European Athletics Indoor ChampionshipsTrack events60 mmenwomen200 mmenwomen400 mmenwomen800 mmenwomen1500 mmenwomen3000 mmenwomen60 m hurdlesmenwomen3000 m walkwomen5000 m walkmenField eventsHigh jumpmenwomenPole vaultmenLong jumpmenwomenTriple jumpmenwomenShot putmenwomenvte The men's 5000 metres walk event at the 1990 European Athletics Indoor Championships was held in Kelvin Hall on 4 March.[1][2] Results Rank Name Nationality Time Notes Mikhail Shchennikov  Sov...

 

Гран-при 2011FIVB World Grand Prix 2011 Время проведения 5 — 28 августа 2011 Число участников 16 Стадионы 12 Сайт FIVB.org Призовые места Победитель  США Второе место  Бразилия Третье место  Сербия Статистика турнира Сыграно матчей 90 Лучший игрок Дестини Хукер 20102012 19-й розыгрыш Гран-�...

 

Archaic language in the Vedas (2nd millennium BCE) Not to be confused with the Vedda language. Vedic SanskritNative toPresent-day India, Bangladesh, Afghanistan, Nepal and PakistanRegionNorthwestern Indian subcontinentErac. 1500 – 600 BCELanguage familyIndo-European Indo-IranianIndo-AryanVedic SanskritLanguage codesISO 639-3vsnLinguist Listvsn qnk RigvedicGlottologvedi1234This article contains IPA phonetic symbols. Without proper rendering support, you may see question marks...

pixiv网站类型艺术家社区语言日语、汉语、英语和韩文總部 日本东京都涩谷区持有者Pixiv Inc.创始人Takahiro Kamitani[1]Takanori Katagiri[1]网址www.pixiv.net商业性质是注册需要推出时间2007年9月10日,​17年前​(2007-09-10)现状Active pixiv株式會社(日语:ピクシブ株式会社;英語:pixiv Inc.)是一家总部位于东京都澀谷區、属于安利美特集团的网络风险投资企业集�...

 

Data collected from publicly available sources to be used in an intelligence contextThis article has multiple issues. Please help improve it or discuss these issues on the talk page. (Learn how and when to remove these messages) The examples and perspective in this article deal primarily with the United States and do not represent a worldwide view of the subject. You may improve this article, discuss the issue on the talk page, or create a new article, as appropriate. (December 2010) (Learn h...