문맥 자유 언어

문맥 자유 언어(文脈自由言語, Context-free language, CFL)는 문맥 자유 문법이 생성하는 형식 언어이다. 문맥 자유 언어는 프로그래밍 언어의 연구에서 중요한 역할을 한다.

배경

문맥 자유 문법

서로 다른 문맥 자유 문법이 똑같은 문맥 자유 언어를 생성할 수도 있다. 언어를 생성하는 여러 문법을 비교함으로써 언어 고유의 성질을 특정 문법의 성질과 구분할 수 있다.

오토마타

어떤 언어가 문맥 자유 언어라는 것은 어떤 내리누름 오토마타가 그 언어를 받아들인다는 것과 동치이다. 따라서 문맥 자유 언어는 구문 분석이 용이하다. 또한 문맥 자유 문법이 주어지면 그 문법에 대응하는 내리누름 오토마타를 쉽게 구성할 수 있다. 한편 주어진 내리누름 오토마타에 대응하는 문맥 자유 문법을 구성하는 것은 조금 더 복잡하다.

예시

문맥 자유 언어의 전형적인 예로 를 들 수 있다. 이 언어는 앞쪽 절반이 로만 되어 있고 뒤쪽 절반이 로만 되어 있는 모든 문자열의 집합이다. 을 생성하는 문맥 자유 문법으로 를 들 수 있다. 이 언어는 정규 언어가 아니다. 을 받아들이는 내리누름 오토마타는 다음과 같이 정의할 수 있다.

단, 는 다음과 같다.

본질적으로 중의적인(inherently ambiguous) CFL이 존재하기 때문에, 비중의적 CFL의 집합은 CFL의 집합의 진부분집합이다. 본질적으로 중의적인 CFL의 예로는 의 합집합을 들 수 있다. 문맥 자유 언어들의 합집합은 문맥 자유 언어이기 때문에, 이 언어도 문맥 자유 언어이다. 그러나 두 부분의 교집합인 에 속한 문자열을 비중의적으로 구문 분석할 방법은 없다. (또한 이 교집합은 문맥 자유 언어가 아니다.)[1]

균형 잡힌 괄호 표현의 언어인 뒤크 언어로 생성되는 문맥 자유 언어이다.

문맥 자유 언어가 아닌 언어의 예

집합 문맥 의존 언어이지만 문맥 자유 문법으로 생성할 수 없다.[2] 따라서 문맥 자유 언어가 아닌 문맥 의존 언어가 존재함을 알 수 있다. 어떤 언어가 문맥 자유 언어가 아님을 보이려면 문맥 자유 언어에 대한 펌핑 보조정리를 쓰거나[3] 오그덴의 보조정리파리크의 정리 따위를 사용할 수 있다.[4]

성질

문맥 자유 구문 분석

구문 분석이 주변 “문맥”과 무관하다는 특성 때문에, 문맥 자유 언어는 내리누름 오토마타로 쉽게 구문 분석이 가능하다.

주어진 문자열 와 문법 가 생성하는 언어 에 대해, 인지 결정하는 문제를 소속(membership) 문제 또는 인식(recognition) 문제라고 한다. 촘스키 표준형으로 나타낸 문맥 자유 문법에 대한 인식 문제는 불 대수에서의 행렬 곱셈으로 바꿀 수 있다는 사실이 밝혀졌고, 따라서 복잡도는 최대 O(n2.3728639)이다.[5][note 1] 반대로, O(n3−ε) 복잡도의 불 행렬 곱셈을 O(n3−3ε) 복잡도의 CFG 구문 분석으로 바꿀 수 있다는 사실이 알려져 있고, 이는 CFG 구문 분석의 복잡도에 대한 일종의 하계가 된다.[6]

문맥 자유 언어의 실제 쓰임에서는 인식 문제뿐만 아니라 문법 규칙을 사용해 주어진 문자열을 도출하는 트리를 생성하는 것도 중요하다. 이 트리를 만드는 과정을 구문 분석(파싱)이라 한다. 지금까지 알려진 CFG 구문 분석 알고리즘은 길이 n인 문자열을 분석하는 데 O(n3)만큼의 시간이 걸린다. 그러한 알고리즘의 예로 CYK 알고리즘얼리 파서 따위가 있다.

문맥 자유 언어 가운데 결정적 내리누름 오토마타가 받아들이는 언어들을 결정적 문맥 자유 언어라 한다. 이들은 LR 파서로 구문 분석할 수 있다.[7]

닫힘 성질

문맥 자유 언어의 집합은 여러 연산에 대해 닫혀 있다. LP가 문맥 자유 언어이면, 다음 언어도 문맥 자유 언어이다.

  • 합집합 [8]
  • 거울상 LR[9]
  • 문자열 연결 [8]
  • 클레이니 스타 [8]
  • 문자열 준동형사상 에 대한 상 [10]
  • 문자열 준동형사상 에 대한 역상 [11]
  • 순환 자리 이동 [12]
  • 접두사 닫힘 (L의 모든 문자열의 접두사들의 집합)[13]
  • 정규 언어 R에 대한 몫 L/R[14]

교집합, 여집합, 차집합

문맥 자유 언어의 집합은 교집합 연산에 대해 닫혀 있지 않다. 예컨대 는 둘 다 문맥 자유 언어이다.[note 2] 두 언어의 교집합은 인데, 펌핑 보조정리를 사용해 이 언어가 문맥 자유 언어가 아님을 보일 수 있다. 따라서 문맥 자유 언어의 집합은 여집합 연산에 대해서도 닫혀 있지 않은데, 두 언어 AB의 교집합은 합집합과 여집합 연산을 사용해 처럼 나타낼 수 있기 때문이다. 그러므로 문맥 자유 언어의 집합은 차집합 연산에 대해서도 닫혀 있지 않다. 이기 때문이다.[15]

그러나 L이 문맥 자유 언어이고 D가 정규 언어이면, 교집합 와 차집합 도 문맥 자유 언어이다.[16]

결정 가능성

정규 언어에 관한 문제는 대체로 결정 가능하지만, 문맥 자유 언어에 관한 문제는 그렇지 않은 경우가 많다. 문맥 자유 언어가 유한한지는 결정 가능하지만, 문맥 자유 언어가 모든 문자열을 포함하는지, 정규 언어인지, 비중의적인지, 다른 문법으로 생성된 언어와 같은지는 결정 불가능하다.[17]

일반적인 문맥 자유 문법 A와 B에 대해 다음 문제는 결정 불가능하다.

  • 동치: 인가?[18]
  • 서로소: 인가?[19] 그러나 문맥 자유 언어와 정규 언어의 교집합은 문맥 자유 언어이므로[20][21] B가 정규 언어라는 조건이 있으면 결정 가능하다. (아래 “공집합” 부분 참조)
  • 포함: 인가?[22] 이 문제도 B가 정규 언어라는 조건이 있으면 결정 가능하지만[출처 필요], A만 정규 언어라는 조건이 있으면 결정 불가능하다.[23]
  • 전체집합: 인가?[24]

문맥 자유 문법 A에 대해 다음 문제는 결정 가능하다.

  • 공집합: 인가?[25]
  • 유한성: 는 유한집합인가?[26]
  • 소속: 주어진 문자열 에 대해, 인가? 소속 문제를 효율적으로 푸는 알고리즘으로 CYK 알고리즘얼리 파서 등이 있다.

Hopcroft, Motwani, Ullman (2003)에 따르면[27] 문맥 자유 언어에 관한 여러 기본적인 닫힘 성질과 결정 가능성은 Bar-Hillel, Perles, Shamir의 1961년 논문에서 처음 증명되었다.[3]

내용주

  1. 논문이 발표될 당시에 행렬 곱셈 알고리즘의 복잡도는 최대 O(n2.81)라고 알려져 있었다. 이후 코퍼스미스-위노그라드 알고리즘 등이 발견되면서 상계가 더 낮아졌다.
  2. A는 다음 문맥 자유 문법으로 생성된다. SSc | aTb | ε; TaTb | ε. B의 경우도 비슷하다.

참조주

  1. Hopcroft & Ullman 1979, 100쪽, Theorem 4.7.
  2. Hopcroft & Ullman 1979.
  3. Yehoshua Bar-Hillel; Micha Asher Perles; Eli Shamir (1961). “On Formal Properties of Simple Phrase-Structure Grammars”. 《Zeitschrift für Phonetik, Sprachwissenschaft und Kommunikationsforschung》 14 (2): 143–172. 
  4. How to prove that a language is not context-free?
  5. Valiant, Leslie G. (April 1975). “General context-free recognition in less than cubic time”. 《Journal of Computer and System Sciences》 10 (2): 308–315. doi:10.1016/s0022-0000(75)80046-8. 2014년 11월 10일에 원본 문서에서 보존된 문서. 
  6. Lee, Lillian (January 2002). “Fast Context-Free Grammar Parsing Requires Fast Boolean Matrix Multiplication” (PDF). 《J ACM》 49 (1): 1–15. arXiv:cs/0112018. doi:10.1145/505241.505242. 
  7. Knuth, D. E. (July 1965). “On the translation of languages from left to right” (PDF). 《Information and Control》 8 (6): 607–639. doi:10.1016/S0019-9958(65)90426-2. 2012년 3월 15일에 원본 문서 (PDF)에서 보존된 문서. 2011년 5월 29일에 확인함. 
  8. Hopcroft & Ullman 1979, 131쪽, Corollary of Theorem 6.1.
  9. Hopcroft & Ullman 1979, 142쪽, Exercise 6.4d.
  10. Hopcroft & Ullman 1979, 131-132쪽, Corollary of Theorem 6.2.
  11. Hopcroft & Ullman 1979, 132쪽, Theorem 6.3.
  12. Hopcroft & Ullman 1979, 142-144쪽, Exercise 6.4c.
  13. Hopcroft & Ullman 1979, 142쪽, Exercise 6.4b.
  14. Hopcroft & Ullman 1979, 142쪽, Exercise 6.4a.
  15. Stephen Scheinberg (1960). “Note on the Boolean Properties of Context Free Languages” (PDF). 《Information and Control》 3: 372–375. doi:10.1016/s0019-9958(60)90965-7. 
  16. Beigel, Richard; Gasarch, William. “A Proof that if L = L1 ∩ L2 where L1 is CFL and L2 is Regular then L is Context Free Which Does Not use PDA’s” (PDF). 《University of Maryland Department of Computer Science》. 2020년 6월 6일에 확인함. 
  17. Wolfram, Stephen (2002). 《A New Kind of Science》. Wolfram Media, Inc. 1138쪽. ISBN 1-57955-008-8. 
  18. Hopcroft & Ullman 1979, 203쪽, Theorem 8.12(1).
  19. Hopcroft & Ullman 1979, 202쪽, Theorem 8.10.
  20. Salomaa (1973), p. 59, Theorem 6.7
  21. Hopcroft & Ullman 1979, 135쪽, Theorem 6.5.
  22. Hopcroft & Ullman 1979, 203쪽, Theorem 8.12(2).
  23. Hopcroft & Ullman 1979, 203쪽, Theorem 8.12(4).
  24. Hopcroft & Ullman 1979, 203쪽, Theorem 8.11.
  25. Hopcroft & Ullman 1979, 137쪽, Theorem 6.6(a).
  26. Hopcroft & Ullman 1979, 137쪽, Theorem 6.6(b).
  27. John E. Hopcroft; Rajeev Motwani; Jeffrey D. Ullman (2003). 《Introduction to Automata Theory, Languages, and Computation》. Addison Wesley.  Here: Sect.7.6, p.304, and Sect.9.7, p.411

참고 문헌

Read other articles:

Artikel ini membutuhkan rujukan tambahan agar kualitasnya dapat dipastikan. Mohon bantu kami mengembangkan artikel ini dengan cara menambahkan rujukan ke sumber tepercaya. Pernyataan tak bersumber bisa saja dipertentangkan dan dihapus.Cari sumber: Bandar Udara Internasional Curaçao – berita · surat kabar · buku · cendekiawan · JSTOR (July 2018) Bandara Internasional Curaçao Hato International AirportHato Internationale luchthavenIATA: CURICAO: TNCCIn...

 

Railway station in County Dublin, Ireland This article relies largely or entirely on a single source. Relevant discussion may be found on the talk page. Please help improve this article by introducing citations to additional sources.Find sources: Rush and Lusk railway station – news · newspapers · books · scholar · JSTOR (February 2015) Rush and LuskAn Ros agus LuscaRush & Lusk railway station looking North in 2018.General informationLocationStatio...

 

New Hampshire gubernatorial election For related races, see 1810 United States gubernatorial elections. 1810 New Hampshire gubernatorial election ← 1809 March 13, 1810 1811 →   Nominee John Langdon Jeremiah Smith Party Democratic-Republican Federalist Popular vote 16,325 15,166 Percentage 51.70% 48.03% Governor before election Jeremiah Smith Federalist Elected Governor John Langdon Democratic-Republican Elections in New Hampshire Federal government Presidential...

Eparki Katolik Siro-Malankara Mavelikara adalah sebuah eparki (keuskupan) suffragan dari Episkopal Agung Mayor Eparki Agung (Uskup Agung Metropolitan) Trivandrum, yang juga merupakan Uskup Agung Mayor (kepala) Gereja Katolik Siro-Malankara, Gereja Katolik Timur Ritus Antiokia di India. Tahtanya berada di Mavelikkara, sebuah taluk dan munisipalitas di bagian selatan distrik Alappuzha, negara bagian Kerala, barat daya India, di tepi Sungai Achankovil. Eparki tersebut adalah eparki ke-6 dari Ger...

 

كاليسبيل     الإحداثيات 48°12′00″N 114°19′00″W / 48.2°N 114.31666666667°W / 48.2; -114.31666666667   [1] تقسيم إداري  البلد الولايات المتحدة[2][3]  التقسيم الأعلى مقاطعة فلاتهيد  عاصمة لـ مقاطعة فلاتهيد  خصائص جغرافية  المساحة 30.877707 كيلومتر مربع30.358276 كيلومت�...

 

Extinct genus of dinosaurs VelocipesTemporal range: Late Triassic, 221.5–205.6 Ma PreꞒ Ꞓ O S D C P T J K Pg N Norian Fibula of the holotype Scientific classification Domain: Eukaryota Kingdom: Animalia Phylum: Chordata Clade: Dinosauria Clade: Saurischia Clade: Eusaurischia Clade: Theropoda (?) Genus: †VelocipesHuene, 1932 Species: †V. guerichi Binomial name †Velocipes guerichiHuene, 1932 Velocipes (meaning quick foot) is a saurischian dinosaur genus from th...

Biathlon World Championships 2020Host cityRasen-AntholzCountryItalyEvents12Opening12 FebruaryClosing23 FebruaryOpened bySergio MattarellaMain venueSouth Tyrol ArenaWebsiteWebsite← Östersund 2019Pokljuka 2021 → Biathlon World Championships 2020IndividualmenwomenSprintmenwomenPursuitmenwomenMass startmenwomenRelaymenwomenMixed relaysingleteamvte The Biathlon World Championships 2020 took place in Rasen-Antholz, Italy, from 12 to 23 February 2020. Host selection On 4 Sept...

 

Painting by Pablo Picasso Boy Leading a HorseArtistPablo PicassoYear1905-1906Catalogue79994MediumOil on canvasMovementPicasso's Rose Period, ExpressionismDimensions220.6 cm × 131.2 cm (86.85 in × 51.65 in)LocationMuseum of Modern Art, New YorkAccession575.1964 Jeune garçon au cheval (English: Boy Leading a Horse) is an oil on canvas painting by Pablo Picasso. The painting is housed in the Museum of Modern Art in New York. It was painted in Picasso'...

 

Richard Herrmann Nazionalità  Germania Germania Ovest (dal 1949) Altezza 167 cm Peso 68 kg Calcio Ruolo Attaccante Termine carriera 1960 Carriera Squadre di club1 1934-1945Katowice? (?)1945-1947 Kickers Offenbach? (?)1947-1960 FSV Francoforte? (?) Nazionale 1950-1954 Germania Ovest8 (1) Palmarès  Mondiali di calcio Oro Svizzera 1954 1 I due numeri indicano le presenze e le reti segnate, per le sole partite di campionato.Il simbolo → indica un trasferimento in prestito...

U.S. Representative from Pennsylvania J. Roland KinzerMember of the U.S. House of Representativesfrom Pennsylvania's 9th districtIn officeJanuary 3, 1945 – January 3, 1947Preceded byCharles L. GerlachSucceeded byPaul B. DagueMember of the U.S. House of Representativesfrom Pennsylvania's 10th districtIn officeJanuary 28, 1930 – January 3, 1945Preceded byWilliam Walton GriestSucceeded byJohn W. Murphy Personal detailsBorn(1874-03-28)March 28, 1874Te...

 

French industrialist (1877–1944) Louis RenaultBorn(1877-02-12)12 February 1877Paris, FranceDied24 October 1944(1944-10-24) (aged 67)Fresnes Prison, Fresnes, FranceNationalityFrenchOccupationBusinessKnown forco-founder of RenaultRelativesMarcel Renault and Fernand RenaultAwardsLegion of Honor Louis Renault (French: [lwi ʁəno]; 12 February 1877 – 24 October 1944) was a French industrialist, one of the founders of Renault, and a pioneer of the automobile industry. Renault...

 

2020年夏季奥林匹克运动会马来西亚代表團马来西亚国旗IOC編碼MASNOC马来西亚奥林匹克理事会網站olympic.org.my(英文)2020年夏季奥林匹克运动会(東京)2021年7月23日至8月8日(受2019冠状病毒病疫情影响推迟,但仍保留原定名称)運動員30參賽項目10个大项旗手开幕式:李梓嘉和吳柳螢(羽毛球)[1][2]閉幕式:潘德莉拉(跳水)[3]獎牌榜排名第74 金牌 銀牌 銅�...

American legislative district Washington 5th legislative district map Washington's 5th legislative district is one of forty-nine districts in Washington state for representation in the state legislature. The district borders Kittitas County on the east, the 31st legislative district on the south, parts of Maple Valley, Renton, and Issaquah on the west, and Snohomish County on the north.[1] The largely rural district is represented by state senator Mark Mullet and state representatives...

 

British Conservative politician (born 1961) This article is about the British Conservative Party politician. For details of Ireland's former Garda Commissioner, see Martin Callinan. For the British artist, see Martin John Callanan. The Right HonourableThe Lord CallananOfficial portrait, 2018Parliamentary Under-Secretary of State for Energy Efficiency and Green FinanceIncumbentAssumed office 7 February 2023Prime MinisterRishi Sunak[1]Preceded byOffice establishedParliamentary Under...

 

1917 directives by Vladimir Lenin Manifestation of war veterans and invalids in Petrograd on 17 April 1917 against Lenin's arrival The April Theses (Russian: апрельские тезисы, transliteration: aprel'skie tezisy) were a series of ten directives issued by the Bolshevik leader Vladimir Lenin upon his April 1917 return to Petrograd from his exile in Switzerland via Germany and Finland. The theses were mostly aimed at fellow Bolsheviks in Russia and returning to Russia from exile....

جوزيبي سينيوري معلومات شخصية الميلاد 17 فبراير 1968 (العمر 56 سنة)ألزانو لومباردو  الطول 1.70 م (5 قدم 7 بوصة) مركز اللعب مهاجم  الجنسية إيطاليا  مسيرة الشباب سنوات فريق 1981–1984 إنتر ميلان المسيرة الاحترافية1 سنوات فريق م. (هـ.) 1984–1986 UC AlbinoLeffe [الإنجليزية]‏ 38 (8) 1986�...

 

Krueng AcehSungai Aceh, Aceh River, Kroeeng Atjen, Krueng Atjeh, Atieh, Atye, Atjeh RivierBanjir kanal Krueng AcehLokasiNegara IndonesiaProvinsiAcehCiri-ciri fisikHulu sungaiCot Seukek, Aceh Besar[1] Muara sungaiLaut Andaman - lokasiBanda Aceh - koordinat05°35′04″N 95°18′07″E / 5.58444°N 95.30194°E / 5.58444; 95.30194Panjang145 km (90 mi)[1]Daerah Aliran SungaiSistem sungaiDAS Krueng Aceh (DAS120001)[2&...

 

Operating system Operating system FreeSBIEFreeSBIE 2.0 with Xfce environmentOS familyFreeBSDWorking stateUnmaintainedSource modelOpen sourceLatest release2.0.1 / February 2, 2007 (2007-02-02)Kernel typeMonolithicOfficial websitewww.freesbie.org FreeSBIE is a live CD, an operating system that is able to load directly from a bootable CD with no installation process or hard disk.[1] It is based on the FreeBSD operating system. Its name is a pun on frisbee. Currently, FreeS...

Pakubuwono IXSunan di SurakartaIn carica1861 –1893 PredecessorePakubuwono VIII SuccessorePakubuwono X NascitaSurakarta, 22 dicembre 1830 MorteSurakarta, 16 marzo 1893 (62 anni) Casa realePakubuwono PadrePakubuwono VI ReligioneIslam Pakubuwono IX, noto anche come Pakubuwana IX (Surakarta, 22 dicembre 1830 – Surakarta, 16 marzo 1893), è stato un sovrano indonesiano. Fu sunan di Surakarta dal 1861 fino alla sua morte. Indice 1 Biografia 2 Onorificenze 2.1 Onorificenze indone...

 

Impression couleur, de 1909, d'une aquarelle sur le couvercle d'une boîte de papeterie réalisée par Balthazar Wigand et offerte au compositeur Joseph Haydn. Il commémore la participation de Haydn à une représentation de son oratorio La Création. Un oratorio (au pluriel : oratorios, avec un « s » muet) est une œuvre lyrique dramatique représentée sans mise en scène, ni costumes, ni décors. Il peut toutefois y avoir une mise en espace. La partition est généralemen...