Структурований документ

Структурований документ — це електронний документ, де використовується якийсь метод розмітки для ідентифікації цілої або декілька частин документа, що мають різні значення. Наприклад, структурований документ може ідентифікувати певну частину як «заголовок глави» (або «зразок коду» або «чотиривірш»), а не як основний текст. Такі частини загалом називають «компонентами» або «елементами» документа.

Огляд

Структуровані документи, як правило, зосереджені на маркуванні певних речей, які можна використовувати для різних цілей обробки або зміни тексту. Наприклад, чітке маркування «заголовка глави» або «наголосу» набагато корисніше для людей із вадами зору, ніж просто «курсив». Так само, змістовне маркування багатьох елементів у технічній інформаційній таблиці забезпечує значно кращу інтеграцію з базами даних, пошуковими системами, онлайн-каталогами тощо.

Структуровані документи, як правило, підтримують принаймні ієрархічні структури, наприклад списки, а не просто елементи списку; розділи, а не лише заголовки розділів; і так далі. Це суттєво виділяється із системи і значно полегшує її форматування. Системи вищого рівня також підтримують безліч незалежних та / або накладених наборів компонентів.

Системи структурованих документів зазвичай дозволяють створювати чіткі правила, що визначають типи компонентів та спосіб їх поєднання. Такий набір правил називається «схемою» за аналогією зі схемами баз даних. Є кілька формальних мов для їхньої специфікації, таких як XSD, Relax NG та Schematron. Структурований документ, який відповідає правилам схеми, зазвичай називають «дійсним відповідно до цієї схеми». Деякі системи також підтримують документи з компонентами довільних типів та комбінацій, але все ж із синтаксичними правилами ідентифікації цих компонентів.

Лі й Саарела зазначили, що «Стандартна узагальнена мова розмітки (СУМР) започаткувала концепцію структурованих документів»[1], хоча попередні системи, такі як Scribe, Augment і FRESS забезпечували багато функцій структурованих документів, а SGML-евий нащадок XML є тепер улюбленим.

Одним із широко використовуваних інструментів для структурованих документів є HTML, схема, визначена та описана за допомогою W3C. Однак, HTML має не лише теги зі значенням компонентів, таких як абзац, заголовок та код; але також із форматом, такі як курсив, жирний шрифт та більшість таблиць. На практиці HTML іноді використовується як структурована система документів, але у більшості випадків використовується як мова форматування.

Багато доменів використовують структуровані документи за допомогою спільно розроблених схем, такі як JATS для публікації журналів, TEI для документів літературного характеру, UBL та EDI для ділового обміну даними, XTCE для телеметрії космічних кораблів, REST для вебінтерфейсів та безліч інших. У всіх вище зазначених випадках використовуються специфічні схеми на основі XML.

Структурна семантика

При написанні структурованих документів основна увага приділяється кодуванню структури документа, при цьому набагато менше або ж взагалі не приділяється увага презентації його людям у вигляді друкованих сторінок чи текстом на екрані. Структуровані документи можуть бути легко оброблені комп'ютерними системами, для вилучення та представлення похідних форм документа. Наприклад, у більшості статей Вікіпедії зміст автоматично генерується з різних тегів заголовків у тілі документа. Оскільки конверсія SGML в Оксфордському словнику англійської мови чітко виділяла безліч різних значень, що надаються у друкованій версії курсивом, інструменти пошуку можуть отримувати записи на основі етимології, цитат та багатьох інших цікавих особливостей. Коли HTML надає структурну, а не просто інформацію, тоді користувачам із вадами зору можна легко надати кращий інтерфейс для читання. Коли туристичні компанії надають маршрути як структуровані документи, а не просто як зображення, користувачі можуть легко виділити необхідну інформацію та передати їх у календар або інші програми.

У HTML частиною логічної структури документа може бути тіло документа тобто <body>, що містить заголовок першого рівня, який позначається <h1> та абзац — <p>.

<body>

<h1>Структурований документ</h1>
<p><strong class="selflink">Структурований документ</strong> це <a title="Електронний документ">електронний документ</a> де використовуються певні методи <a title="Мова маркування">маркування</a> використовується для ідентифікації цілого або декількох частин документа, що мають різні значення, окрім форматування.</p>

</body>

Однією з найкращих особливостей структурованих документів є те, що їх можна багаторазово використовувати і представляти різними способами на мобільних телефонах, телевізійних екранах, синтезаторах мови та будь-якому іншому пристрої, який можна запрограмувати для їх обробки.

Інша семантика

Іншого значення можна надати тексту, що не є «структурним» у точно такому ж значенні, як великі об'єкти, але все ще вважається «структурою документа», оскільки висловлює твердження про обсяг та природу або онтологію частин документа, а не вказівки щодо її подання. У наведеному вище фрагменті HTML елемент <strong> означає, що доданий текст є виразним. У візуальному плані це зазвичай передається напівжирним шрифтом, як <b>; але мовний інтерфейс замість цього скоріше використовував би голосову флексію. Термін семантична розмітка виключає розмітку типу <b> яка безпосередньо не виражає жодного значення, крім інструкції для візуального дисплея (хоча інтелектуальний агент може бути в змозі розрізнити структурне значення, що криється за тегом). «Сильний» тег є «описовим» або «структурним», оскільки він призначений для позначення абстрактної, квазілінгвістичної властивості його змісту, а не для опису відповідної презентації в якомусь конкретному середовищі.

Деякі інші структурні теги в HTML включають <abbr>, <acronym>, <address>, <cite>, <del>, <dfn>, <ins>, <kbd>, <q>. Інші схеми, такі як DocBook та TEI, мають значно більший вибір.

Тег <a> використовується для дещо іншого типу структури, а саме структури взаємозв'язку або перехресних посилань. Це, безумовно, структура, і насправді можна створити альтернативну розмітку для документів, що виражає ті самі конкретні структури в будь-який спосіб (наприклад, використовуючи трансклюзію для представлення вмісту розділу, а не презентації гіперпосилань навігації).

З самого початку HTML також мітив теги, що виражають семантику презентації, наприклад напівжирний (<b>) або курсив (<i>), або для зміни розміру шрифту, або які мали інші наслідки для презентації[2]. Сучасні версії мов розмітки перешкоджають такій розмітці на користь описової розмітки, яка відображається у певних презентаціях за допомогою таблиць стилів — методу, запровадженого такими системами, як Scribe та FRESS. Таблиці різних стилів можуть бути прикріплені до будь-якої розмітки, семантичної чи презентаційної, щоб створювати різні презентації, хоча відображення назви тегу «курсив» до презентації жирним шрифтом не зовсім інтуїтивно зрозуміле.

Див. також

Список літератури

  1. Håkon Wium Lie; Janne Saarela (1998). Multi-purpose publishing using HTML, XML, and CSS. W3.org. Association for Computing Machinery. Архів оригіналу за 4 березня 2016. Процитовано 11 листопада 2020.
  2. A sample HTML instance. Архів оригіналу за 15 квітня 2009. Процитовано 5 березня 2014.

Read other articles:

Asmin Laura Hafid Bupati Nunukan ke-3PetahanaMulai menjabat 1 Juni 2016PresidenJoko WidodoGubernurIrianto LambrieWakilFaridil Murad (2016–21)Hanafiah (2021–petahana) PendahuluBasriPenggantiPetahana Informasi pribadiLahir10 Agustus 1985 (umur 38) Tawau, SabahKebangsaanIndonesiaPartai politikHanuraSuami/istriAndi Muhammad AkbarAnak1. Andi Kauliaka Bebie Azzahra Akbar2. Andi Achmad Almoesa Akbar3. Andi Azizah Adeeva AkbarOrang tuaH. Abdul Hafid Achmad (ayah)Hj. Rahma Leppa (ibu)...

 

Tully Marshall Dans La Veuve joyeuse (1925, photo promotionnelle) Données clés Nom de naissance William Phillips Naissance 10 avril 1864Nevada CityCalifornie, États-Unis Nationalité Américaine Décès 10 mars 1943 (à 78 ans)Encino (Los Angeles)Californie, États-Unis Profession Acteur Films notables IntoléranceLa Piste des géantsBoule de feu modifier Avec Mabel Normand, dans The Slim Princess (1920) Tully Marshall est un acteur américain, de son vrai nom William Phillips, né �...

 

SCTV Awards 2013DeskripsiPrestasi dalam acara televisiTanggal29 November 2013LokasiJIEXPO Hall D2, Kemayoran, JakartaNegaraIndonesiaPembawa acara Andhika Pratama Gading Marten Narji Cagur Bianca Liza IkhtisarSinetron Paling NgetopEmak Ijah Pengen Ke MekahAktor Utama Paling NgetopEza GioninoAktris Utama Paling NgetopDinda KiranaAktor Pendamping Paling NgetopChrist LaurentAktris Pendamping Paling NgetopEriska ReinSiaran televisi/radioSaluranSCTV← 2012 SCTV Awards2014 → SCTV Awards 2...

Chronologie de la France ◄◄ 1601 1602 1603 1604 1605 1606 1607 1608 1609 ►► Chronologies Le Pont Neuf en 1618. Carte de Paris de Claes Jansz Visscher.Données clés 1602 1603 1604  1605  1606 1607 1608Décennies :1570 1580 1590  1600  1610 1620 1630Siècles :XVe XVIe  XVIIe  XVIIIe XIXeMillénaires :-Ier Ier  IIe  IIIe Chronologies thématiques Art Architecture, Arts plastiques (Dessin, Gravure, Peinture et Sculpture), Littératu...

 

Lake in the state of California, United States For the adjacent settlement, see Echo Lake, California. For other places named Echo Lake, and other uses of the name, see Echo Lake (disambiguation). Echo LakesUpper and Lower Echo Lake, CaliforniaEcho LakesShow map of CaliforniaEcho LakesShow map of the United StatesLocationEl Dorado County, California, U.S.Coordinates38°50′34″N 120°04′32″W / 38.84278°N 120.07556°W / 38.84278; -120.07556 (Upper Echo L...

 

المجيب المجيب جهاز يجيب على الهاتف و يسجل رسائل المتصلين كما يعود اختراعه إلى المخترع الدنماركي فلاديمر بولسن الذي اخترعه في عام 1898 , بدأ استعماله بكثرة في الولايات المتحدة الأمريكية في عام 1949.[1][2][3] المصادر ^ معلومات عن مجيب (الهاتف) على موقع jstor.org. jstor.org. مؤرشف م...

Nokia 1662 adalah produk telepon genggam yang dirilis oleh perusahaan Nokia. Telepon genggam ini memiliki dimensi 108 x 45 x 13.8 mm dengan berat 82 gram. Fitur & Komponen Layar TFT, 65K warna SMS Polifonik Permainan Radio FM Baterai Li-Ion 860 mAh (BL-4C) Lihat pula Daftar produk Nokia Pranala luar informasi di GSM Arena lbsNokiaAnak usaha Nokia Bell Labs Nokia Networks Nokia Technologies Unit lain NGP Capital Nuage Networks Akuisisi Alcatel-Lucent Dopplr earthmine Enpocket F5 Netwo...

 

Australian swimmer Stephanie RiceOAMPersonal informationFull nameStephanie Louise RiceNicknameStephNational team AustraliaBorn (1988-06-17) 17 June 1988 (age 35)Brisbane, Queensland, AustraliaHeight1.76 m (5 ft 9 in)Weight67 kg (148 lb)SportSportSwimmingStrokesMedley, freestyle, butterflyClubSt Peters WesternCoachMichael Bohl Medal record Women's swimming Representing  Australia Event 1st 2nd 3rd Olympic Games 3 0 0 World Championships (LC) 0 ...

 

HerpontcomuneHerpont – Veduta LocalizzazioneStato Francia RegioneGrand Est Dipartimento Marna ArrondissementSainte-Menehould CantoneArgonne Suippe et Vesle TerritorioCoordinate49°00′N 4°44′E / 49°N 4.733333°E49; 4.733333 (Herpont)Coordinate: 49°00′N 4°44′E / 49°N 4.733333°E49; 4.733333 (Herpont) Superficie23 km² Abitanti118[1] (2009) Densità5,13 ab./km² Altre informazioniCod. postale51460 Fuso orarioUTC+1 Codice I...

ХристианствоБиблия Ветхий Завет Новый Завет Евангелие Десять заповедей Нагорная проповедь Апокрифы Бог, Троица Бог Отец Иисус Христос Святой Дух История христианства Апостолы Хронология христианства Раннее христианство Гностическое христианство Вселенские соборы Н...

 

2020年夏季奥林匹克运动会马来西亚代表團马来西亚国旗IOC編碼MASNOC马来西亚奥林匹克理事会網站olympic.org.my(英文)2020年夏季奥林匹克运动会(東京)2021年7月23日至8月8日(受2019冠状病毒病疫情影响推迟,但仍保留原定名称)運動員30參賽項目10个大项旗手开幕式:李梓嘉和吳柳螢(羽毛球)[1][2]閉幕式:潘德莉拉(跳水)[3]獎牌榜排名第74 金牌 銀牌 銅�...

 

Buddhist temple in Bahan Township, Yangon Ngahtatgyi Buddha TempleReligionAffiliationTheravada BuddhismLocationLocationBahan Township, YangonCountryMyanmarShown within MyanmarGeographic coordinates16°48′30″N 96°09′45″E / 16.808389°N 96.162613°E / 16.808389; 96.162613ArchitectureFounderPrince MinyedeippaCompleted1558; 466 years ago (1558) Ngahtatgyi Buddha Temple (Burmese: ငါးထပ်ကြီးဘုရားကြီး) is a Budd...

Planned underground heavy rail line in central Osaka, Japan This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Naniwasuji Line – news · newspapers · books · scholar · JSTOR (February 2021) (Learn how and when to remove this message) Naniwasuji LineSpace at JR Namba Station reserved for the Naniwasuji LineOvervi...

 

Hans ReichenbachLahir(1891-09-26)26 September 1891Hamburg, German EmpireMeninggal09 April 1953Los Angeles, USEra20th-century philosophyKawasanWestern PhilosophyAliranAnalyticMinat utamaPhilosophy of science Dipengaruhi Paul Hensel Memengaruhi Berlin Circle, Vienna Circle Hans Reichenach (26 September 1891 – 9 April 1953) adalah filsuf bangsa Jerman.[1] Maha Guru di Berlin pada tahun 1926 - 1933, di pecat kaum Nazi lalu mengajar di Istanbul dan Universitas Califor...

 

KikiPoster rilis teatrikalSutradaraSam TaylorProduserJoseph M. SchenckSkenarioSam TaylorBerdasarkanSandiwara:David Belasco André PicardPemeranMary PickfordReginald DennyPenata musikAlfred NewmanSinematograferKarl StrussPerusahaanproduksiArt CinemaDistributorUnited ArtistsTanggal rilis 14 Maret 1931 (1931-03-14) Durasi84 menitNegaraAmerika SerikatBahasaInggrisPendapatankotor$400.000[1] Kiki adalah sebuah film komedi romansa Pre-Code Amerika Serikat tahun 1931, yang menampil...

العلاقات التركية الصينية   الصين   تركيا تعديل مصدري - تعديل   العلاقات التركية - الصينية هي علاقات خارجية بين الصين وتركيا. تأسست العلاقات الدبلوماسية في عام 1934 واعترفت تركيا بجمهورية الصين الشعبية في 5 أغسطس 1971. تمتثل تركيا لسياسة الصين الواحدة وتعترف بجمهوري...

 

Untuk tempat lain yang bernama sama, lihat Purwosari (disambiguasi). PurwosariKelurahanKantor kelurahan Purwosari (2014)Peta lokasi Kelurahan PurwosariNegara IndonesiaProvinsiJawa TengahKotaSurakartaKecamatanLaweyanKode Kemendagri33.72.01.1007 Kode BPS3372010007 Jalan Slamet Riyadi. Purwosari (bahasa Jawa: ꦥꦸꦂꦮꦱꦫꦶ, translit. Purwasari) adalah kelurahan di Kecamatan Laweyan, Surakarta Kelurahan ini memiliki kode pos 57142. Pada tahun 2020, kelurahan ini berpenduduk ...

 

Halaman ini berisi artikel tentang Menteri Kehutanan (1964–2014). Untuk jabatan kiwari, lihat Daftar Menteri Lingkungan Hidup dan Kehutanan Indonesia. Menteri Kehutanan Republik IndonesiaBekas jabatan politikPejabat pertamaSoedjarwoPejabat terakhirChairul TanjungPelantikPresiden IndonesiaJabatan dimulai27 Juli 1964Jabatan berakhir20 Oktober 2014Jabatan penggantiMenteri Lingkungan Hidup dan Kehutanan Indonesia Berikut berisi daftar orang yang pernah menjabat sebagai Menteri Kehutanan Indones...

جامعة بادوفا   الشعار (باللاتينية: Universa universis patavina libertas)‏  معلومات التأسيس سبتمبر 1222  الموقع الجغرافي إحداثيات 45°25′N 11°52′E / 45.42°N 11.87°E / 45.42; 11.87   المدينة باذوة  المكان باذوة  البلد إيطاليا  إحصاءات عدد الطلاب 62876 (2019)  عضوية اتحاد الجامعات الم...

 

Government initiative to encourage manufacturing in India For other uses, see Made in India (disambiguation). Make in IndiaCountryIndiaPrime Minister(s)Narendra ModiKey peopleMinistry of Commerce and Industry (India)LaunchedSeptember 25, 2014; 9 years ago (2014-09-25)StatusActiveWebsitewww.makeinindia.com This article is part of a series on the Politics of India Constitution and law Constitution of India Fundamental Rights, Directive Principles and Fundamental Duties of Indi...