Ознака (машинне навчання)

В машинному навчанні та розпізнаванні образів озна́ка (англ. feature) — це окрема властивість або характеристика спостережуваного явища, яку можливо виміряти.[1] Обрання інформативних, розрізнювальних і незалежних ознак є ключовим кроком алгоритмів розпізнавання образів, класифікації та регресії. Ознаки є зазвичай числовими, але в синтаксичному розпізнаванні образів[en] використовують і структуровані ознаки, такі як стрічки та графи. Поняття «ознака» є пов'язаним із поняттям описової змінної, що застосовують у таких статистичних методиках як лінійна регресія.

Класифікація

Набір числових ознак може бути зручно описано вектором ознак. Приклад досягнення двобічної класифікації[прояснити] за вектором ознак (пов'язаним з перцептроном) складається з обчислення скалярного добутку вектора ознак та вектора вагових коефіцієнтів, порівняння результатів із порогом, і ухвалення рішення про клас на основі цього порівняння.

До алгоритмів класифікації за вектором ознак належать класифікація найближчих сусідів, нейронні мережі та статистичні методики, такі як баєсові підходи.

Приклади

В розпізнаванні символів до ознак можуть належати гістограми, що підраховують кількість чорних пікселів уздовж горизонтальних та вертикальних напрямків, кількість внутрішніх отворів, напрямок штрихів та багато іншого.

В розпізнаванні мовлення до ознак записів фонем можуть належати рівні шуму, тривалість звуків, відносна потужність, збіг з фільтрами та багато іншого.

В алгоритмах виявлення спаму до ознак можуть належати наявність або відсутність певних заголовків електронного листа, структура електронного листа, мова, частота певних термінів, граматична правильність тексту.

В комп'ютерному баченні існує велика кількість можливих ознак, таких як контури та об'єкти.

Розширення

В розпізнаванні образів та машинному навчанні ве́ктор озна́к (англ. feature vector) — це n-вимірний вектор числових ознак, що представляють певний об'єкт. Багато алгоритмів у машинному навчанні вимагають чисельного представлення об'єктів, оскільки такі представлення полегшують обробку та статистичний аналіз. При представленні зображень значення ознак можуть відповідати пікселям зображення, тоді як при представленні текстів ознаки можуть бути частотами трапляння текстових термінів. Вектори ознак еквівалентні векторам описових змінних, що використовують в статистичних процедурах, таких як лінійна регресія. Вектори ознак часто об'єднують з ваговими коефіцієнтами за допомогою скалярного добутку з метою побудови функції лінійного передбачення[en], що застосовують для визначення оцінки для здійснення передбачення.

Векторний простір, пов'язаний із цими векторами, часто називають про́стором озна́к (англ. feature space). Задля зменшення розмірності простору ознак можливо застосовувати ряд методик зниження розмірності.

Із вже наявних ознак можливо отримувати ознаки вищого рівня, і додавати їх до вектора ознак; наприклад, для дослідження хвороб є корисною ознака «Вік», і її визначають як Вік = «Рік смерті» мінус «Рік народження». Цей процес називають побудо́вою озна́к (англ. feature construction).[2][3] Побудова ознак є застосуванням набору побудовних операторів до набору наявних ознак, що дає в результаті побудову нових ознак. Приклади таких побудовних операторів включають перевірку на умови рівності {=, ≠}, арифметичні оператори {+,−,×, /}, оператори над масивами {max(S), min(S), average(S)}, а також інші складніші оператори, наприклад, count(S,C),[4] що підраховує кількість ознак у векторі ознак S, які задовольняють певну умову C, або, наприклад, відстані до інших класів розпізнавання, узагальнених якимось приймальним пристроєм. Побудову ознак вже давно вважають потужним інструментом для покращення як точності, так і розуміння структури, зокрема, в задачах високих розмірностей.[5] До її застосувань належать дослідження хвороб та розпізнавання емоцій з мовлення.[6]

Обирання та виділяння

Початковий набір сирих ознак може бути надлишковим і занадто великим, щоби впоратися з ним. Тому підготовчий крок багатьох застосувань машинного навчання та розпізнавання образів складається з вибирання підмножини ознак, або з побудови нового зменшеного набору ознак для полегшення навчання і для покращення узагальнення та можливості інтерпретації[джерело?].

Виділяння та вибирання ознак є поєднаннями мистецтва та науки; розробка систем, які це роблять, є відомою як конструювання ознак. Воно вимагає експериментування з багатьма можливостями, та поєднання автоматизованих методик з інтуїцією та знаннями профільного експерта[en]. Автоматизація цього процесу є навчанням ознак, коли машина не лише використовує ознаки для навчання, але й навчається самих ознак.

Див. також

Примітки

  1. Bishop, Christopher (2006). Pattern recognition and machine learning. Berlin: Springer. ISBN 0-387-31073-8. (англ.)
  2. Liu, H., Motoda H. (1998) Feature Selection for Knowledge Discovery and Data Mining., Kluwer Academic Publishers. Norwell, MA, USA. 1998. (англ.)
  3. Piramuthu, S., Sikora R. T. Iterative feature construction for improving inductive learning algorithms. In Journal of Expert Systems with Applications. Vol. 36 , Iss. 2 (March 2009), pp. 3401-3406, 2009 (англ.)
  4. Bloedorn, E., Michalski, R. Data-driven constructive induction: a methodology and its applications. IEEE Intelligent Systems, Special issue on Feature Transformation and Subset Selection, pp. 30-37, March/April, 1998 (англ.)
  5. Breiman, L. Friedman, T., Olshen, R., Stone, C. (1984) Classification and regression trees, Wadsworth (англ.)
  6. Sidorova, J., Badia T. Syntactic learning for ESEDA.1, tool for enhanced speech emotion detection and analysis. Internet Technology and Secured Transactions Conference 2009 (ICITST-2009), London, November 9–12. IEEE (англ.)

Read other articles:

Questa voce o sezione sull'argomento musica è priva o carente di note e riferimenti bibliografici puntuali. Sebbene vi siano una bibliografia e/o dei collegamenti esterni, manca la contestualizzazione delle fonti con note a piè di pagina o altri riferimenti precisi che indichino puntualmente la provenienza delle informazioni. Puoi migliorare questa voce citando le fonti più precisamente. Segui i suggerimenti del progetto di riferimento. La musica afroamericana comprende una grande va...

 

 

Aktinobakteri Actinobacteria Mikrograf scanning elektron dari Actinomyces israelii (bukan warna sesungguhnya)Pewarnaan GramGram-positif TaksonomiSuperdomainBiotaDomainBacteriaSubkerajaanPosibacteriaFilumActinobacteria Erko Stackebrandt, 1997 Tata namaSinonim takson Actinobacteraeota Oren et al. 2015 Actinobacteria Stackebrandt, Rainey & Ward-Rainey 1997 Actinomycetes Krasil'nikov 1949 Kelas Acidimicrobiia Coriobacteriia Nitriliruptoria Rubrobacteria Thermoleophilia Actinobacteria Acidothe...

 

 

United States federal district court of New Mexico United States District Court for the District of New Mexico(D.N.M.)LocationPete V. Domenici U.S. Courthouse(Albuquerque) (Headquarters)More locationsLas CrucesSantiago E. Campos U.S. Courthouse(Santa Fe)Albuquerque (Secondary Court)Appeals toTenth CircuitEstablishedJune 20, 1910Judges7Chief JudgeWilliam P. JohnsonOfficers of the courtU.S. AttorneyAlexander M.M. UballezU.S. MarshalSonya K. Chavezwww.nmd.uscourts.gov The Uni...

Battle between Filipino and American forces during the Philippine–American War Battle of Zapote Bridge redirects here. For the battle which was part of the Philippine Revolution, see Battle of Zapote Bridge (1897). Battle of Zapote RiverPart of the Philippine–American WarThe reconnected Zapote Bridge in 1899 being guarded by an American soldier after the battle on June 13, 1899. One span of the bridge was removed by the locals, substituted with a wooden span, which was burned down before ...

 

 

Nakawa Division is one of the five administrative divisions of the city of Kampala, the capital and largest city of Uganda. The town of Nakawa is the site of the division headquarters. Location Nakawa Division lies in the eastern part of the city, bordering Kira Town to the east, Wakiso District to the north, Kawempe Division to the north-west, Kampala Central Division to the west, Makindye Division across Murchison Bay to the south-west and Lake Victoria to the south.[1] The coordina...

 

 

National Soccer League 2001–2002Negara Australia Selandia BaruJuara bertahan Wollongong WolvesJuara Sydney Olympic(gelar ke-2)Tempat kedua Perth GloryPeraih Medali Johnny Warren Fernando Rech (Brisbane Strikers)Pencetak gol terbanyak Damian Mori (Perth Glory)(17 gol)← 2000–2001 2002–2003 → National Soccer League 2001–2002 adalah edisi ke-26 dari penyelenggaraan National Soccer League, turnamen liga sepak bola tertinggi di Australia. Wollongong Wolves merupakan juara bert...

Questa voce sull'argomento calciatori italiani è solo un abbozzo. Contribuisci a migliorarla secondo le convenzioni di Wikipedia. Segui i suggerimenti del progetto di riferimento. Alessandro Bollani Nazionalità  Italia Calcio Ruolo Difensore, centrocampista Termine carriera 1924 Carriera Squadre di club1 1911-1912 Andrea Doria1 (-2)1913-1914 Andrea Doria16 (1)1915→ Brescia3 (0)1919-1922 Brescia48 (1)1922-1924 Andrea Doria10 (2) 1 I due numeri indicano l...

 

 

Синелобый амазон Научная классификация Домен:ЭукариотыЦарство:ЖивотныеПодцарство:ЭуметазоиБез ранга:Двусторонне-симметричныеБез ранга:ВторичноротыеТип:ХордовыеПодтип:ПозвоночныеИнфратип:ЧелюстноротыеНадкласс:ЧетвероногиеКлада:АмниотыКлада:ЗавропсидыКласс:Пт�...

 

 

Questa voce sull'argomento centri abitati dell'Albania è solo un abbozzo. Contribuisci a migliorarla secondo le convenzioni di Wikipedia. Kavajëcomune Kavajë – VedutaMoschea di Kavaje LocalizzazioneStato Albania PrefetturaTirana AmministrazioneSindacoFisnik Qosja (PD) dal 14-5-2023 TerritorioCoordinate41°11′N 19°33′E / 41.183333°N 19.55°E41.183333; 19.55 (Kavajë)Coordinate: 41°11′N 19°33′E / 41.183333°N 19.55°E41....

US Supreme Court justice from 1790 to 1810 For other people named William Cushing, see William Cushing (disambiguation). William CushingAssociate Justice of the Supreme Court of the United StatesIn officeFebruary 2, 1790[1] – September 13, 1810[1]Nominated byGeorge WashingtonPreceded bySeat establishedSucceeded byJoseph Story Personal detailsBorn(1732-03-01)March 1, 1732Scituate, Massachusetts BayDiedSeptember 13, 1810(1810-09-13) (aged 78)Scituate, Massachuset...

 

 

Untuk kegunaan lain, lihat bebek. Daging bebek yang sedang diolah untuk dijadikan masakan bebek isi Organ dalam bebek Dada bebek yang telah diasap Kepala bebek panggang Bebek panggang Bebek merupakan salah satu jenis daging yang digunakan sebagai bahan makanan yang berasal dari unggas selain ayam. Contoh pemanfaatannya sebagai hidangan antara lain dengan digoreng dan dipanggang. Selain itu telurnya pun dimanfaatkan sebagai telur asin. Daging bebek merujuk kepada daging yang dihasilkan dari ba...

 

 

Nickname of successful Greek sport clubs For the other groups of entities known as Big Three or The Big Three, see Big Three (disambiguation). AEKOlympiacosPanathinaikosclass=notpageimage| Location of the three clubs in Attica Fans of Panathinaikos at the Olympic Stadium of Athens Olympiacos fans at the Karaiskakis Stadium against Chelsea for the knockout stage of the 2007–08 UEFA Champions League. The Big Three (Greek: Οι μεγάλοι τρεις, hoi megaloi treis) is the nickname of t...

 本表是動態列表,或許永遠不會完結。歡迎您參考可靠來源來查漏補缺。 潛伏於中華民國國軍中的中共間諜列表收錄根據公開資料來源,曾潛伏於中華民國國軍、被中國共產黨聲稱或承認,或者遭中華民國政府調查審判,為中華人民共和國和中國人民解放軍進行間諜行為的人物。以下列表以現今可查知時間為準,正確的間諜活動或洩漏機密時間可能早於或晚於以下所歸�...

 

 

Flooding in Downtown New Orleans caused by Hurricane Katrina From 2000 to the present, at least 28 tropical or subtropical cyclones affected the U.S. state of Louisiana. According to David Roth of the Hydrometeorological Prediction Center (HPC), a tropical cyclone makes landfall along the coastline about two times every three years, and a hurricane makes landfall once every 2.8 years.[1] The most active month for tropical cyclone activity in the state is September, with ten...

 

 

4th century BC Theban homosexual military unit Not to be confused with Theban Legion. For other uses, see Sacred band. Sacred Band of ThebesἹερός ΛόχοςActive4th century BCCountryThebesAllegianceThebanBranchTheban armyTypeHeavy infantryRoleFrontal assaultHand-to-hand combatPhalanxRaidingSize300 menMilitary unit The Sacred Band of Thebes (Ancient Greek: Ἱερός Λόχος, Hierós Lókhos) was a troop of select soldiers, consisting of 150 pairs of male lovers which formed the eli...

Il teorema di Wick è un metodo per ridurre uno sviluppo in derivate di ordine superiore a un problema di calcolo combinatorio.[1] Prende il nome dal fisico italiano Gian Carlo Wick.[2] Viene largamente usato in teoria quantistica dei campi per ridurre prodotti arbitrari di operatori di creazione e distruzione a sommatorie di prodotti di coppie di questi operatori. Questo permette l'uso del metodo della funzione di Green, e di conseguenza l'uso dei diagrammi di Feynman. Un'ide...

 

 

Overview of the architecture of Manchester, England Manchester's Victorian neogothic town hall The architecture of Manchester demonstrates a rich variety of architectural styles. The city is a product of the Industrial Revolution and is known as the first modern, industrial city.[1] Manchester is noted for its warehouses, railway viaducts, cotton mills and canals – remnants of its past when the city produced and traded goods. Manchester has minimal Georgian or medieval architecture...

 

 

デルビ 種類 子会社設立 1922年創業者 Simón Rabasa i Singla解散 2018年 本社 バルセロナ、スペイン製品 オートバイ、スクーター、ATV親会社 ピアッジオウェブサイト www.derbi.com デルビ(Derbi)は、スペインの Nacional Motor S.A.U.社が製造するオートバイ、スクーター、ATVのブランド名 。現在同社はピアッジオの子会社となっている。なお記事中では、社名も通称の「デルビ」�...

Agni PratisthaLahirAgni Pratistha Arkadewi Kuswardono8 Desember 1987 (umur 36)Canberra, AustraliaPekerjaanModelAktrisRatu kecantikanTahun aktif2003—sekarangGelar Puteri Indonesia Jawa Tengah 2006 Puteri Indonesia 2006 Miss Universe Indonesia 2007 Suami/istriRyan Anthony Monoarfa ​ ​(m. 2013)​Anak1Keluarga Sigi Wimala (kakak) Timo Tjahjanto (kakak ipar) Pemenang kontes kecantikanWarna rambutHitamWarna mataCokelatKompetisiutama Puteri Indonesia Ja...

 

 

BargnycomuneBargny – Veduta LocalizzazioneStato Francia RegioneAlta Francia Dipartimento Oise ArrondissementSenlis CantoneNanteuil-le-Haudouin TerritorioCoordinate49°11′N 2°58′E49°11′N, 2°58′E (Bargny) Altitudine105 e 139 m s.l.m. Superficie7,67 km² Abitanti280[1] (2009) Densità36,51 ab./km² Altre informazioniCod. postale60620 Fuso orarioUTC+1 Codice INSEE60046 CartografiaBargny Sito istituzionaleModifica dati su Wikidata · Manuale Barg...