نموذج حقيبة الكلمات في الرؤية الحاسوبية

في الرؤية الحاسوبية، يمكن تطبيق نموذج حقيبة الكلمات (بالإنجليزية: bag-of-words model)‏ لتصنيف الصور عن طريق معاملة ملامح الصور image features كأنها كلمات.[1][2][3] ففي مجال التعرف وتصنيف الوثائق، حقيبة الكلمات هي عبارة عن متجهه رياضي vector يعبر عن مدي تكرار هذه الكلمات في النص ويكون ذلك عن طريق مدرج تكراري histogram لكل الكلمات الممكنة في النص. أما في مجال الرؤية الحاسوبية تكون حقيبة الكلمات هي عبارة عن مدرج تكراري يعبر عن مدي تكرار ملمح معين للصورة في صورة معينة.

حقيبة الكلمات

التمثيل بناءً علي نموذج حقيبة الكلمات

تمثيل الصور بناءً علي نموذج حقيبة الكلمات

لتمثيل صورة عن طريق نموذج حقيبة الكلمات، يتم معاملة الصورة كأنها وثيقة نصية. بالمثل؛ يجب تعريف الكلمات الممثلة للصور. وللوصول إلي ذلك يتم إتباع ثلاثة خطوات أساسية: اكتشاف ملامح الصور Feature detection ، توصيف ملامح الصور Feature description ، إنتاج قاموس ملامح الصور codebook generation. وهنا؛ يمكن تعريف نموذج حقيبة الكلمات علي أنه: «تمثيل ملامح الصور المستقلة عن طريق مدرج تكراري».

تمثيل ملامح الصور

حساب إتجاه و دوران توصيف ال SIFT

بعد اكتشاف ملامح الصورة، يتم التعبير عن الصورة عن طريق مجموعة من رقع محلية مختلفة. طريقة تمثيل ملامح الصورة تعتمد في الأساس علي كيفية التعبير عن هذه الرقعة patch بشكل متجه عددي vector . ويجب أن يعبر الوصف الجيد للرقعة علي مدي الإضاءة intensity ، مدي الدوران rotation ، مقياس الرسم scale وغير ذلك من الصفات. أحد أشهر وأهم طرق وصف الرقع يسمي SIFT. فهذه الطريقة تقول بتحويل كل رقعة في الصورة إلي متجه عددي طوله 128 عنصر. بعد الانتهاء من هذه الخطوة يتم التعبير عن كل صورة بعدد من هذه المواصفات حيث يعد ترتيب هذه المواصفات غير مهم.

إنتاج قاموس ملامح الصور

أخر خطوة في نموذج حقيبة الكلمات هو تحويل المتجه العددي الممثل لرقع الصور إلي قاموس كلمات. تعتبر الكلمة داخل هذا القاموس تمثيلاً لعدد مختلف من الرقع المتشابهة. أحد الطرق السهلة للوصول إلي ذلك هو تطبيق خوارزم مشهور للتقسيم يسمي k-means clustering علي جميع المواصفات المجمعة من كل الصور. بعد تنفيذ هذا الخوارزم تكون كلمات القاموس عبارة عن مراكز المجموعات المقسمة. ويعتبر عدد هذه المراكز هو حجم قاموس الكلمات.
بعد ذلك يتم حساب مدي انتماء كل ملمح في الصورة لهذه المراكز المجمعة في قاموس الكلمات، ويتم تمثيل الصورة كاملة في صورة مدرج تكراري histogram.

التعلم والتعرف بناءً علي نموذج حقيبة الكلمات

لقد طور الباحثون في علم الرؤية الحاسوبية العديد من طرق التعليم للاستفادة من نموذج حقيبة الكلمات في المهام المتعلقة بالصور، مثل تصنيف العناصر أو تصنيف المشاهد. هذه الطرق يمكن بالكاد تقسيمها إلي نماذج منتجة، ونماذج مميزة. في حالة تصنيف العديد من التصنيفات، يمكن استخدام مصفوفة التشويش كعامل لقياس مدي جودة التصنيف.

النماذج المنتجة

بما أن نموذج حقيبة الكلمات هو نموذج مشابه معالجة اللغات الطبيعية، فإن النماذج المنتجة (Generative models) قد تم تطويرها في الأساس في مجال معالجة الكلمات وتم تبنيها في مجال الرؤية الحاسوبية وسوف نقوم بإستعراض طريقتين من هذه الطرق.

طريقة Naïve Bayes

تعتبر طريقة مميز Naïve Bayes هي أبسط الطرق. حيث يقوم باستخدام لغة النماذج المرئية graphical models. الفكرة الأساسية لهذا النموذج هي أن لكل تصنيف توزيعة معينة علي قاموس الكلمات codebook ، وهذه التوزيعة تختلف من تصنيف لتصنيف أخر. فعلى سبيل المثال تصنيف الوجوه وتصنيف السيارات؛ فتصنيف الوجه سيحتوي على قيم أكبر عند كلمات مثل «الأنف»، «العين»، «الفم»، بينما تصنيف السيارة سيحتوي على قيم أكبر عند كلمات مثل «نافذة»، «إطار». يقوم هذا المميز بتعلم هذه التوزيعات عن طريق تدريبه بعدد من أمثلة التدريب.
و بما أن هذا المميز يتميز ببساطته وفعاليته، فهو في العادة يستخدم كأداة للمقارنة.

نماذج Bayes الهرمية

في الطريقة السابقة كان الفرض الأساسي هو أن التوزيعة بالنسبة لكتاب الكلمات مميزة تماماً ولا تتكرر. ولكن هذا الشرط غير صالح في جميع الأحوال. على سبيل المثال قد يكون هناك تصنيف معين يحتوي على كثير من الكلمات المتداخلة كصورة بها وجوه وسيارات. هناك طريقتان للقضاء علي هذه المشكلة وسنأخذ أحدهما كمثال وهي Latent Dirichlet allocation . فمثلاً لتمثيل صورة طبيعية معينة باستخدام هذه الطريقة يكون عن طريق التالي:

  • تصنيف الصورة يكون مثل تصنيف الملف.
  • خليط التصنيفات في الصورة يماثل خليط الموضوعات في الملف النصي.
  • مفتاح التصنيف يماثل مفتاح الموضوعات.
  • الملمح الصوري يماثل الكلمة في قاموس الكلمات.

و قد أظهرت هذه الطريقة نتائج مبشرة في تصنيف المشاهد الطبيعية علي 13 Natural Scene Categories.

النماذج المميزة

SVM و استخدامه في التمييز بين الأنماط

و بما إن التعبير عن الصور يتم عن طريق نموذج حقيبة الكلمات، فإن أي نموذج مميز (Discriminative models) مناسب لتمييز الكلمات يمكن محاولته أيضاً، مثال ذلك آله متجه الدعم Support vector machine ، أو AdaBoost. وأيضاً kernel trick هي طريقة مناسبة عند استخدام مميز معتمد علي النواة kernel based classifier. نواة المطابقة الهرمية أو Pyramid match kernel هي أحد الطرق الحديثة التي تم تطويرها اعتمادا علي نموذج حقيبة الكلمات، هذا النموذج يتم تدريب مميز classifier به، وقد تم اختباره مع كثير من الأمثلة. وقد أظهر نتائج مبشرة علي عدد من الأنماط التي تم الاختبار عليها وتسجيل نتائجها.

نواة المطابقة الهرمية

نواة المطابقة الهرمية (Pyramid match kernel) هي خوارزم سريع يقوم بمطابقة عدد من الملامح في نموذج حقيبة الكلمات إلي مدرجات تكرارية في مستوي متعدد الدقة. أحد مميزات استخدام مدرج تكراري متعدد الدقة هي إمكانية التقاط وتسجيل الملامح المتكررة والمتقاربة. نواة المطابقة الهرمية يقوم ببناء المدرج التكراري متعدد الدقة عن طريق تسجيل نقاط المعلومات في نطاقات متدرجة ومتزايدة في الحجم. لذلك فإن النقاط التي لا يتم مطابقتها في الدقة العالية، فهناك احتمالية ليتم مطابقتها في الدقة الأقل. ولقد تم تطبيق هذا الخوارزم علي مجموعات متعددة من الصور مثل ETH-80 database و Caltech 101 database ، وأظهر نتائج مبشرة.

القيود وآخر التطورات

أحد عيوب نموذج حقيبة الكلمات هو أنه يتجاهل العلاقات المكانية للرقعات والملامح، هذه العلاقات تعد من أهم العناصر في تمثيل الصور. وقد عرض الباحثون العديد من الطرق للتغلب علي هذه المشكلة ومحاولة تسجيل العلاقات المكانية للملامح.
بالإضافة إلي ذلك، فإن نموذج حقيبة الكلمات لم يتم اختباره بطريقة قوية ومركزه في حالة اختلاف حجم الملامح ومقياس رسمها، ومازال إلي الآن أداءه غير واضح. وأيضاً يضاف إلي ذلك أن هذا المجال -نموذج حقيبة الكلمات- يفتقد إلي الدراسة المتعمقة فيه.

انظر أيضاً

مراجع

  1. ^ T. Leung؛ J. Malik (2001). "Representing and recognizing the visual appearance of materials using three-dimensional textons" (PDF). International Journal of Computer Vision. ج. 43 ع. 1: 29–44. DOI:10.1023/A:1011126920638. مؤرشف من الأصل (PDF) في 2016-03-04.
  2. ^ Fei-Fei Li؛ Perona، P. (2005). "A Bayesian Hierarchical Model for Learning Natural Scene Categories". 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'05). ج. 2: 524. DOI:10.1109/CVPR.2005.16. ISBN:0-7695-2372-2.
  3. ^ Koniusz، Piotr؛ Yan، Fei؛ Mikolajczyk، Krystian (1 مايو 2013). "Comparison of mid-level feature coding approaches and pooling strategies in visual concept detection". Computer Vision and Image Understanding. ج. 117 ع. 5: 479–492. DOI:10.1016/j.cviu.2012.10.010. ISSN:1077-3142. مؤرشف من الأصل في 2019-12-15.

وصلات خارجية

Read other articles:

Artikel ini sebatang kara, artinya tidak ada artikel lain yang memiliki pranala balik ke halaman ini.Bantulah menambah pranala ke artikel ini dari artikel yang berhubungan atau coba peralatan pencari pranala.Tag ini diberikan pada April 2017. José Ricardo dos Santos OliveiraInformasi pribadiTanggal lahir 19 Mei 1984 (umur 39)Tempat lahir BrasilPosisi bermain PenyerangKarier senior*Tahun Tim Tampil (Gol)2002 Kashiwa Reysol * Penampilan dan gol di klub senior hanya dihitung dari liga dome...

 

AirportPoster filmSutradaraGeorge SeatonProduserRoss HunterDitulis olehArthur Hailey (novel)George SeatonPemeranBurt LancasterDean MartinJean SebergJacqueline BissetGeorge KennedyHelen HayesVan HeflinPenata musikAlfred NewmanSinematograferErnest Laszlo, ASCPenyuntingStuart GilmoreDistributorUniversal PicturesTanggal rilis5 Maret 1970Durasi137 menitNegara Amerika SerikatBahasaInggrisAnggaran$10.000.000Pendapatankotor$100.489.151[1] Airport adalah sebuah film drama Amerika Se...

 

Keuskupan San Miguel di ArgentinaDioecesis Sancti Michaëlis in ArgentinaDiócesis de San MiguelKatolik Katedral Santo MikaelLokasiNegaraArgentinaProvinsi gerejawiBuenos AiresStatistikLuas206 km2 (80 sq mi)Populasi- Total- Katolik(per 2010)986.000852,000 (86.4%)Paroki27InformasiDenominasiKatolik RomaRitusRitus RomaPendirian11 Juli 1978 (45 tahun lalu)KatedralKatedral Santo Mikael Malaikat Agung di San MiguelPelindungSanto Mikael Malaikat AgungBunda dari Luj�...

Pour les articles homonymes, voir Henri II et Henri Ier. Pour les articles homonymes, voir Henri de France, Henri d'Orléans, Henri de Valois et Henri de Bretagne. Si ce bandeau n'est plus pertinent, retirez-le. Cliquez ici pour en savoir plus. Certaines informations figurant dans cet article ou cette section devraient être mieux reliées aux sources mentionnées dans les sections « Bibliographie », « Sources » ou « Liens externes » (septembre 2...

 

Lithuanian-American long-distance pilot This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Stasys Girėnas – news · newspapers · books · scholar · JSTOR (September 2019) (Learn how and when to remove this template message) Stasys GirėnasBorn(1893-10-04)October 4, 1893Vytogala, near Šilalė, Kovno Governorate,...

 

Voce principale: Pandemia. Corsia dell'Ospedale di Camp Funston nel Kansas durante l'influenza spagnola del 1918 Una pandemia influenzale è un'epidemia di virus influenzale che si espande su scala mondiale e infetta una grande porzione della popolazione umana. A differenza delle regolari epidemie stagionali le pandemie avvengono irregolarmente, e ne compaiono circa 3 in ogni secolo[1]. Il fatto che sia dichiarata pandemia non vuol dire che sia una patologia grave, dato che tale defi...

Confounding (atau sering kali dikenal sebagai efek perancu/pengacau) merupakan bias yang bersumber dari proses pencampuran efek pajanan utama terhadap efek dari dampak risiko luar lainnya atau adanya variabel pengganggu yang digunakan sebagai perancu pada saat analisis yang bahkan tidak menggunakan metode yang tidak diperhitungkan.[1] Confounding juga diartikan sebagai isu yang penting untuk diperhatikan, karena kehadirannya dapat mempengaruhi p value dan besaran risiko yang dapat men...

 

Chemical compound HalocortoloneClinical dataOther names9α-Chloro-6α,11β-difluoro-21-hydroxy-16α-methylpregna-1,4-diene-3,20-dioneDrug classCorticosteroid; GlucocorticoidIdentifiers IUPAC name (6S,8S,9R,10S,11S,13S,14S,16R,17S)-9-Chloro-6,11-difluoro-17-(2-hydroxyacetyl)-10,13,16-trimethyl-7,8,11,12,14,15,16,17-octahydro-6H-cyclopenta[a]phenanthren-3-one CAS Number24320-27-2PubChem CID20056980ChemSpider16736630UNIIZ9TL048W82ChEMBLChEMBL2106353Chemical and physical dataFormulaC22H27ClF2O3Mo...

 

Gambar sulaman Kreta dengan jahitan Kreta tertutup dari Tenun Sulaman dan Permadani, 1912 Tusuk ranting adalah teknik menyulam yang terbuat dari tusuk jahit terbuka dan melingkar yang dikerjakan secara bergantian di kanan dan kiri tulangan tengah. [1] Aplikasi Tusuk ranting merupakan jahitan dekoratif yang biasanya disertai dengan hiasan. Catatan ^ Reader's Digest Complete Guide to Needlework. The Reader's Digest Association, Inc. (March 1992). ISBN 0-89577-059-8, p. 39-41

2 Raja-raja 4Kitab Raja-raja (Kitab 1 & 2 Raja-raja) lengkap pada Kodeks Leningrad, dibuat tahun 1008.KitabKitab 2 Raja-rajaKategoriNevi'imBagian Alkitab KristenPerjanjian LamaUrutan dalamKitab Kristen12← pasal 3 pasal 5 → 2 Raja-raja 4 (atau II Raja-raja 4, disingkat 2Raj 4) adalah bagian dari Kitab 2 Raja-raja dalam Alkitab Ibrani dan Perjanjian Lama di Alkitab Kristen. Dalam Alkitab Ibrani termasuk Nabi-nabi Awal atau Nevi'im Rishonim [נביאים ראשונים] dalam bag...

 

The UDA West Belfast Brigade is the section of the Ulster loyalist paramilitary group, the Ulster Defence Association (UDA), based in the western quarter of Belfast, in the Greater Shankill area. Initially a battalion, the West Belfast Brigade emerged from the local defence associations active in the Shankill at the beginning of the Troubles and became the first section to be officially designated as a separate entity within the wider UDA structure. During the 1970s and 1980s the West Belfas...

 

Sculpture in Houston, Texas, U.S. BygonesArtistMark di SuveroYear1976 (1976)LocationMenil Collection, Houston, Texas, United StatesCoordinates29°44′15″N 95°23′50″W / 29.737586°N 95.397145°W / 29.737586; -95.397145 Bygones is an outdoor 1976 sculpture by Mark di Suvero, installed at Houston's Menil Collection, in the U.S. state of Texas. The abstract, geometric sculpture is made of Cor-ten beams and a milled steel plate, and measures 25 ft. 11 in. ...

National badminton team representing Belgium BelgiumAssociationRoyal Belgian Badminton Federation (RBBF)ConfederationBE (Europe)PresidentSven SerréBWF rankingCurrent ranking33 (2 January 2024)Highest ranking23 (4 April 2023)Sudirman CupAppearances7 (first in 1993)Best resultGroup stageEuropean Mixed Team ChampionshipsAppearances14 (first in 1976)Best resultGroup stageEuropean Men's Team ChampionshipsAppearances6 (first in 2006)Best resultGroup stageEuropean Women's Team ChampionshipsAppearan...

 

Scouting organization in Florida, USA Central Florida CouncilOwnerBoy Scouts of AmericaHeadquartersApopka, FloridaCountryUnited StatesFounder1946Scout ExecutiveEric MagendantzChair, Board of DirectorsJeff JenningsCouncil PresidentBill PattersonCouncil CommissionerChip Vanture Websitewww.cflscouting.org Scouting portal The Central Florida Council serves Boy Scouts in Orange, Osceola, Seminole, Lake, Brevard, Volusia and Flagler Counties in Florida. Its headquarters was previously located ...

 

Eine Toilettenpapierrolle mit zwei Papphülsen statt der üblichen einen als Beispiel für eine Fehlproduktion Als Fehlproduktion (auch Ausschuss) bezeichnet man in Unternehmen die im Produktionsprozess fehlerbehaftet hergestellten Endprodukte, Fertigerzeugnisse, Halbfabrikate, Zwischenprodukte, Werkstoffe, Werkstücke oder im Bauwesen die Baumängel. Das Gegenstück zur Fehlproduktion ist die sogenannte Ausbeute – der Anteil fehlerfreier Produkte. Inhaltsverzeichnis 1 Allgemeines 2 Geschic...

Medieval European borderland or buffer zone Marches redirects here. For the commune in France, see Marches, Drôme. For other uses, see March (disambiguation) and Marche (disambiguation). In medieval Europe, a march or mark was, in broad terms, any kind of borderland,[1] as opposed to a state's heartland. More specifically, a march was a border between realms or a neutral buffer zone under joint control of two states in which different laws might apply. In both of these senses, marche...

 

Keuskupan VilkaviškisDioecesis VilkaviskensisVyskupija VilkaviškioKatedral VilkaviškisLokasiNegaraLituaniaProvinsi gerejawiKaunasMetropolitKaunasStatistikPopulasi- Total- Katolik(per 2014)339.241331,154 (97.6%)InformasiRitusRitus LatinKatedralŠvč. M. Marijos Apsilankymo katedraKepemimpinan kiniPausFransiskusUskupRimantas NorvilaUskup agungSigitas TamkevičiusEmeritusJuozas Žemaitis, M.I.C.PetaLokasi Keuskupan Vilkaviškis di LituaniaSitus webSitus Web Keuskupan Keusk...

 

Illyrian people This article is about the ancient Illyrian tribe. For the ancient Greek tribe, see Dexaroi. The Dassaretii[a] (Ancient Greek: Δασσαρῆται, Δασσαρήτιοι, Latin: Dassaretae, Dassaretii) were an Illyrian people that lived in the inlands of southern Illyria, between present-day south-eastern Albania and south-western North Macedonia.[1] Their territory included the entire region between the rivers Asamus and Eordaicus (whose union forms the Apsu...

Warwick and Leamington Spa TramwayUnrestored Leamington and Warwick tram at the National Tramway MuseumOperationLocaleWarwick, Leamington SpaOpen21 November 1881Close16 August 1930StatusClosedStatisticsRoute length3.04 miles (4.89 km) Leamington & Warwick Tramways & Omnibus Company era: 1881–1905 Track gauge 4 ft 8+1⁄2 in (1,435 mm) Propulsion system(s) Horse Leamington and Warwick Electrical Company Limited era: 1905–1930 Track gauge 3 ft ...

 

Virginia Raggi Walikota Roma 65Masa jabatan20 Juni 2016 – 21 Oktober 2021PendahuluFrancesco Paolo Tronca sebagai Komisioner KhususPenggantiRoberto Gualtieri Informasi pribadiLahirVirginia Elena Raggi18 Juli 1978 (umur 45)Roma, ItaliaPartai politikGerakan Lima BintangSuami/istriAndrea SeveriniAnak1Alma materUniversitas Roma TrePekerjaanPengacaraSunting kotak info • L • B Virginia Elena Raggi (pelafalan dalam bahasa Italia: [virˈdʒiːnja ˈraddʒi]; k...