Gestenerkennung

Gestenerkennung ist die automatische Erkennung menschlicher Gesten mit Hilfe von Computern. Ein Teilgebiet der Informatik beschäftigt sich mit den Algorithmen und mathematischen Methoden zur Erkennung von Gesten und der Nutzung von Gesten zur Mensch-Computer-Interaktion. Jede Körperhaltung und Körperbewegung kann dabei prinzipiell eine Geste darstellen. Die größte Bedeutung hat jedoch die Erkennung von Hand- und Kopfgesten. Eine Variante der Gestenerkennung ist die Erkennung sogenannter Mausgesten.

Definition

Mit Bezug auf die Mensch-Computer-Interaktion definieren Kurtenbach und Hulteen eine Geste wie folgt: „A gesture is a motion of the body that contains information. Waving goodbye is a gesture. Pressing a key on a keyboard is not a gesture because the motion of a finger on its way to hitting a key is neither observed nor significant. All that matters is which key was pressed“.[1] Im Gegensatz dazu verzichten Harling und Edwards auf die Forderung nach Bewegung und verstehen unter einer Geste auch statische Handhaltungen.[2] Es kann zwischen Systemen unterschieden werden, bei denen sich die zur Erkennung notwendige Sensorik direkt am Körper des Benutzers befindet, und solchen, bei denen der Benutzer durch externe Sensorik beobachtet wird.

Die Gestenerkennung ist ein aktives Forschungsfeld, das versucht, Gesten in die Mensch-Computer-Interaktion zu integrieren. Es hat Anwendungen in der Steuerung virtueller Umgebungen, aber auch in der Übersetzung von Gebärdensprachen, der Fernsteuerung von Robotern oder musikalischen Kompositionen.

Das Erkennen menschlicher Gesten fällt in den allgemeineren Rahmen der Mustererkennung. In diesem Rahmen bestehen Systeme aus zwei Prozessen: dem Repräsentationsprozess und dem Entscheidungsprozess. Der Darstellungsprozess konvertiert die numerischen Rohdaten in eine Form, die an den Entscheidungsprozess angepasst ist und die Daten dann klassifiziert.

Gestenerkennungssysteme erben diese Struktur und haben zwei weitere Prozesse: den Erfassungsprozess, der die physische Geste in numerische Daten umwandelt, und den Interpretationsprozess, der die Bedeutung der aus dem Entscheidungsprozess stammenden Symbolserien angibt.

Am häufigsten werden Hand- und Armgesten interpretiert. Sie bestehen typischerweise aus vier Elementen: Handkonfiguration, Bewegung, Orientierung und Position. Eine grobe Klassifizierung von Gesten kann auch durch Trennen der statischen Gesten erfolgen, die als Handhaltungen bezeichnet werden, und die dynamischen Gesten, die Sequenzen von Handhaltungen sind.

Es können zwei Hauptfamilien von Gestenerfassungssystemen betrachtet werden, Systeme mit und ohne Hilfsmittel am Körper. In Systemen mit Körperhilfsmittel erfolgt die Erfassung von Gesten durch Zusatzgeräte (Sensor-Handschuhe, Exoskelette, Marker), das einige Eigenschaften der Geste, im Allgemeinen die verschiedenen Gelenkbiegewinkel, direkt misst. In hilfsmittelfreien Systemen wird die Geste von einem Sensor (Kamera, Ultraschall) aus der Distanz erfasst. Der Hauptvorteil des Remote-Ansatzes ist seine nicht-einschränkende Natur. Er ermöglicht dem Benutzer eine spontane Ausführung einer Geste, ohne vorherigen Rüstaufwand. Die Hauptnachteile sind die erhöhte Komplexität der Verarbeitung sowie die Begrenzung des Erfassungsbereichs. Hilfsmittelbasierte Methoden hingegen sind schneller und robuster.[3]

Gestenerkennung mit Hilfsmittel am Körper

Die meisten auf am Körper getragener oder mit der Hand geführter Sensorik basierenden Systeme nutzen in Datenhandschuhe integrierte Beschleunigungs- oder Positionssensoren. Der Nachteil von auf Datenhandschuhen basierenden Systemen ist, dass der Benutzer den Handschuh anziehen muss, um das System zu nutzen.

Mit der Hand geführte Systeme, wie der Controller der Nintendo Wii und der durch die Firma BeeCon hergestellte BlueWand,[4] können ebenfalls zur Gesteneingabe genutzt werden. Beide Systeme lassen sich durch den Benutzer in die Hand nehmen und verfügen über Beschleunigungssensoren, um die Bewegung des jeweiligen Gerätes festzustellen.

Bei neueren Geräten wie Smartphones und Tabletcomputern werden vor allem Touchscreens eingesetzt, die per „Wischgesten“ benutzt werden können. Insbesondere bieten Multi-Touch-Screens die Erkennung von mehreren unabhängigen Fingerdrücken gleichzeitig, sodass beispielsweise mit zwei diagonal angesetzten Fingerspitzen Fenster größer oder kleiner gezogen werden können.

Gestenerkennung ohne Hilfsmittel am Körper

Bei Systemen mit externer Sensorik handelt es sich zumeist um kameragestützte Systeme.[5] Die Kameras werden genutzt, um Bilder des Benutzers zu erstellen. Dabei existieren sowohl Systeme mit einer Kamera als auch mit mehreren Kameras, wobei die neueren Systeme oftmals mit 3D-Daten arbeiten, die entweder über time-of-flight-Kameras oder sogenannte Structured Light Kameras arbeiten. Kamerabasierte Verfahren greifen auf Techniken der 2D- und 3D-Bildanalyse zurück, um die Körperhaltung des Benutzers zu erkennen. Kameragestützte Gestenerkennung wird beispielsweise in Spielen für das an Spielekonsolen anschließbare EyeToy verwendet. Ein ganz neuer Ansatz ist die Gestensteuerung per Stereoskopie. Der Vorteil dabei ist, dass diese ohne Infrarotlicht auskommt und somit auch im Freien funktioniert.

Bei der technischen Bildanalyse sind grundsätzlich mehrere Ansätze zu unterscheiden: Entweder wird eine Datenbank mit relevanten Gesten erstellt, die auf Grund eines Meridians von über 1000 Videoanalysen pro Geste erstellt worden sind. Aufgenommene Steuerungsgesten werden dann mit der Datenbank verglichen und entsprechend bestimmt. Diese Lösung wird zum Beispiel von Microsoft mit der Xbox in Verbindung mit der 3D-Kamera Kinect angewendet. Die Analyse kann im zweidimensionalen Raum anhand von Bild- und Videoinformationen durchgeführt werden. Im dreidimensionalen Raum spricht man von volumetrischer Berechnung, beispielsweise werden Körper durch Non-Uniform Rational B-Splines oder Polygone repräsentiert.[6] An einer Berechnung von 3D-Daten in Echtzeit wird derzeit noch entwickelt. Der Nachteil dieser datenbankbasierten Analyse ist, dass sie mit der Datenbank viel Rechenleistung abfordert. Alternativ arbeitet die Software mit einer echten Skeletterkennung, d. h. aus den Kameradaten werden Körper, Hand und/oder Finger erkannt und durch ein vereinfachtes Skelettmodell den vordefinierten Gesten zugeordnet. Diese Lösung verspricht eine sehr viel größere Gestenvielfalt und Präzision, ist aber technisch deutlich anspruchsvoller.

Mittels mikromechanischer Ultraschallwandler können Abstandsänderungen, Bewegungsmuster und Gesten im Bereich bis zu einem halben Meter mit hoher räumlicher Auflösung gemessen werden. Das Fraunhofer-Institut für Photonische Mikrosysteme hat dafür sehr kleine und kostengünstig herstellbare Bauelemente entwickelt.[7]

Ziel der Forschung und Entwicklung in den kommenden Jahren ist es, Gestenerkennung im Rahmen von Embedded Software umzusetzen, die plattform- und kameraunabhängig ist und nur wenig Energie benötigt, daher auch beispielsweise in Mobiltelefonen, Tablets oder Navigationssystemen eingesetzt werden kann.

2012 haben eine Reihe von kommerziellen Anbietern angekündigt, dass sie mit Geräten zur Gestenerkennung auf den Markt kommen wollen, welche deutlich besser sein sollen als die bis dahin verfügbaren Geräte (insb. die Kinect für die Xbox). Zum Beispiel hat Samsung auf der CES 2012 in Las Vegas den Smart TV vorgestellt. Ein anderes Unternehmen ist LeapMotion, wobei das Werbevideo zu The Leap in der Community kritisiert wurde, da teilweise offensichtlich gestellte Szenen eingespielt wurden. In Deutschland ist Gestenkontrolle insbesondere ein Thema im Bereich der Automobilindustrie, wobei hier besonders stabile und mobile Systeme benötigt werden, wie sie zum Beispiel von gestigon hergestellt werden. Auch in den Bereichen Digital Signage, Medientechnik, Medienkunst und Performance wird 3D Gestenerkennung gerne eingesetzt. Eine einfache Möglichkeit, Gestenerkennung in diesen Bereichen zu nutzen und z. B. andere Software zu kontrollieren, ist Kinetic Space. Weitere Hersteller sind zum Beispiel Omek, Softkinetic und Myestro Interactive.

Gestenarten

Der Buchstabe „J“ in einer kanadischen Gebärdensprache

Es kann nach zwei Gestenarten unterschieden werden. Bei kontinuierlichen Gesten besteht eine direkte Verbindung zwischen der durch den Computer beobachteten Bewegung und einem Zustand im Computer. Beispielsweise kann durch Zeigen auf den Bildschirm ein Zeiger gesteuert werden. Bei diskreten Gesten handelt es sich hingegen um beschränkte Mengen von eindeutigen Gesten, mit denen in der Regel jeweils eine Aktion verknüpft ist. Ein Beispiel für diskrete Gesten ist die Gebärdensprache, bei der jede Gebärde mit einer bestimmten Bedeutung verknüpft ist.[8] Für berührungsempfindliche Bildschirme (Touchscreens) hingegen sind einfache Fingerbewegungen, wie das Kneifen (Kneifgeste) oder Spreizen (Spreizgeste) mit zwei Fingern, üblich.

Erkennung

Bei der eigentlichen Erkennung von Gesten, werden die Informationen der Sensorik mittels Algorithmen analysiert, die aus den gemessenen Rohdaten Gesten ermitteln. Dabei kommen Algorithmen zur Mustererkennung zum Einsatz. Zur Entfernung von Rauschen in den Eingabedaten und zur Datenreduktion erfolgt häufig im ersten Schritt eine Vorbearbeitung der Sensordaten. Anschließend werden Merkmale aus den Eingabedaten extrahiert. Diese Merkmale dienen als Eingabe für die Klassifikation. Hierfür werden häufig Hidden Markov Models, künstliche neuronale Netze und weitere Techniken, die ihren Ursprung meist in der Forschung zum maschinellen Lernen haben, eingesetzt.

Neue Erkenntnisse im Bereich des maschinellen Lernens und vor allem im Kontext des Lerntransfers haben Anwendungen ermöglicht, bei denen mit relativ wenig Rohdaten Modelle entwickelt werden können, welche für individuelle Gesten in Anwendungen verwendet werden können. Die zugrunde liegende Architektur dieser Modelle ermöglicht dabei sowohl die Gestenerkennung in Bildern als auch in Videos.[9]

Einzelnachweise

  1. Kurtenbach G. und Hulteen E.A. „Gestures in Human-Computer Communication“. In: The Art of Human-Computer Interface Design. S. 309–317, 1990
  2. P.A. Harling und A.D.N. Edwards. 1997. "Hand Tension as a Gesture Segmentation Cue." In: Progress in Gestural Interaction, S. 75–88.
  3. ScienceDirect: Gesture Recognition
  4. Fuhrmann T., Klein M. und Odendahl M. „The BlueWand as interface for ubiquitous and wearable computing environments“. In: Proceedings of the European Conference on Personal Mobile Communications. pp. 91–95, 2003.
  5. Pavlovic V.I., Sharma R. und Huang T.S. „Visual interpretation of hand gestures for human-computer interaction: a review“. IEEE Transactions on Pattern Analysis and Machine Intelligence. vol. 19, S. 677–695, 1997.
  6. Vladimir I. Pavlovic, Rajeev Sharma, Thomas S. Huang, Visual Interpretation of Hand Gestures for Human-Computer Interaction; A Review, IEEE Transactions on Pattern Analysis and Machine Intelligence, 1997.
  7. Fraunhofer-Institut für Photonische Mikrosysteme: Gestenerkennung durch Ultraschall, Presseinformation vom 20. Mai 2019.
  8. Huang C.L. und Huang W.Y., „Sign language recognition using model-based tracking and a 3D Hopfield neural network“, Machine Vision and Applications, vol. 10, S. 292–307, 1998.
  9. David Richard Tom Hax, Pascal Penava, Samira Krodel, Liliya Razova, Ricardo Buettner: A Novel Hybrid Deep Learning Architecture for Dynamic Hand Gesture Recognition. In: IEEE Access. 2024, ISSN 2169-3536, S. 1–1, doi:10.1109/ACCESS.2024.3365274 (ieee.org [abgerufen am 21. Februar 2024]).
Commons: Gestenerkennung – Sammlung von Bildern, Videos und Audiodateien

Read other articles:

Песня Единого фронта (Einheitsfrontlied) Пластинка с песней (СССР, 1937 г.) Песня Дата создания 1934 Дата выпуска 1934 Жанр песня протеста Язык немецкий Композитор Ханс Эйслер Автор слов Бертольт Брехт «Песня Единого фронта» (нем. Einheitsfrontlied) — песня, написанная немецким композиторо...

 

Sebuah lanong orang Lanun dengan layar tanja. Layar tanja adalah jenis layar yang biasa digunakan oleh suku bangsa Austronesia lainnya, khususnya di Indonesia, Malaysia, dan Filipina. Ia disebut sebagai tilted square sail, canted rectangular sail, rectangular balance lug, atau balance lug sail dalam bahasa Inggris.[1][2][3]:102-103[4]:608 Pada sumber-sumber sejarah, kadang-kadang layar tanja salah disebut dengan nama layar lateen atau layar persegi.[5] ...

 

Walter Paye LaneBorn(1817-02-18)February 18, 1817County Cork, Ireland, U.K.DiedJanuary 28, 1892(1892-01-28) (aged 74)[1]Marshall, TexasAllegiance Republic of Texas United States of America Confederate States of AmericaService/branch Army of the Republic of Texas United States Army Confederate States ArmyYears of service1836 (Texas)1846–48 (USA)1861–65 (CSA)Rank Major (USA) Brigadier General (CSA)Battles/warsTexas RevolutionMexican–American War...

Brazilian footballer In this Portuguese name, the first or maternal family name is Lopes and the second or paternal family name is de Miranda. Roberto Miranda Roberto with Brazil at the 1970 FIFA World CupPersonal informationFull name Roberto Lopes de MirandaDate of birth (1943-07-31) 31 July 1943 (age 80)Place of birth Niterói, BrazilPosition(s) Midfielder, ForwardSenior career*Years Team Apps (Gls)1962–1970 Botafogo 351 (153)1971–1973 Flamengo 11 (3)1973–1976 Corinthians 77 ...

 

Artikel ini bukan mengenai Atas Nama Cinta (seri televisi 2005). Untuk kegunaan lain, lihat Atas Nama Cinta. Atas Nama CintaGenre Drama Roman Ditulis olehTim Penulis TobaliSutradaraWicik WidiyansyahPemeran Sarah Samantha Jonas Rivanno Donny Michael Penggubah lagu temaMelly GoeslawLagu pembukaAtas Nama Cinta — RossaLagu penutupAtas Nama Cinta — RossaPenata musikMatthews N.S SiahaanNegara asalIndonesiaBahasa asliBahasa IndonesiaJmlh. musim1Jmlh. episode25ProduksiProduser eksekutifU.S ...

 

Sceaux 行政国 フランス地域圏 (Région) イル=ド=フランス地域圏県 (département) オー=ド=セーヌ県郡 (arrondissement) アントニー郡小郡 (canton) 小郡庁所在地INSEEコード 92071郵便番号 92330市長(任期) フィリップ・ローラン(2008年-2014年)自治体間連合 (fr) メトロポール・デュ・グラン・パリ人口動態人口 19,679人(2007年)人口密度 5466人/km2住民の呼称 Scéens地理座標 北緯48度4...

هذه المقالة عن المجموعة العرقية الأتراك وليس عن من يحملون جنسية الجمهورية التركية أتراكTürkler (بالتركية) التعداد الكليالتعداد 70~83 مليون نسمةمناطق الوجود المميزةالبلد  القائمة ... تركياألمانياسورياالعراقبلغارياالولايات المتحدةفرنساالمملكة المتحدةهولنداالنمساأسترالي�...

 

土库曼斯坦总统土库曼斯坦国徽土库曼斯坦总统旗現任谢尔达尔·别尔德穆哈梅多夫自2022年3月19日官邸阿什哈巴德总统府(Oguzkhan Presidential Palace)機關所在地阿什哈巴德任命者直接选举任期7年,可连选连任首任萨帕尔穆拉特·尼亚佐夫设立1991年10月27日 土库曼斯坦土库曼斯坦政府与政治 国家政府 土库曼斯坦宪法 国旗 国徽 国歌 立法機關(英语:National Council of Turkmenistan) ...

 

土库曼斯坦总统土库曼斯坦国徽土库曼斯坦总统旗現任谢尔达尔·别尔德穆哈梅多夫自2022年3月19日官邸阿什哈巴德总统府(Oguzkhan Presidential Palace)機關所在地阿什哈巴德任命者直接选举任期7年,可连选连任首任萨帕尔穆拉特·尼亚佐夫设立1991年10月27日 土库曼斯坦土库曼斯坦政府与政治 国家政府 土库曼斯坦宪法 国旗 国徽 国歌 立法機關(英语:National Council of Turkmenistan) ...

ヨハネス12世 第130代 ローマ教皇 教皇就任 955年12月16日教皇離任 964年5月14日先代 アガペトゥス2世次代 レオ8世個人情報出生 937年スポレート公国(中部イタリア)スポレート死去 964年5月14日 教皇領、ローマ原国籍 スポレート公国親 父アルベリーコ2世(スポレート公)、母アルダその他のヨハネステンプレートを表示 ヨハネス12世(Ioannes XII、937年 - 964年5月14日)は、ロ...

 

سيباستيان أنتيتش معلومات شخصية الاسم الكامل سيباستيان أنتيتش الميلاد 5 نوفمبر 1991 (33 سنة)  رييكا  الطول 1.85 م (6 قدم 1 بوصة) مركز اللعب مدافع الجنسية كرواتيا  معلومات النادي النادي الحالي الميناء الرقم 13 مسيرة الشباب سنوات فريق 2002−2010 NK Crikvenica [الإنجليزية]‏ �...

 

Национальное аэрокосмическое агентство Азербайджана Штаб-квартира Баку, ул. С. Ахундова, AZ 1115 Локация  Азербайджан Тип организации Космическое агентство Руководители Директор: Натиг Джавадов Первый заместитель генерального директора Тофик Сулейманов Основание Осн�...

NGC 6593   الكوكبة الجاثي  رمز الفهرس NGC 6593 (الفهرس العام الجديد)PGC 61617 (فهرس المجرات الرئيسية)2MASX J18140351+2217015 (Two Micron All-Sky Survey, Extended source catalogue)MCG+04-43-018 (فهرس المجرات الموروفولوجي)UZC J181403.6+221702 (فهرس زفيكي المحدّث)Z 142-30 (فهرس المجرات وعناقيد المجرات)Z 1812.0+2216 (فهرس المجرات وعناقيد المجر...

 

Species of moth Mazuca strigicincta Scientific classification Domain: Eukaryota Kingdom: Animalia Phylum: Arthropoda Class: Insecta Order: Lepidoptera Superfamily: Noctuoidea Family: Noctuidae Genus: Mazuca Species: M. strigicincta Binomial name Mazuca strigicinctaWalker, 1866 Synonyms Hypsa concinnula Mabille, 1878 Apsarasa liturata Butler, 1881 Mila hebraica Aurivillius, 1891 Mazuca strigicincta, the Pikachu moth, is a moth in the family Noctuidae found from Nigeria and Ghana down to n...

 

Not to be confused with Princeton Township, New Jersey or Borough of Princeton, New Jersey. See also: Princeton University Borough in New Jersey, United StatesPrinceton, New JerseyBoroughLower Pyne building on the corner of Nassau Street and Witherspoon Street, 2015Nassau Street northbound in Downtown Princeton, 2017Princeton station, 2020McCarter Theatre, 2018Nassau Hall on the campus of Princeton University, 2019Princeton Battlefield, 2007Palmer Square, 2013Institute for Advanced Study, 202...

A chemotherapy medication used for several cancer types ProcarbazineClinical dataTrade namesMatulane, Natulan, Indicarb, othersAHFS/Drugs.comMonographMedlinePlusa682094Pregnancycategory AU: D Routes ofadministrationBy mouth (gel capsule), intravenousATC codeL01XB01 (WHO) Legal statusLegal status In general: ℞ (Prescription only) Pharmacokinetic dataMetabolismliver, kidneyElimination half-life10 minutesExcretionkidneyIdentifiers IUPAC name N-Isopropyl-4-[(2-methylhyd...

 

Elizabeth dari YorkSalinan abad 16 dari lukisan abad 15 Permaisuri Raja Inggris Periode18 Januari 1486 – 11 Februari 1503Penobatan25 November 1487PendahuluAnne NevillePenerusKatherine dari AragonInformasi pribadiKelahiran(1466-02-11)11 Februari 1466Istana Westminster, London,  InggrisKematian11 Februari 1503(1503-02-11) (umur 37)Menara London, London,  InggrisPemakaman24 February 1503Westminster Abbey, London,  InggrisWangsaYorkAyahEdward IV, Raja InggrisIbuElizabeth Woo...

 

Peta akhir abad ke-XVIII provinsi Habsburg Innerösterreich:  Kadipaten Steiermark  Kadipaten Kärnten  Kadipaten Krain dengan wilayah Graft Duino dan Marka Istria  Grafschaft Kepangeranan Gorizia dan Gradisca  Kota Kekaisaran Trieste Austria Dalam (bahasa Jerman: Innerösterreich; bahasa Slovenia: Notranja Avstrija; bahasa Italia: Austria Interiore) adalah istilah yang digunakan dari akhir abad ke-XIV hingga awal abad ke-XVII untu...

Sonny RollinsInformasi latar belakangNama lahirTheodore Walter RollinsNama lainNewk, Colossus, Uncle DonLahir7 September 1930 (umur 93)New York City, New York, United StatesGenreJazz, hard bopPekerjaanMusician, composer, bandleaderInstrumenTenor saxophone, soprano saxophoneTahun aktifLate 1940s-presentLabelPrestige, Blue Note, Contemporary, RCA Victor, Impulse!, Milestone, DoxyArtis terkaitClifford Brown, Miles Davis, Kenny Dorham, Art Farmer, Dizzy Gillespie, Babs Gonzales, J.J. Johnson...

 

German composer, critic and lexicographer (1681–1764) Johann MatthesonMattheson, in a 1746 engraving by Johann Jacob HaidBorn(1681-09-28)28 September 1681HamburgDied17 April 1764(1764-04-17) (aged 82)HamburgOccupationsComposercriticlexicographertheorist Johann Mattheson (28 September 1681 – 17 April 1764)[1] was a German composer, critic, lexicographer and music theorist. His writings on the late Baroque and early Classical period were highly influential, specifically, his bi...