רגרסיה מקומית

שימוש ב-LOESS על אוכלוסיית נקודות שנדגמו מפונקציית גל של סינוס בתוספת רעש עם התפלגות אחידה.

רגרסיה מקומית - LOESS ו-LOWESS (קיצור של Locally weighted scatterplot smoothing; החלקת תרשים פיזור בשקלול מקומי) הן שתי שיטות א-פרמטריות נפוצות המשלבות מספר רב של מודלי רגרסיה ומבוססות על מודל שכן קרוב. שיטת " LOESS" היא הכללה מאוחרת של שיטת "LOWESS".[1]

"LOESS" ו- "LOWESS" נבנו על שיטות "קלאסיות" כגון רגרסיית הריבועים הפחותים, ליניארית ולא ליניארית. הן מטפלות במצבים שבהם השיטות הקלאסיות אינן מתפקדות היטב או שלא ניתן ליישמן ביעילות. "LOESS" משלבת בין הפשטות של רגרסיית הריבועים הפחותים הליניארית יחד עם הגמישות של הרגרסיה הלא ליניארית. היא עושה זאת על ידי התאמה של מודלים פשוטים לתת-מדגמים של נתונים מקומיים כדי לבנות פונקציה המתארת את החלק הקבוע של השונות בנתונים, נקודה אחר נקודה. אחד היתרונות העיקריים של שיטה זו הוא שמנתח הנתונים לא נדרש להגדיר פונקציה כללית שתתאים בין המכלל מדגם הודל לנתונים, אלא רק בין המחלקי המדגםתונים.

ה"מחיר" עבור תכונות אלה הוא מספר חישובים מוגבר. בגלל החישובים האינטנסיביים, "LOESS" הייתה כמעט בלתי אפשרית לשימוש מבחינה פרקטית בעידן שבו רגרסיית הריבועים הפחותים פותחה. רוב השיטות המודרניות האחרות למידול תהליכים דומות ל-"LOESS" בהקשר זה. שיטות אלה עוצבו באופן מכוון על מנת לנצל את היכולת החישובית הקיימת כדי להשיג מטרות שלא הושגו בקלות על ידי השיטות המסורתיות.

עקומה חלקה העוברת דרך קבוצת הנקודות הניתנות כמידע שחושבה באמצעות טכניקה סטטיסטית זו, נקראת עקומת LOESS, ובפרט כאשר כל ערך מוחלק מתקבל על ידי רגרסיית ריבועים פחותים ריבועית משוקללת על טווח של ערכי קריטריון הפיזור על ציר ה-Y. כאשר כל ערך מוחלק מתקבל על ידי רגרסיית ריבועים פחותים משוקללת על פני הטווח מתקבלת עקומת LOWESS; עם זאת, יש המתייחסים אל LOWESS ו-LOESS כמילים נרדפות.

הגדרה של מודל LOESS

שיטת LOESS אשר הוצעה במקור על ידי מדען המחשב האמריקני ויליאם קליבלנד (William_S._Cleveland) (1979)[2] ופותחה בהרחבה בהמשך על ידי קליבלנד ודבלין (Susan_J._Devlin) (1988)[3], מוכרת גם כרגרסיית פולינומים מקומית משוקללת. בכל נקודה בנתונים, מותאם פולינום מדרגה נמוכה לתת-קבוצה של הנתונים המכילה ערכים של משתנים מסבירים סביב הנקודה אשר תגובתה נאמדת. הפולינום המותאם, המשתמש בשיטת הריבועים הפחותים המשוקללת, נותן משקל גבוה יותר לנקודות סביב אותה נקודה מגיבה ונאמדת, ומשקל מופחת לנקודות הרחוקות ממנה. הערך של פונקציית הרגרסיה עבור כל נקודה מושג על ידי חישוב של הפולינום המקומי ומשתמש בערכי המשתנים המסבירים עבור אותה נקודה בנתונים. התאמת ה- LOESS מסתיימת לאחר שערכי פונקציית הרגרסיה חושבו עבור כל אחת מה-N נקודות נתונים. הרבה מהפרמטרים של שיטה זו, כמו דרגתו של המודל הפולינומי והמשקלים, הם גמישים. טווחי הפרמטרים עבור כל חלק של השיטה, וערכי ברירת-מחדל טיפוסיים, יידונו בהמשך.

תת-קבוצות של נתונים מקומיים

תת-קבוצות הנתונים הבאים לידי שימוש בכל התאמה של הריבועים הפחותים המשוקללים למודל LOESS נקבעים על ידי אלגוריתם השכן הקרוב. קלט המשתמש לתהליך נקרא "רוחב סרט" או "פרמטר החלקה" וקובע מאיזו סביבה נלקחים הנתונים המשמשים להתאמה של כל פולינום מקומי. פרמטר ההחלקה, α, הוא מספר בין 1 ל- (λ+1)/n כאשר λ מסמן את דרגת הפולינום המקומי. הערך α מציין את החלק של הנתונים המשמשים בכל התאמה. תת-קבוצות הנתונים המשמים לכל התאמת ריבועים מופחתים משוקללת כוללים n×α נקודות (מעוגלות למספר השלם הגדול הבא) של ערכי המשתנים המסבירים הקרובים ביותר לנקודה בה התגובה מוערכת. α נקרא מקדם החלקה מכיוון שהוא שולט בגמישות של פונקציית רגרסיית LOESS. ערכים גבוהים של α יוצרים פונקציית החלקה בעלת תנודתיות נמוכה בתגובה לתנודתיות בנתונים. ה- α הקטן, מסמל את ההתאמה הקרובה ביותר של פונקציית הרגרסיה לנתונים. שימוש בערך קטן מדי של פרמטר החלקה אינו רצוי, עם זאת, שכן פונקציית הרגרסיה בסופו של דבר תתחיל ללכוד את השגיאה האקראית בנתונים. ערכים שימושיים של פונקציית החלקה בדרך כלל נמצאים בטווח של 0.25-0.5 עבור מרבית יישומי ה-LOESS.

דרגות של פולינומים מקומיים

הפולינומים המקומיים המתאימים לכל תת-קבוצה של נתונים הם כמעט תמיד מדרגה ראשונה או שנייה, כלומר, ליניאריים (במובן של קו ישר) או ריבועיים. שימוש בפולינום מדרגה אפס הופך את LOESS לממוצע נע משוקלל. מודל פשוט מסוג זה יכול לעבוד טוב במצבים מסוימים, אבל לא תמיד מצליח אמוד את הפונקציה הבסיסית בצורה מספיק טובה. פולינומים מדרגות גבוהות יותר יעבדו בתאוריה, אבל יניבו מודלים שהם לא באמת ברוח מודל LOESS. LOESS מבוססת על הרעיון שכל פונקציה יכולה להיאמד היטב על ידי פולינום מרמה נמוכה ומודלים פשוטים כאלה יכולים להתאים לנתונים בקלות. פולינומים מדרגה גבוהה יהיו בעלי נטייה להתאמת יתר של הנתונים בכל סט ולאי יציבות מספרית שעלולה לפגום בדיוק האומדנים.

פונקציית משקל

כמוזכר לעיל, פונקציית המשקל מחלקת את רוב המשקל לנקודות סביב הנקודה הנאמדת ונותנת פחות משקל לנקודות הרחוקות ממנה. השימוש במשקלים מבוסס על הרעיון שהנקודות הקרובות אחת לשנייה בחלל המשתנים המסבירים נוטות להיות קשורות זו לזו בצורה קלה יותר מאשר הנקודות שרחוקות מחלל זה. בעקבות הגיון זה, נקודות אשר סביר להניח שיעקבו אחרי המודל המקומי בצורה הטובה ביותר ישפיעו על הפרמטר האומד את המודל המקומי בצורה הטובה ביותר. נקודות שסביר להניח שיתאימו פחות למודל המקומי, ישפיעו פחות על הפרמטר האומד של המודל המקומי. פונקציית המשקל המסורתית בה משתמש מודל LOESS היא פונקציית משקל תלת-קובייתית (אנ'):

כאשר x מתאר את המרחק מהנקודה הנאמדת, מנורמל בין 0 ל-1.

עם זאת, ניתן להשתמש בכל פונקציית משקל אחרת העונה על המאפיינים שהציג קליבלנד (1979) . המשקל עבור נקודה ספציפית בכל מרחב מקומי של תתי נתונים שהוא, מושג על ידי הערכה של פונקציית המשקל במרחק בין הנקודה הספציפית לנקודת האמידה, לאחר דירוג המרחק כך שהמרחק המקסימלי המוחלט של הנקודות על פני תתי הנתונים הוא בדיוק אחד (1).

יתרונותיו של LOESS

היתרון הגדול של LOESS על פני שיטות אחרות, הוא שלא נדרשת בחירה והגדרה פרמטרית של פונקציה כדי להתאים את המודל לכל הנתונים במדגם. במקום זאת, צריך רק לספק ערך של פרמטר החלקה ואת הדרגה של הפולינום המקומי. בנוסף, LOESS היא מאוד גמישה, מה שהופך אותה לאידיאלית למידול תהליכים מורכבים שאין עבורם מודלים תאורטיים קיימים. שני יתרונות אלה, בשילוב עם הפשטות של השיטה, הופכים את LOESS לאחת משיטות הרגרסיה המודרניות האטרקטיביות ביותר ליישומים המתאימים למסגרת הכללית של רגרסיית הריבועים הפחותים ובעלי מבנה דטרמיניסטי מורכב. LOESS גם נהנה מיתרונות רבים המשותפים לשיטות אחרות המבוססות על רגרסיית ריבועים פחותים ליניארית, למרות שבמקרה של LOESS, הקשר לשיטה זו פחות ברור ומיידי. היתרון החשוב ביותר מתוך אלה הוא היכולת לבסס תאורתית חישובי אי ודאות לתחזית וכיול. ניתן להרחיב בדיקות רבות אחרות ונהלים המשמשים לתיקוף מודלים ריבועים פחותים כך שיחולו גם על מודל LOESS.

חסרונותיו של LOESS

LOESS עושה שימוש פחות יעיל בנתונים מאשר שיטות ריבועים פחותים אחרות. היא דורשת מדגמים די גדולים של נתונים כדי לייצר מודלים טובים, היות שהיא מסתמכת על מבנה נתונים מקומי בעת ביצוע ההתאמה המקומית. לפיכך LOESS מספקת ניתוח נתונים פחות מורכב בתמורה לעלויות נסיוניות גבוהות יותר. חיסרון נוסף של LOESS הוא עצם העובדה שאינה מספקת פונקציית רגרסיה שמיוצגת בקלות על ידי מודל מתמטי, דבר המקשה על ייצוג והעברה של תוצאות הניתוחים לאנשים אחרים. כדי להעביר את פונקציית הרגרסיה לאדם אחר, יידרש להעביר לו גם את ערכת הנתונים והתוכנה לחישוב LOESS. ברגרסיה לא ליניארית, מצד שני, יש צורך לרשום את הצורה הפונקציונלית בלבד כדי לספק אמדנים של הפרמטרים הלא ידועים והאי ודאות הנאמדת.

מעבר לכך, LOESS היא שיטה עתירת חישובים והיא נוטה להשפעות של חריגים על הנתונים הנמדדים, כמו בשיטות ריבועים פחותים אחרות. קיימת גם גרסה רובוסטית (חזקה) איטרטיבית ל- LOESS ‏(Cleveland 1979) אשר מיועדת לשימוש והפחתת רגישות לחריגים, אך יחד עם זאת, עדיין הרבה מאוד חריגים קיצוניים מסוגלים לבוא לידי ביטוי, על אף השיטה הרובסטית.

ראו גם

קישורים חיצוניים

הערות שוליים

  1. ^ John Fox, Nonparametric Regression: Appendix to An R and S-PLUS Companion to Applied Regression, January 2002
  2. ^ William S. Cleveland, Robust Locally Weighted Regression and Smoothing Scatterplots, Journal of the American Statistical Association 74, 368, 1979, עמ' 829-836 doi: 10.1080/01621459.1979.10481038
  3. ^ Cleveland, W. S. & Devlin, S. J. (1988). "Locally weighted regression: An approach to regression analysis by local fitting". Journal of the American Statistical Association. 83: 596–610. doi:10.1080/01621459.1988.10478639.{{cite journal}}: תחזוקה - ציטוט: multiple names: authors list (link)

Read other articles:

Cari artikel bahasa  Cari berdasarkan kode ISO 639 (Uji coba)  Kolom pencarian ini hanya didukung oleh beberapa antarmuka Halaman bahasa acak Bahasa Irlandia Gaeilge PengucapanɡeːlʲɟəDituturkan diRepublik Irlandia, Irlandia UtaraWilayahIrlandia, terutama di GaeltachtPenutur140 000 jiwa di Irlandia (2012)[1] Rincian data penutur Jumlah penutur beserta (jika ada) metode pengambilan, jenis, tanggal, dan tempat.[2][3] 276.310 (2012, Bahasa ibu)1.03...

 

American politician and mayor of Jersey City since 2013 Steve Fulop49th Mayor of Jersey CityIncumbentAssumed office July 1, 2013Preceded byJerramiah HealyMember of Jersey City Councilfrom Ward EIn officeJuly 1, 2005 – June 30, 2013Preceded byJunior MaldonadoSucceeded byCandice Osborne Personal detailsBornSteven Michael Fulop (1977-02-28) February 28, 1977 (age 47)Edison, New Jersey, U.S.Political partyDemocraticSpouse Jaclyn Thompson ​(m. 2016)​...

 

Начало декартовой системы координат на плоскости Начало координат (начало отсчёта) в евклидовом пространстве — особая точка, обычно обозначаемая буквой О, которая используется как точка отсчёта для всех остальных точек. В евклидовой геометрии начало координат может...

Stefan Dragutin Stefan Dragutin en 1296 Titre Roi de Serbie octobre 1276 – 1282 Prédécesseur Stefan Uroš Ier Successeur Stefan Milutin Roi de Syrmie 1282 – 1316(34 ans) Successeur Stefan Vladislav II Biographie Dynastie Nemanjić Date de décès 1316 Père Stefan Uroš Ier Mère Hélène d'Anjou Enfants Stefan Vladislav II modifier  Stefan Dragutin Nemanjić, en serbe serbe cyrillique Стефан Драгутин Немањић, on trouve aussi en franç...

 

Russian politician In this name that follows Eastern Slavic naming customs, the patronymic is Zhamalovich and the family name is Bifov. You can help expand this article with text translated from the corresponding article in Russian. (February 2024) Click [show] for important translation instructions. Machine translation, like DeepL or Google Translate, is a useful starting point for translations, but translators must revise errors as necessary and confirm that the translation is accu...

 

2 cani stupidiserie TV d'animazione I 2 cani stupidi Titolo orig.2 Stupid Dogs Lingua orig.inglese PaeseStati Uniti AutoreDonovan Cook StudioHanna-Barbera ReteTBS 1ª TV5 settembre 1993 – 13 febbraio 1995 Episodi26 (completa) Durata ep.30 min Rete it.Rai 1 1ª TV it.12 luglio 1999 Genereumoristico 2 cani stupidi (2 Stupid Dogs), nota anche come Due stupidi cani,[1] è una serie animata statunitense ideata da Donovan Cook e ...

Batocera celebiana Klasifikasi ilmiah Kerajaan: Animalia Filum: Arthropoda Kelas: Insecta Ordo: Coleoptera Famili: Cerambycidae Subfamili: Lamiinae Tribus: Batocerini Genus: Batocera Spesies: Batocera celebiana Batocera celebiana adalah spesies kumbang tanduk panjang yang tergolong famili Cerambycidae. Spesies ini juga merupakan bagian dari genus Batocera, ordo Coleoptera, kelas Insecta, filum Arthropoda, dan kingdom Animalia. Larva kumbang ini biasanya mengebor ke dalam kayu dan dapat menye...

 

This article does not cite any sources. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Veľký Krtíš District – news · newspapers · books · scholar · JSTOR (December 2009) (Learn how and when to remove this template message) District in Banská Bystrica Region, SlovakiaVeľký Krtíš DistrictDistrictCountrySlovakiaRegion (kraj)Banská Bystrica RegionCultural re...

 

2024 New York Republican presidential primary ← 2016 April 2, 2024 2028 → ← CTRI →91 Republican National Convention delegates   Candidate Donald Trump Nikki Haley (withdrawn) Home state Florida South Carolina Delegate count 91 0 Popular vote 131,710 20,733 Percentage 82.1% 12.9% County results Congressional district results Trump   60 – 70%   70 – 80%   80 – 90%   >90% Elect...

François Jacob Premio Nobel per la medicina 1965 François Jacob (Nancy, 17 giugno 1920 – Parigi, 20 aprile 2013[1]) è stato un biologo francese, vincitore, insieme ad André Lwoff e Jacques Monod, del premio Nobel per la medicina nel 1965, per «le scoperte riguardanti il controllo genetico della sintesi di virus ed enzimi»[2]. Con Jacques Monod formulò l'ipotesi in base alla quale il controllo dei livelli enzimatici nelle cellule avviene tramite il feedback sulla t...

 

Matej JurčoMatej Jurčo lors du prologue du Tour de Romandie 2007.InformationsNaissance 8 août 1984 (39 ans)PopradNationalité slovaqueÉquipes professionnelles 09.2003-12.2003De Nardi (stagiaire)2004De Nardi2005Domina Vacanze2006-2008Milram2010-2011Dukla Trenčín Merida2012Whirlpool-Author2013-2014Dukla Trenčín Trek2015Kemo Dukla TrenčínPrincipales victoires Championnats Champion du monde du contre-la-montre militaire (2003) Champion de Slovaquie du contre-la-montre (2004, 2005, ...

 

Sebuah karabiner yang mengait sebuah tali keamanan. Karabiner adalah salah satu jenis cincin pengait khusus dengan pengait metal yang dilengkapi pegas. Karabiner didesain khusus untuk mengaitkan komponen-komponen dengan cepat dan praktis. Istilah Karabiner adalah kependekan dari Karabinhaken (kait pegas).[1] Kait pegas yang dimaksud adalah kait pegas yang penembak senapan gunakan untuk mengaitkan sesuatu. Jenis-Jenis Karabiner memiliki beberapa jenis bentuk yang umum sering dipakai,&#...

Галицьке князівство ↓ 1084 – 1199 Герб Галицьке князівство: історичні кордони на картіГалицька Земля за князювання Володимирка і Ярослава Осмомисла Столиця Галич Мови Руська Релігії Християнство, Язичництво Форма правління обмежена монархія князі  - 1144 — 1152 Волод...

 

Domestic athletics championship event International athletics championship event2023 New Zealand Track & Field ChampionshipsDates2–5 MarchHost cityWellingtonVenueNewtown Park← 2022 2024 → The 2023 New Zealand Athletics Championships was the national championship in outdoor track and field for New Zealand. It was held from 2–5 March at Newtown Park in Wellington. The 10,000 metres was held separately on 19 November 2022 and The Combined Events Championship (incorporating th...

 

British Conservative Party politician a fine old ToryKnightley as caricatured by Spy (Leslie Ward) in Vanity Fair, November 1881 Arms of Knightley: Quarterly ermine and paly of six or and gules Rainald Knightley, 1st Baron Knightley (22 October 1819 – 19 December 1895), known as Sir Rainald Knightley, 3rd Baronet, from 1864 to 1892, was a British Conservative Party politician. Origins Knightley was the son of Sir Charles Knightley, 2nd Baronet of Fawsley, and his wife Selina Mary, daughter ...

Real estate investment trust This article has multiple issues. Please help improve it or discuss these issues on the talk page. (Learn how and when to remove these template messages) A major contributor to this article appears to have a close connection with its subject. It may require cleanup to comply with Wikipedia's content policies, particularly neutral point of view. Please discuss further on the talk page. (November 2019) (Learn how and when to remove this message) This article needs a...

 

1918 book by Lyubomir Miletich Ethnic map of Adrianople Thrace in 1912 according to the academic Lyubomir Miletich. The areas with a Bulgarian majority are coloured green, Turkish red, and Greek brown. Balkan Wars boundaries. The Destruction of the Thracian Bulgarians in 1913 (Bulgarian: Разорението на тракийските българи през 1913 г., Razorenieto na trakiyskite balgari prez 1913 g., also translated as The Devastation[1] or The Ruin of the Thracian ...

 

U.S. House district for Nebraska Nebraska's 1st congressional districtNebraska's 1st congressional district (from 2023)Representative  Mike FloodR–NorfolkDistribution65.21% urban34.79% ruralPopulation (2022)659,903Median householdincome$74,193[1]Ethnicity77.9% White10.9% Hispanic4.1% Two or more races3.3% Black2.9% Asian0.9% otherCook PVIR+9[2] Nebraska's 1st congressional district is a congressional district in the U.S. state of Nebraska that encompasses most of its ea...

Seventh season of the Pokémon animated television series Season of television series Pokémon: Advanced ChallengeSeason 7English front cover of the Pokémon: Advanced Challenge DVD collection boxNo. of episodes52ReleaseOriginal networkTV TokyoOriginal releaseSeptember 4, 2003 (2003-09-04) –September 2, 2004 (2004-09-02)Season chronology← PreviousAdvanced Next →Advanced Battle List of episodes Pokémon: Advanced Challenge is the seventh season of Pokémon and th...

 

يولاند مورو (بالفرنسية: Yolande Moreau)‏  معلومات شخصية الميلاد 27 فبراير 1953 (العمر 71 سنة)بروكسل الجنسية بلجيكا الحياة العملية المهنة مخرجة أفلام[1]،  وممثلة،  وكاتبة سيناريو[2][3][1]،  وفنانة كوميدية[4][5][6]،  وممثلة أفلام  اللغة الأم الفرنس...