Mínimas desviaciones absolutas

Las Mínimas desviaciones absolutas (LAD, por sus siglas en inglés), también conocidas como Mínimos Errores Absolutos (LAE), es una técnica de optimización técnica similar a los de mínimos cuadrados ordinarios que intenta encontrar una función que se aproxima mucho a un conjunto de datos. En el caso simple de un conjunto de datos (x, y) , la función de aproximación es una simple "línea de tendencia" en dos dimensiones de coordenadas cartesianas. El método minimiza la suma de errores absolutos (SAE) (la suma de los valores absolutos de los "residuos" verticales entre puntos generados por la función y los puntos correspondientes en los datos). La estimación de desviaciones mínimas absolutas también surge como la estimación de máxima verosimilitud si los errores tienen una distribución de Laplace.

Formulación del problema

Supongamos que el conjunto de datos consta de los puntos (xi, yi) con i = 1, 2, ..., n. Queremos encontrar una función f tal que

Para alcanzar este objetivo, se supone que la función f es de una forma particular que contiene algunos parámetros que deben determinarse. Por ejemplo, la forma más simple sería lineal: f(x) = bx + c, donde b y c son parámetros cuyos valores no se conocen, pero que nos gustaría estimar.

Supongamos que f (x) es una función cuadrática, lo que significa que f(x) = ax2 + bx + c, donde a, b y c no se conocen aún. (En general, podría ser no sólo una variable explicativa x, sino una pluralidad de variables, todos los que aparecen como argumentos de la función f.)

Ahora buscamos valores estimados de los parámetros desconocidos que minimizan la suma de los valores absolutos de los residuos:

Contrastando Mínimos Cuadrados con menos desviaciones absolutas

La siguiente es una tabla de contraste algunas propiedades del método de mínimas desviaciones absolutas con los del método de los mínimos cuadrados (para problemas no singulares).[1][2]

Regresión de mínimos cuadrados Regresión de mínimas desviaciones absolutas
No muy robusta Robusta
Solución estable Solución inestable
Una solución Múltiples soluciones posibles

El método de los desvíos menos absolutos encuentra aplicaciones en muchas áreas, debido a su solidez en comparación con el método de mínimos cuadrados. Por lo menos desviaciones absolutas es robusto en los que es resistente a los valores atípicos en los datos. Esto puede ser útil en los estudios donde los valores extremos pueden ser ignoradas de manera segura y efectiva. Si es importante prestar atención a todas y todos los valores atípicos, el método de los mínimos cuadrados es una mejor opción.

La propiedad inestabilidad del método de los desvíos menos absolutos significa que, por un pequeño ajuste horizontal de un dato , la línea de regresión puede saltar una gran cantidad. El método tiene soluciones continuas para algunas configuraciones de datos; Sin embargo, moviendo un punto de referencia una pequeña cantidad, se podría "saltar pasado" una configuración que tiene múltiples soluciones que abarcan una región. Después de pasar por esta región de soluciones, la línea de desviaciones menos absoluta tiene una pendiente que puede diferir mucho de la de la línea anterior. En contraste, las soluciones de mínimos cuadrados es estable en que, para cualquier pequeño ajuste de un punto de datos, la línea de regresión siempre se moverá sólo ligeramente; es decir, los parámetros de regresión son funciones continuas de los datos.

Por último, para un determinado conjunto de datos, el método de las desviaciones absolutas menos puede producir múltiples soluciones, mientras que el método de los mínimos cuadrados siempre produce sólo una solución (la línea de regresión es único).

Otras propiedades

Existen otras propiedades únicas de la línea de desviaciones menos absoluta. En el caso de un conjunto de (x, y) de datos, la línea de desviaciones menos absoluta siempre pasará a través de al menos dos de los puntos de datos, a menos que existan múltiples soluciones. Si existen varias soluciones, entonces la región de soluciones válidas desviaciones menos absolutos será delimitado por al menos dos líneas, cada una de las cuales pasa a través de al menos dos puntos de datos. Más en general, si hay k regresores (incluyendo la constante), a continuación, al menos una superficie de regresión óptimo se pasan a través de K de los puntos de datos.[3]: p.936 

Este "bloqueo" de la línea a los puntos de datos puede ayudar a entender la propiedad "inestabilidad": si la línea siempre se engancha a por lo menos dos puntos, la línea va a saltar entre los diferentes conjuntos de puntos como se alteran los puntos de datos. El "enganche" también ayuda a entender la propiedad "robustez": si existe un valor atípico y un mínimo absoluto línea desviaciones deben aferrarse a dos puntos de datos, el valor atípico muy probablemente no será uno de esos dos puntos, porque eso no va a minimizar la suma de las desviaciones absolutas en la mayoría de los casos.

Un caso conocido en el que existen múltiples soluciones es un conjunto de puntos simétrica respecto a una línea horizontal, como se muestra en la Figura A a continuación.

Para entender por qué hay varias soluciones en el caso que se muestra en la Figura A, considere la línea rosa en la región verde. Su suma de errores absolutos es algún valor S. Si uno fuera a inclinar la línea ligeramente hacia arriba, mientras se mantiene dentro de la región verde, la suma de errores seguiría siendo S. No cambiaría porque la distancia de cada punto a la línea crece en un lado de la línea, mientras que la distancia de cada punto en el lado opuesto de la línea disminuye por exactamente la misma cantidad. Así, la suma de errores absolutos sigue siendo el mismo. Además, dado que se puede inclinar la línea en incrementos infinitamente pequeños, esto también muestra que si hay más de una solución, hay un número infinito de soluciones.

Las variaciones, extensiones, especializaciones

El problema menor desviación absoluta puede ser extendido para incluir múltiples explanators, limitaciones y regularización , por ejemplo, un modelo lineal con restricciones lineales:[4]

minimizar
sujeto a, e.g.,

donde es un vector columna de coeficientes a ser estimados, b es un intercepto a ser estimado, xi es un vector columna de la i-ésima observaciones sobre los diversos explanators, y i es la i-ésima observación en la variable dependiente, y k es una constante conocida.

Regularización con LASSO también se puede combinar con LAD.[5]

Métodos de resolución

Aunque la idea de una regresión de mínimos desviaciones absoluta es tan sencillo como el de regresión de mínimos cuadrados, la línea de desviaciones menos absoluta no es tan fácil de calcular de manera eficiente. A diferencia de regresión de mínimos cuadrados, regresión desviaciones menos absoluta no tiene un método de solución analítica. Por lo tanto, se requiere un enfoque iterativo. La siguiente es una enumeración de algunas desviaciones menos absolutos métodos de solución.

Métodos basados en Simplex (tales como el algoritmo de Barrodale-Roberts[6]​) Debido a que el problema es un programa lineal, cualquiera de las muchas técnicas de programación lineal (incluyendo el método simplex, así como otros) se pueden aplicar. Mínimos cuadrados iterativamente re-ponderada[7]​ Método de descenso directo de Wesolowsky[8]​ Enfoque de máxima verosimilitud de Li-Arce[9]​ Revise todas las combinaciones de líneas de punto a punto para la suma mínima de errores

Métodos basados en Simplex son la forma "preferido" para resolver el problema de desviaciones menos absoluta. [8] Un método simplex es un método para resolver un problema de programación lineal. El algoritmo más popular es el Barrodale-Roberts modificado Simplex algoritmo. Los algoritmos para IRLS, Método de Wesolowsky, y método de Li se pueden encontrar en el Apéndice A de,,[10]​ entre otros métodos. Comprobación de todas las combinaciones de líneas que atraviesan cualquiera de los dos (x, y) puntos de datos es otro método para encontrar la línea de desviaciones menos absoluta. Puesto que se sabe que al menos una línea desviaciones menos absoluta atraviesa al menos dos puntos de datos, este método encontrará una línea mediante la comparación de la SAE de cada línea, y la elección de la línea con el más pequeño SAE. Además, si múltiples líneas tienen la misma, más pequeño SAE, a continuación, las líneas de delinear la región de múltiples soluciones. Aunque simple, este último método es ineficiente para grandes conjuntos de datos.

Referencias

  1. For a set of applets that demonstrate these differences, see the following site: http://www.math.wpi.edu/Course_Materials/SAS/lablets/7.3/73_choices.html
  2. For a discussion of LAD versus OLS, see these academic papers and reports: http://www.econ.uiuc.edu/~roger/research/rq/QRJEP.pdf and https://www.leeds.ac.uk/educol/documents/00003759.htm
  3. Branham, R. L., Jr., "Alternatives to least squares", Astronomical Journal 87, June 1982, 928–937. [1] at SAO/NASA Astrophysics Data System (ADS)
  4. Mingren Shi & Mark A. Lukas (marzo de 2002). «An L1 estimation algorithm with degeneracy and linear constraints». Computational Statistics & Data Analysis 39 (1): 35-55. doi:10.1016/S0167-9473(01)00049-4. 
  5. Li Wang, Michael D. Gordon & Ji Zhu (December 2006). «Regularized Least Absolute Deviations Regression and an Efficient Algorithm for Parameter Tuning». Proceedings of the Sixth International Conference on Data Mining. pp. 690-700. doi:10.1109/ICDM.2006.134. 
  6. I. Barrodale & F. D. K. Roberts (1973). «An improved algorithm for discrete L1 linear approximation». SIAM Journal on Numerical Analysis 10 (5): 839-848. Bibcode:1973SJNA...10..839B. JSTOR 2156318. doi:10.1137/0710069. 
  7. E. J. Schlossmacher (diciembre de 1973). «An Iterative Technique for Absolute Deviations Curve Fitting». Journal of the American Statistical Association (Journal of the American Statistical Association, Vol. 68, No. 344) 68 (344): 857-859. JSTOR 2284512. doi:10.2307/2284512. 
  8. G. O. Wesolowsky (1981). «A new descent algorithm for the least absolute value regression problem». Communications in Statistics – Simulation and Computation. B10 (5): 479-491. doi:10.1080/03610918108812224. 
  9. Yinbo Li and Gonzalo R. Arce (2004). «A Maximum Likelihood Approach to Least Absolute Deviation Regression». EURASIP Journal on Applied Signal Processing 2004 (12): 1762-1769. doi:10.1155/S1110865704401139.  (enlace roto disponible en Internet Archive; véase el historial, la primera versión y la última).
  10. William A. Pfeil, Statistical Teaching Aids, Bachelor of Science thesis, Worcester Polytechnic Institute, 2006

Read other articles:

Bruce WillisWillis saat penayangan perdana Live Free or Die Hard pada Juni 2007LahirWalter Bruce Willis19 Maret 1955 (umur 69)Idar-Oberstein, West GermanyKebangsaanAmerikaAlmamaterMontclair State UniversityPekerjaanAktorproduser filmpenyanyiTahun aktif1980–2022KaryaDaftar lengkapSuami/istriDemi Moore ​ ​(m. 1987; c. 2000)​Emma Heming ​ ​(m. 2009)​Anak5, termasuk Rumer Walter Bruce Willis (lahir 19 ...

 

NOAA weather satellite GOES-2Artist's impression of an SMS-series GOES satellite in orbitMission typeWeather satelliteOperatorNOAA / NASACOSPAR ID1977-048A SATCAT no.10061Mission duration24 years Spacecraft propertiesSpacecraft typeSMSManufacturerFord AerospaceLaunch mass295 kilograms (650 lb) Start of missionLaunch date16 June 1977, 10:51:00 (1977-06-16UTC10:51Z) UTCRocketDelta 2914Launch siteCape Canaveral LC-17BContractorMcDonnell Douglas End of missionDisposalDecommissioned...

 

Former association football club in Scotland Football clubBlythswoodFull nameBlythswood Football ClubFounded1873Dissolved1882GroundWestburn ParkSecretaryGeorge Armstrong Home colours Blythswood Football Club was a 19th-century football club based in Glasgow. History The club was founded on 14 August 1873 as an offshoot of the Blythswood Cricket Club,[1] which had changed its name from the Bellegrove club in 1866, and which played at Queen's Park until 1869. Announcement of the foundat...

SpongeBob SquarePantsMusim 13Sampul unduhan digitalDibintangioleh Tom Kenny Bill Fagerbakke Rodger Bumpass Clancy Brown Mr. Lawrence Jill Talley Carolyn Lawrence Mary Jo Catlett Lori Alan Negara asalAmerika SerikatJumlah episode26RilisSaluran asliNickelodeonTanggal tayang22 Oktober 2020 (2020-10-22) –01 November 2023 (2023-11-01)Kronologi Musim← SebelumnyaMusim 12Selanjutnya →Musim 14Daftar episode SpongeBob SquarePants Musim ketiga belas dari serial televisi Am...

 

2008 American drama film DoubtTheatrical release posterDirected byJohn Patrick ShanleyScreenplay byJohn Patrick ShanleyBased onDoubt: A Parableby John Patrick ShanleyProduced byScott RudinStarring Meryl Streep Philip Seymour Hoffman Amy Adams Viola Davis CinematographyRoger DeakinsEdited byDylan TichenorMusic byHoward ShoreProductioncompaniesMiramax FilmsScott Rudin ProductionsDistributed byMiramax FilmsRelease dates October 30, 2008 (2008-10-30) (AFI Fest) December 12...

 

جائزة إلمعلومات عامةأول جائزة 2008 تعديل - تعديل مصدري - تعديل ويكي بيانات جائزة إل (جائزة L، تعرف أيضا بجائزة الإضاءة الساطعة) هي مسابقة تديرها وزارة الطاقة الأمريكية تهدف إلى تحفيز مصنعي الإضاءة في عمليات تطوير منتجاتهم لضمان أعلى جودة وفاعلية.[1] المسابقة مصباح A19 أقيمت ...

Commune in Grand Est, FranceSouain-Perthes-lès-HurlusCommuneThe town hall in SouainLocation of Souain-Perthes-lès-Hurlus Souain-Perthes-lès-HurlusShow map of FranceSouain-Perthes-lès-HurlusShow map of Grand EstCoordinates: 49°11′04″N 4°32′39″E / 49.1844°N 4.5442°E / 49.1844; 4.5442CountryFranceRegionGrand EstDepartmentMarneArrondissementChâlons-en-ChampagneCantonArgonne Suippe et VesleIntercommunalityRégion de SuippesGovernment • Mayor (2...

 

American baseball player Baseball player Jerry ReussReuss in August 2009PitcherBorn: (1949-06-19) June 19, 1949 (age 74)St. Louis, Missouri, U.S.Batted: LeftThrew: LeftMLB debutSeptember 27, 1969, for the St. Louis CardinalsLast MLB appearanceOctober 3, 1990, for the Pittsburgh PiratesMLB statisticsWin–loss record220–191Earned run average3.64Strikeouts1,907 Teams St. Louis Cardinals (1969–1971) Houston Astros (1972–1973) Pittsburgh Pirates (1974–19...

 

National police force of Colombia This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: National Police of Colombia – news · newspapers · books · scholar · JSTOR (May 2016) (Learn how and when to remove this message) National Police of ColombiaPolicía Nacional de ColombiaEmblem of the National Police of ColombiaF...

此條目可能包含不适用或被曲解的引用资料,部分内容的准确性无法被证實。 (2023年1月5日)请协助校核其中的错误以改善这篇条目。详情请参见条目的讨论页。 各国相关 主題列表 索引 国内生产总值 石油储量 国防预算 武装部队(军事) 官方语言 人口統計 人口密度 生育率 出生率 死亡率 自杀率 谋杀率 失业率 储蓄率 识字率 出口额 进口额 煤产量 发电量 监禁率 死刑 国债 ...

 

Red Arrow DinerIndustryDinersFounded1922FounderDavid LamontagneHeadquartersManchester, New Hampshire, United StatesNumber of locations4Areas servedManchester, Londonderry, Nashua, and Concord, New HampshireKey peopleCarol Lawrence (owner, president), George Lawrence (co-owner, vice president), Amanda Wihby (co-owner, chief operations officer)Products Burgers sandwiches steak chicken salads breakfast food soft drinks desserts Websitewww.redarrowdiner.com The Red Arrow Diner is a 24-hour diner ...

 

General purpose programming language Not to be confused with PowerFX. Microsoft Power FxParadigmLow-code, general-purpose, imperative, strongly typed, declarative, functionalDesigned byVijay Mital, Robin Abraham, Shon Katzenberger, Darryl Rubin, Greg Lindhorst, Mike StallDeveloperMicrosoftFirst appeared2021; 3 years ago (2021)Typing disciplinestrongLicenseMIT LicenseWebsitedocs.microsoft.com/en-us/power-platform/power-fx/overviewInfluenced byExcel functions, Excel ...

تعد جائحة فيروس كورونا 2019–20 في سابا جزءًا من الانتشار العالمي المستمر حتى اللحظة لفيروس كوفيد-19، والذي أُكد بلوغه جزيرة سابا في المملكة الهولندية الكاريبية في 12 أبريل عام 2020.[1] يبلغ تعداد سكان الجزيرة 1905 نسمة. وحتى 12 مايو، كان قد أبلغ أن جميع الإصابات قد تعافت.[2] خل...

 

German robot manufacturer This article is about the industrial robot manufacturer. For the U.S. radio station, see KUKA (FM). For other uses, see Kuka. This article contains content that is written like an advertisement. Please help improve it by removing promotional content and inappropriate external links, and by adding encyclopedic content written from a neutral point of view. (July 2019) (Learn how and when to remove this message) KUKA AGCompany typeSubsidiaryIndustryAutomationFounded1898...

 

Lady Zhen甄夫人 / 甄氏Ilustrasi Dinasti Qing dari Lady ZhenKelahiran26 January 183[a]Wuji County, HebeiKematian4 Agustus 221(221-08-04) (umur 38)[b][c]Handan, HebeiNama anumertaPermaisuri Wenzhao (文昭皇后)AyahZhen YiIbuLady ZhangPasanganYuan XiCao PiAnakCao RuiPrincess Dongxiang Zhen Ji (183?-221) adalah istri pertama kaisar Wei, Cao Pi. Cao Pi menjadikan Zhen Ji sebagai istrinya karena kecantikannya. Dua Pernikahan Pernikahan Pertama Nyonya Zhen menikah...

نهائي كأس ملك إسبانيا 2018أحتضن ملعب واندا ميتروبوليتانو في مدريد النهائيالحدثكأس ملك إسبانيا 2017–18 إشبيلية برشلونة 0 5 التاريخ21 أبريل 2018  الملعبملعب واندا ميتروبوليتانو، مدريدرجل المباراةأندريس إنييستا (برشلونة)[1]الحكمخيسوس خيل مانزانو[2]الحضور67.500[3]الطقسص...

 

  关于与「陳金德 (羽毛球運動員)」標題相近或相同的条目页,請見「陈金德」。 陳金德基本資料羅馬拼音Hariamanto Kartono代表國家/地區 印度尼西亞出生 (1954-08-08) 1954年8月8日(69歲) 印度尼西亞中爪哇省直葛主項:雙打世界冠軍頭銜 世界盃:2(男雙) 汤姆斯杯:1 獎牌記錄 男子羽毛球 代表  印度尼西亞 世界錦標賽 1980 雅加達 男子單打 1985 卡加利 男子雙...

 

Italian militant fascist group active in the 1970s Logo from a 1974 flyer The Ordine Nero (Italian: Black Order) was an Italian terrorist fascist group founded in 1974 following the dissolution of the fascist Ordine Nuovo. Between 1974 and 1978, bombings by ON led to a number of woundings and deaths, having orchestrated several deadly bombings and murders including the 1974 Italicus Express Bombing and the 1974 Brescia Bombing.[1] History Ordine Nero simply adopted the ideologies of ...

جزء من سلسلة مقالات حولعلم النفس تاريخ فروع خطوط عريضة المواضيع الرئيسية اللاقياسي السلوكي علم الوراثة السلوكي الحيوي المعرفي/معرفية المقارن عبر الثقافة الثقافي التنموي التمايزي التطوري التجريبي الحسابي العصبي الشخصية الإيجابي النفسي الديناميكي القياس النفسي الكمي ال...

 

たちばな かれん橘 香恋 橘香恋とオカザえもん(2022年9月)プロフィール愛称 かれんちゃん生年月日 1996年11月8日現年齢 27歳出身地 日本・愛知県岡崎市[1]血液型 O型瞳の色 黒毛髪の色 黒公称サイズ(2024年時点)身長 / 体重 164 cm / 42 kgBMI 15.6スリーサイズ 72 - 60 - 80 cmカップサイズ B股下 / 身長比 80 cm / 48.8 %靴のサイズ 24.0 cm 単位系換算身長 / 体重5′ 5″ / 93 lbス�...