Detecção de anomalias

Em mineração de dados, a detecção de anomalias (também detecção de outliers [1] ) é a identificação de itens, eventos ou observações raros que levantam suspeitas por serem significativamente diferentes da maioria dos dados.[1] Normalmente, os itens anômalos se referem a algum tipo de problema, como fraude bancária, defeito estrutural, problemas médicos ou erros em um texto. Anomalias são também referidas como outliers, ruído, desvios e exceções.[2]

Em particular, no contexto de detecção de intrusos em uma rede, os objetos de interesse geralmente não são os objetos raros, mas surtos inesperados de atividade. Esse padrão não atende à definição estatística comum de um outlier como um objeto raro, e muitos métodos de detecção de outliers (em particular métodos não supervisionados) falharão nesses dados, a menos que tenham sido tratados adequadamente. Em vez disso, um algoritmo de análise de cluster pode ser capaz de detectar os micro clusters formados por esses padrões.[3]

Existem três categorias amplas de técnicas de detecção de anomalias.[4] As técnicas de detecção de anomalia não supervisionada detectam anomalias em um conjunto de dados de teste não rotulados com a suposição de que a maioria das instâncias no conjunto de dados é normal, procurando instâncias que pareçam se encaixar menos no restante do conjunto de dados. As técnicas de detecção de anomalia supervisionada exigem um conjunto de dados rotulado como "normal" e "anormal" e envolve o treinamento de um classificador (a principal diferença em muitos outros problemas de classificação estatística é a natureza desbalanceada inerente da detecção de outliers). As técnicas de detecção de anomalia semi-supervisionadas constroem um modelo representando o comportamento normal de um determinado conjunto de dados de treinamento normal e, em seguida, testam a probabilidade de uma instância de teste ser gerada pelo modelo aprendido.

Aplicações

A detecção de anomalias é aplicável em vários domínios, como detecção de intrusão, detecção de fraude, detecção de falhas, monitoramento da integridade do sistema, detecção de eventos em redes de sensores e detecção de distúrbios do ecossistema. É também frequentemente usada no pré-processamento para remover dados anômalos do conjunto de dados. Na aprendizagem supervisionada, a remoção dos dados anômalos do conjunto de dados geralmente resulta em um aumento estatisticamente significativo na precisão.[5][6]

Técnicas populares

Diversas técnicas de detecção de anomalias têm sido propostas na literatura.[7] Algumas das técnicas populares são:

O desempenho dos diferentes métodos depende muito do conjunto de dados e parâmetros, e os métodos têm poucas vantagens sistemáticas sobre os outros quando comparados em muitos conjuntos de dados e parâmetros.[19][20]

Aplicação em segurança dos dados

A detecção de anomalias foi proposta para sistemas de detecção de intrusão (IDS) por Dorothy Denning em 1986.[21] A detecção de anomalias para o IDS é normalmente realizada com limiares e estatísticas, mas também pode ser feita com soluções aproximadas e aprendizado indutivo.[22] Os tipos de estatística propostos em 1999 incluíam perfis de usuários, estações de trabalho, redes, hosts remotos, grupos de usuários e programas baseados em frequências, médias, variâncias, covariâncias e desvios padrão.[23] A contrapartida da detecção de anomalias na detecção de intrusão é a detecção de uso indevido .

Programas

  • O ELKI é um kit de ferramentas de mineração de dados Java de código aberto que contém vários algoritmos de detecção de anomalias, bem como aceleração de índice para eles.

Conjuntos de dados

Referências

  1. a b Zimek, Arthur; Schubert, Erich (2017), «Outlier Detection», ISBN 9781489979933, Springer New York, Encyclopedia of Database Systems: 1–5, doi:10.1007/978-1-4899-7993-3_80719-1 
  2. «A Survey of Outlier Detection Methodologies» (PDF). Artificial Intelligence Review. 22. CiteSeerX 10.1.1.318.4023Acessível livremente. doi:10.1007/s10462-004-4304-y 
  3. «Data mining for network intrusion detection» (PDF). Proceedings NSF Workshop on Next Generation Data Mining 
  4. «Anomaly detection: A survey». ACM Computing Surveys. 41. doi:10.1145/1541880.1541882 
  5. «An Experiment with the Edited Nearest-Neighbor Rule». IEEE Transactions on Systems, Man, and Cybernetics. 6. doi:10.1109/TSMC.1976.4309523 
  6. Smith, M. R.; Martinez, T. «Improving classification accuracy by identifying and removing instances that should be misclassified». The 2011 International Joint Conference on Neural Networks. [S.l.: s.n.] ISBN 978-1-4244-9635-8. doi:10.1109/IJCNN.2011.6033571 
  7. «There and back again: Outlier detection between statistical reasoning and data mining algorithms». Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery. 8. ISSN 1942-4787. doi:10.1002/widm.1280 
  8. «Distance-based outliers: Algorithms and applications». The VLDB Journal the International Journal on Very Large Data Bases. 8. CiteSeerX 10.1.1.43.1842Acessível livremente. doi:10.1007/s007780050006 
  9. Liu, Fei Tony; Ting, Kai Ming; Zhou, Zhi-Hua (dezembro de 2008). Isolation Forest. [S.l.: s.n.] ISBN 9780769535029. doi:10.1109/ICDM.2008.17 
  10. «Local outlier detection reconsidered: A generalized view on locality with applications to spatial, video, and network outlier detection». Data Mining and Knowledge Discovery. 28. doi:10.1007/s10618-012-0300-z 
  11. «Tensor-based anomaly detection: An interdisciplinary survey». Knowledge-Based Systems. 98. doi:10.1016/j.knosys.2016.01.027 
  12. «A survey on unsupervised outlier detection in high-dimensional numerical data». Statistical Analysis and Data Mining. 5. doi:10.1002/sam.11161 
  13. «Estimating the Support of a High-Dimensional Distribution». Neural Computation. 13. CiteSeerX 10.1.1.4.4106Acessível livremente. PMID 11440593. doi:10.1162/089976601750264965 
  14. a b c Hawkins, Simon; He, Hongxing; Williams, Graham; Baxter, Rohan. «Outlier Detection Using Replicator Neural Networks». Data Warehousing and Knowledge Discovery. Col: Lecture Notes in Computer Science. 2454. [S.l.: s.n.] ISBN 978-3-540-44123-6. doi:10.1007/3-540-46145-0_17 
  15. «Discovering cluster-based local outliers». Pattern Recognition Letters. 24. CiteSeerX 10.1.1.20.4242Acessível livremente. doi:10.1016/S0167-8655(03)00003-5 
  16. «Hierarchical Density Estimates for Data Clustering, Visualization, and Outlier Detection». ACM Transactions on Knowledge Discovery from Data. 10. doi:10.1145/2733381 
  17. Lazarevic, A.; Kumar, V. Feature bagging for outlier detection. [S.l.: s.n.] ISBN 978-1-59593-135-1. doi:10.1145/1081870.1081891 
  18. «Ensembles for unsupervised outlier detection». ACM SIGKDD Explorations Newsletter. 15. doi:10.1145/2594473.2594476 
  19. «On the evaluation of unsupervised outlier detection: measures, datasets, and an empirical study». Data Mining and Knowledge Discovery. 30. ISSN 1384-5810. doi:10.1007/s10618-015-0444-8 
  20. Repositório de dados de referência de detecção de anomalias da Ludwig-Maximilians-Universität München ; Espelho na Universidade de São Paulo .
  21. «An Intrusion-Detection Model» (PDF). IEEE Transactions on Software Engineering. SE-13. CiteSeerX 10.1.1.102.5127Acessível livremente. doi:10.1109/TSE.1987.232894 
  22. Teng, H. S.; Chen, K.; Lu, S. C. Adaptive real-time anomaly detection using inductively generated sequential patterns (PDF). [S.l.: s.n.] ISBN 978-0-8186-2060-7. doi:10.1109/RISP.1990.63857 
  23. «Computer System Intrusion Detection: A Survey». Technical Report, Department of Computer Science, University of Virginia, Charlottesville, VA. CiteSeerX 10.1.1.24.7802Acessível livremente 

Read other articles:

Cet article est une ébauche concernant la montagne. Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants. Djebel Nefoussa Djebel Nefoussa Localisation du djebel Nefoussa en Libye. Géographie Altitude 968 m[1] Longueur 190 km Administration Pays Libye Shabiyat Al Djabal al Gharbi, Nalout modifier  Le djebel Nefoussa, en arabe : الجبل نفوسة al-Jabal Nefusa, en berbère nafusi : Adrar...

 

American fast casual BBQ franchise Shane's Rib ShackCompany typePrivate (franchise)Founded2002; 22 years ago (2002)HeadquartersAtlanta, Georgia, U.S.Websitewww.shanesribshack.com Shane's Rib Shack is an American fast casual BBQ franchise, serving slow-cooked baby back ribs, hand-chopped chicken and pork, and Southern style side dishes.[1] As of January, 2024, they are located in eight states, with most of their restaurants located in the state of Georgia. Founders In...

 

كلية موظفي منظومة الأمم المتحدة كلية موظفي منظومة الأمم المتحدة‌ الاختصار (بالإنجليزية: UNSSC)‏  المقر الرئيسي تورينو،  إيطاليا تاريخ التأسيس 1 يناير 2002؛ منذ 22 سنة (2002-01-01) المنظمة الأم الجمعية العامة للأمم المتحدةالمجلس الاقتصادي والاجتماعي للأمم المتحدة ال...

American jazz musician (born 1938) Charles LloydBackground informationBorn (1938-03-15) March 15, 1938 (age 86)Memphis, Tennessee, U.S.GenresJazzOccupation(s)MusicianInstrument(s)Tenor saxophone, fluteYears active1959–presentLabelsAtlantic, Blue Note, Columbia, ECM, Pacific ArtsFormerly ofCelebrationWebsitewww.charleslloyd.comMusical artist Charles Lloyd (born March 15, 1938)[1] is an American jazz musician. Though he primarily plays tenor saxophone and flute, he has occasional...

 

UK digital radio station Heart 00sProgrammingFormat2000s musicNetworkHeartOwnershipOwnerGlobal Media & EntertainmentHistoryFirst air date20 May 2022; 23 months ago (2022-05-20)LinksWebcast[1]Websitewww.heart.co.uk/00s/ Heart 00s is a national digital radio station owned and operated by Global Media & Entertainment as a spin-off from the Heart radio network. The station broadcasts from studios at Leicester Square in London and was launched on 20 May 2022. Heart 00s ha...

 

内華達州 美國联邦州State of Nevada 州旗州徽綽號:產銀之州、起戰之州地图中高亮部分为内華達州坐标:35°N-42°N, 114°W-120°W国家 美國建州前內華達领地加入聯邦1864年10月31日(第36个加入联邦)首府卡森城最大城市拉斯维加斯政府 • 州长(英语:List of Governors of {{{Name}}}]]) • 副州长(英语:List of lieutenant governors of {{{Name}}}]])喬·隆巴爾多(R斯塔...

American coin grading organization Professional Coin Grading ServicePCGSIndustryRare coinsFoundedCalifornia, U.S. (1985)FoundersDavid Hall, Silvano DiGenova, Bruce Amspacher, Gordon Wrubel, Van Simmons, John Danreuther, Steve Cyrkin[1][2][3]Headquarters1610 E. St. Andrew Place, Suite 150, Santa Ana, California 92705Area servedWorldwideProductsCoin certification services and supplies, memberships and subscriptionsParentCollectors UniverseWebsitewww.pcgs.com Professional...

 

Historic district in Vermont, United States United States historic placeStone Village Historic DistrictU.S. National Register of Historic PlacesU.S. Historic district Show map of VermontShow map of the United StatesLocationBoth sides of VT 103 N of Williams River, Chester, VermontCoordinates43°16′24″N 72°35′35″W / 43.27333°N 72.59306°W / 43.27333; -72.59306Area100 acres (40 ha)Built1834 (1834)Built byClark, Alison & WileyArchitectural sty...

 

2020年夏季奥林匹克运动会波兰代表團波兰国旗IOC編碼POLNOC波蘭奧林匹克委員會網站olimpijski.pl(英文)(波兰文)2020年夏季奥林匹克运动会(東京)2021年7月23日至8月8日(受2019冠状病毒病疫情影响推迟,但仍保留原定名称)運動員206參賽項目24个大项旗手开幕式:帕维尔·科热尼奥夫斯基(游泳)和马娅·沃什乔夫斯卡(自行车)[1]闭幕式:卡罗利娜·纳亚(皮划艇)&#...

ヨハネス12世 第130代 ローマ教皇 教皇就任 955年12月16日教皇離任 964年5月14日先代 アガペトゥス2世次代 レオ8世個人情報出生 937年スポレート公国(中部イタリア)スポレート死去 964年5月14日 教皇領、ローマ原国籍 スポレート公国親 父アルベリーコ2世(スポレート公)、母アルダその他のヨハネステンプレートを表示 ヨハネス12世(Ioannes XII、937年 - 964年5月14日)は、ロ...

 

此条目序言章节没有充分总结全文内容要点。 (2019年3月21日)请考虑扩充序言,清晰概述条目所有重點。请在条目的讨论页讨论此问题。 哈萨克斯坦總統哈薩克總統旗現任Қасым-Жомарт Кемелұлы Тоқаев卡瑟姆若马尔特·托卡耶夫自2019年3月20日在任任期7年首任努尔苏丹·纳扎尔巴耶夫设立1990年4月24日(哈薩克蘇維埃社會主義共和國總統) 哈萨克斯坦 哈萨克斯坦政府...

 

Public middle school and high school in Nabbingo, Wakiso District, UgandaTrinity College NabbingoLocationNabbingo, Wakiso DistrictUgandaCoordinates0°17′28″N 32°28′40″E / 0.29111°N 32.47778°E / 0.29111; 32.47778InformationTypePublic Middle School and High SchoolMottoBe TrueEstablished1942; 82 years ago (1942)Faculty65GenderGirlsNumber of students1,010AthleticsSoccer, cricket, track, netball, volleyball, lawn tennis, table tennis, hockeyWebs...

بيلفيديري     الإحداثيات 37°52′22″N 122°27′52″W / 37.872777777778°N 122.46444444444°W / 37.872777777778; -122.46444444444   [1] تقسيم إداري  البلد الولايات المتحدة[2][3]  التقسيم الأعلى مقاطعة مارين  خصائص جغرافية  المساحة 6.23369 كيلومتر مربع6.233856 كيلومتر مربع (1 أبريل 2010) ...

 

اللغة اليونانية القديمة الاسم الذاتي Ἑλληνική لفظ الاسم Hellēnikḗ نقش بناء تمثال أثينا بارثينوس في بارثينون، 440/439 ق.م المنطقة شرق البحر المتوسط الكتابة ألفبائية يونانية النسب هندو أوروبية لغات هيلينيةيونانية قديمةاللغة اليونانية القديمة ترميز أيزو 639-2 grc أيزو 639-3 grc  تعد�...

 

Netziv Naftali Zvi Yehuda Berlin (20 November 1816 – 10 Agustus 1893), juga dikenal sebagai Reb Hirsch Leib Berlin, dan umum dikenal dengan akronim Netziv, adalah seorang rabbi Ortodoks, dekan Yeshiva Volozhin dan dan penulis sejumlah karya sastra rabbinik di Lithuania. Keluarga Berlin lahir di Mir, sekarang Belarus, pada 1816[1] dalam keluarga cendekiawan Yahudi yang dikenal karena keahliannya dalam bidang Talmudik. Ayahnya, Jacob, meskipun bukan rabbi, adalah cendeki...

Este artículo o sección necesita referencias que aparezcan en una publicación acreditada. Busca fuentes: «Batalla de Gazala» – noticias · libros · académico · imágenesEste aviso fue puesto el 10 de septiembre de 2016. Batalla de Gazala Parte de Campaña del Desierto Occidental de la Segunda Guerra Mundial Tanque alemán Pz. Kpfw. III a 40 km al oeste de Gazala, LibiaFecha 20 de mayo - 21 de junio de 1942Lugar Gazala, LibiaCoordenadas 31°57′N 23°27′E&...

 

State ruler of Travancore (1745–1799) For other people with similar names, see Keshavadasa. Raja KesavadasStatue of Raja Kesavadas in AlleppeyDiwan of Kingdom of TravancoreIn office1789–1798MonarchDharma RajaPreceded byKrishnan ThampiSucceeded byJayanthan Sankaran Nampoothiri Personal detailsBornKesava Raman Pillai(1745-03-17)17 March 1745Kunnathur, TravancoreDied21 April 1799(1799-04-21) (aged 54)Parent(s)Marthandan Thampi Kaliamma Pillai Kunnathur Kesavan Raman Pillai, also known a...

 

ذى الصاني (محلة) تقسيم إداري البلد  اليمن المحافظة محافظة إب المديرية مديرية ذي السفال العزلة عزلة السيف القرية قرية العارضة السكان التعداد السكاني 2004 السكان 37   • الذكور 14   • الإناث 23   • عدد الأسر 7   • عدد المساكن 4 معلومات أخرى التوقيت توقيت اليمن (+3 غرينيتش)...

Corte histológico de la tráquea del avestruz. Tinción hematoxilina-eosina. La eosina (del griego Eos, amanecer)[1]​ es un colorante llamado así por su color rosa, semejante al de la aurora. Es un polvo rojo insoluble en agua, benceno o cloroformo. Es soluble en alcohol, o soluciones alcalinas.[2]​ Tiene carácter ácido, por lo cual tiñe sustancias básicas, que a su vez son denominadas eosinófilas por su afinidad por la eosina; del mismo modo, se denomina eosinofilos a los ...

 

Questa voce sull'argomento centri abitati della Romania è solo un abbozzo. Contribuisci a migliorarla secondo le convenzioni di Wikipedia. Segui i suggerimenti del progetto di riferimento. BaznacomuneBazna – Veduta LocalizzazioneStato Romania Regione Transilvania Distretto Sibiu TerritorioCoordinate46°12′N 24°17′E46°12′N, 24°17′E (Bazna) Superficie82,52 km² Abitanti4 058 (2007) Densità49,18 ab./km² Altre informazioniCod. postale557030 Fuso orar...