Добування даних

Добува́ння да́них (англ. data mining), також глиби́нний ана́ліз да́них[джерело?] — процес напівавтоматичного аналізу великих баз даних з метою пошуку корисних фактів[1]. Зазвичай поділяють на задачі класифікації, моделювання та прогнозування.[джерело?]

На сучасних підприємствах, в дослідницьких проєктах або в інтернеті утворюються великі обсяги даних. Глибинний аналіз даних здійснюється автоматично шляхом застосування методів математичної статистики, штучних нейронних мереж, теорії нечітких множин або генетичних алгоритмів. Метою аналізу є виявлення правил та закономірностей, наприклад, статистичних подій. Так, наприклад, можливо виявити зміни у поведінці клієнтів або груп клієнтів для покращення стратегії підприємства.

Задачі

Методи розв'язання

Нейронні мережі

Штучні нейронні мережі названі на основі схожості їхньої будови із нейронними зв'язками мозку людини. Дозволяють реалізовувати задачі кластеризації, класифікації, прогнозування. Після створення основ теорії нейронних мереж, вони зазнали значної критики і вважалося, що вони малопридатні для сфери штучного інтелекту. Проте відновленню інтересу до штучних нейронних мереж сприяв розвиток комп'ютерів та успіх в теоретичних та прикладних дослідженнях.[2]

Дерева рішень

Метод для розв'язання задачі класифікації. Результатом застосування цього методу до навчального матеріалу є ієрархічна структура правил типу «якщо … тоді … інакше …». Ця структура має вигляд дерева. Для визначення приналежності об'єкта до одного з класів слід надавати відповіді на запитання, що знаходяться у вершинах цього дерева. Розпочавши з кореня дерева, алгоритм завершується після досягнення тупикової вершини (листа), ця вершина і визначатиме клас, до якого належить об'єкт.[3]

Еволюційні алгоритми

Регресійний аналіз

Регресійний аналіз займається методами аналізу залежності однієї величини від іншої. На відміну від кореляційного аналізу, не з'ясовує, чи істотний зв'язок, а займається пошуком моделі цього зв'язку, вираженої у функції регресії.

Застосування

Програмне забезпечення

Детальніші відомості з цієї теми ви можете знайти в статті Програмне забезпечення глибокого навчання.

Деякі продукти в Категорія:Програмне забезпечення аналізу даних та Категорія:Програмне забезпечення для статистичного аналізу також включають можливості глибинного аналізу даних та машинного навчання.

Безкоштовне програмне забезпечення та програми для інтелектуального аналізу даних з відкритим кодом

Наступні програми доступні за безкоштовними ліцензіями/ліцензіями з відкритим кодом. Також доступний публічний доступ до вихідного коду програми.

  • Carrot2 : структура кластеризації тексту та результатів пошуку.
  • Chemicalize.org: інструмент пошуку хімічної структури та веб-пошукова система.
  • ELKI: університетський дослідницький проєкт із вдосконаленим кластерним аналізом і методами виявлення викидів, написаний мовою Java.
  • GATE: інструмент обробки природної мови та розробки мови.
  • KNIME: Констанц Інформаційний Майнер, зручний і комплексний інструмент аналітики даних.
  • Massive Online Analysis (MOA): інтелектуальний аналіз великих потоків даних у реальному часі з інструментом дрейфу концепції на мові програмування Java.
  • MEPX: крос-платформний інструмент для регресії та класифікації проблем на основі варіанту генетичного програмування.
  • mlpack: набір готових до використання алгоритмів машинного навчання, написаних мовою C++.
  • NLTK (Набір інструментів природної мови): набір бібліотек і програм для символічної та статистичної обробки природної мови (NLP) для мови Python.
  • OpenNN: відкрита бібліотека нейронних мереж.
  • Orange: набір програмного забезпечення для аналізу даних і машинного навчання на основі компонентів, написаний мовою Python.
  • PSPP: програмне забезпечення для аналізу даних і статистики в рамках проєкту GNU, схоже на SPSS.
  • R: Мова програмування та програмне середовище для статистичних обчислень, аналізу даних і графіки. Це частина проєкту GNU.
  • Scikit-learn: бібліотека машинного навчання з відкритим кодом для мови програмування Python.
  • Torch: бібліотека глибокого навчання з відкритим кодом для мови програмування Lua та фреймворку наукових обчислень із широкою підтримкою алгоритмів машинного навчання.
  • UIMA: UIMA (Unstructured Information Management Architecture) — це компонентна структура для аналізу неструктурованого вмісту, такого як текст, аудіо та відео, спочатку розроблена IBM.
  • Weka: набір програм для машинного навчання, написаних мовою програмування Java.


Власне програмне забезпечення та додатки для аналізу даних Наступні програми доступні за ліцензіями власності.

  • Angoss KnowledgeSTUDIO: інструмент аналізу даних.
  • LIONsolver: інтегрований програмний додаток для аналізу даних, бізнес-аналітики та моделювання, який реалізує підхід Learning and Intelligent OptimizationN (LION).
  • PolyAnalyst: програмне забезпечення для аналізу даних і тексту від Megaputer Intelligence.
  • Microsoft Analysis Services: програмне забезпечення інтелектуального аналізу даних, надане Microsoft.
  • NetOwl: набір багатомовних продуктів для аналітики тексту та об'єктів, які дозволяють аналізувати дані.
  • Oracle Data Mining: програмне забезпечення для аналізу даних від корпорації Oracle.
  • PSeven: платформа для автоматизації інженерного моделювання та аналізу, мультидисциплінарної оптимізації та аналізу даних, надана DATADVANCE.
  • Qlucore Omics Explorer: програмне забезпечення для аналізу даних.
  • RapidMiner: середовище для експериментів з машинним навчанням і аналізом даних.
  • SAS Enterprise Miner: програмне забезпечення для аналізу даних, надане SAS Institute.
  • SPSS Modeler: програмне забезпечення інтелектуального аналізу даних, надане IBM.
  • STATISTICA Data Miner: програмне забезпечення для аналізу даних, надане StatSoft.
  • Tanagra: програмне забезпечення для аналізу даних, орієнтоване на візуалізацію, також для навчання.
  • Vertica: програмне забезпечення для аналізу даних, надане Hewlett-Packard.
  • Google Cloud Platform: автоматизовані спеціальні моделі ML, якими керує Google.
  • Amazon SageMaker: керований сервіс, який надає Amazon для створення та виробництва користувацьких моделей ML.

Див. також

Література

  • Silberschatz, Abraham; Sudarshan, S. (2011). Database system concepts (вид. 6). New York: McGraw-Hill. ISBN 9780073523323. OCLC 436031093.

Джерела

  1. Silberschatz та Sudarshan, 2011, с. 25.
  2. Wang, Lipo; Fu, Xiuju (2005). Data mining with computational intelligence (PDF). Berlin: Heidelberg : Springer. с. 6. ISBN 3-540-24522-7. Архів оригіналу (PDF) за 8 листопада 2016. Процитовано 21 липня 2017.
  3. Encyclopedia of artificial intelligence / Juan Ramon Rabunal Dopico, Julian Dorado de la Calle, and Alejandro Pazos Sierra, editors

Посилання



Read other articles:

Artikel ini sebatang kara, artinya tidak ada artikel lain yang memiliki pranala balik ke halaman ini.Bantulah menambah pranala ke artikel ini dari artikel yang berhubungan atau coba peralatan pencari pranala.Tag ini diberikan pada Oktober 2022. Bir kocok adalah minuman non alkohol khas kota Bogor. Nama bir tersebut didapat dari cara pembuatan yang di kocok dan akhirnya mengeluarkan busa. Menggunakan bahan dasar jahe, minuman tersebut berguna untuk menghangatkan badan.[1] Sejarah Minum...

 

Frederick Hamilton-Temple-Blackwood, 1:e markis av Dufferin och Ava Född21 juni 1826[1][2][3]FlorensDöd12 februari 1902[1][2][3] (75 år)Clandeboye House, StorbritannienBegravdBangorMedborgare iFörenade kungariket Storbritannien och IrlandUtbildad vidChrist Church CollegeEton College SysselsättningPolitiker[4], diplomat, författare[5]BefattningLedamot av Brittiska överhusetLedamot av Irlands kronrådLedamot av KronrådetKansler för hertigdömet Lancaster (1868–1872)Kan...

 

Provinsi Caserta provinsi di Italia Tempat <mapframe>: Judul Italy/Caserta.map .map bukan merupakan halaman data peta yang sahcategoria:Articles mancats de coordenades Negara berdaulatItaliaRegion di ItaliaCampania NegaraItalia Ibu kotaCaserta Pembagian administratifAilano Alife, Campania Alvignano Arienzo Aversa Baia e Latina Bellona, Campania Caianello Caiazzo Calvi Risorta Camigliano Cancello ed Arnone Capodrise Capriati a Volturno Capua Carinaro Carinola Casagiove Casal di Principe ...

Artikel ini bukan mengenai Nasrun Syahrun. Nasrul SyahrunBiografiKelahiran14 Mei 1945 Limau Puruik Kematian15 Oktober 2020 (75 tahun)Kota Bandung Data pribadiKelompok etnikOrang Minangkabau PendidikanUniversitas Andalas . Sarjana Pertanian (1964–1970) KegiatanPekerjaanBirokrat dan politikus Ir. H. Nasrul Syahrun (14 Mei 1945 – 15 Oktober 2020) adalah birokrat dan politikus Indonesia yang pernah menjabat Bupati Padang Pariaman periode 1994–1998. Latar belakang dan pendi...

 

Voce principale: Associazione Sportiva Cittadella. AS CittadellaStagione 1989-1990 Sport calcio Squadra Cittadella Allenatore Paolo Bottacin Presidente Giancarlo Pavin Serie C214º nel girone B Miglior marcatoreCampionato: Sambo (9)Totale: Sambo (9) 1988-1989 1990-1991 Si invita a seguire il modello di voce Questa voce raccoglie le informazioni riguardanti l'Associazione Sportiva Cittadella nelle competizioni ufficiali della stagione 1989-1990. Indice 1 Rosa 2 Risultati 2.1 Serie C2...

 

American professional wrestler Buff BagwellBagwell in 2006Birth nameMarcus Alexander BagwellBorn (1970-01-10) January 10, 1970 (age 54)[1][2]Marietta, Georgia, U.S.[1][3]Spouse(s) Alexis Rianja ​ ​(m. 1988; div. 1994)​ Gabby Randallson ​ ​(m. 1996; div. 2000)​ Professional wrestling careerRing name(s)Buff Bagwell[1]Christian[4]Fabulous Fabian[...

Ini adalah nama Dayak (Ngaju), nama keluarganya adalah Riwut Tjilik Riwut Anggota Dewan Perwakilan RakyatMasa jabatan28 Oktober 1971 – 17 Agustus 1987Daerah pemilihanKalimantan TengahGubernur Kalimantan Tengah Ke-2Masa jabatan30 Juni 1958 – Februari 1967WakilReinout Sylvanus (1961–1967)PendahuluR.T.A. MilonoPenggantiReinout Sylvanus Informasi pribadiLahirAnakletus Tjilik Riwut(1918-02-02)2 Februari 1918Kasongan, Borneo, Hindia BelandaMeninggal17 Agustus 1987(1987-0...

 

Norwegian archipelago in the Arctic Ocean Spitzbergen redirects here. For the specific island, see Spitsbergen. For other uses, see Spitzbergen (disambiguation) and Svalbard (disambiguation). Unincorporated area in NorwaySvalbardUnincorporated areaSatellite photo of Svalbard made by Copernicus Sentinel-2 mission, August 2022Location of Svalbard (dark green)Sovereign state NorwaySvalbard Treaty9 February 1920Svalbard Act17 July 1925Administrative centreand largest townLongyearby...

 

Questa voce sull'argomento calciatori nigeriani è solo un abbozzo. Contribuisci a migliorarla secondo le convenzioni di Wikipedia. Segui i suggerimenti del progetto di riferimento. Ayila Yussuf Yussuf nel 2014. Nazionalità  Nigeria Altezza 182 cm Peso 73 kg Calcio Ruolo Centrocampista Termine carriera 2015 CarrieraGiovanili 2002-2003 Julius Berger EnyimbaSquadre di club1 2002-2003Union Bank43 (4)2003-2004 Dinamo Kiev1 (0)2003 Dinamo-2 Kiev10 (0)2004-2013 ...

British Army general (1843–1915) For the Royal Air Force officer of the same name who started his career in the British Army, see Charles Burnett (RAF officer). Sir Charles BurnettBorn30 October 1843St Kilda, Victoria, Australia[1]Died10 November 1915(1915-11-10) (aged 72)[2]Middlesex, EnglandAllegiance United KingdomService/branch British ArmyRankGeneralCommands heldEastern DistrictWestern CommandAwardsKnight Commander of the Order of the BathKnight Commander of the Ro...

 

2016年美國總統選舉 ← 2012 2016年11月8日 2020 → 538個選舉人團席位獲勝需270票民意調查投票率55.7%[1][2] ▲ 0.8 %   获提名人 唐納·川普 希拉莉·克林頓 政党 共和黨 民主党 家鄉州 紐約州 紐約州 竞选搭档 迈克·彭斯 蒂姆·凱恩 选举人票 304[3][4][註 1] 227[5] 胜出州/省 30 + 緬-2 20 + DC 民選得票 62,984,828[6] 65,853,514[6]...

 

КонфедерацияГерманский союзнем. Deutscher Bund Флаг (1848—1866) Герб (1848—1866) Германский союз в 1815 году:  Государства-члены  Территории государств-членов за пределами Союза ← ← ← ←  ↓ 8 июня 1815 — 23 августа 1866 Столица Франкфурт-на-Майне Крупнейшие города Вена, Б�...

Bankplassen (Alun-Alun Bank), Oslo. Di latar belakang, Kafe Engebret. Bankplassen (Alun-Alun Bank) adalah alun-alun di lingkungan Kvadraturen di Oslo yang dibatasi oleh gerbang Kongens, Myntgata dan Kirkegata. Sebelum tahun 1953 Agnes Thorsens plass merupakan bagian dari Bankplassen. Alun-alun mengambil namanya dari bangunan Norges Bank milik Christiania Department yang terletak di Jalan Bankplassen nomor 3 dan dibangun pada tahun 1830 sebagai kantor cabang dengan desain arsitek Kristen Heinr...

 

Economic region of Victoria, Australia This article is about the administrative region in Victoria, Australia. For the former region of Scotland, see Grampian. For the Australian wine region, see Grampians (wine). Grampians RegionVictoriaCraigs Hotel, Lydiard Street, Ballarat.Grampians RegionThe location of Grampians National Park, within the Grampians regionCoordinates37°16′S 142°26′E / 37.267°S 142.433°E / -37.267; 142.433Population236,739 (2016 census)&...

 

Este artículo o sección necesita referencias que aparezcan en una publicación acreditada. Busca fuentes: «Familia real» – noticias · libros · académico · imágenesEste aviso fue puesto el 2 de diciembre de 2012. La familia de Felipe V de Louis-Michel van Loo. Una familia real es la familia extendida de un monarca. Generalmente, la cabeza de una familia real es un rey o una reina reinante. El término «familia imperial» describe de manera más apropiada a la fa...

Location of Hendry County in Florida This is a list of the National Register of Historic Places listings in Hendry County, Florida. This is intended to be a complete list of the properties and districts on the National Register of Historic Places in Hendry County, Florida, United States. The locations of National Register properties and districts for which the latitude and longitude coordinates are included below, may be seen in a map.[1] There are 12 properties and districts listed ...

 

Halaman ini berisi artikel tentang Gempa bumi dan tsunami yang melanda Sulawesi. Untuk tsunami yang melanda Banten dipicu oleh Anak Krakatau, lihat Tsunami Selat Sunda 2018. Gempa bumi, tsunami dan likuefaksi tanah Sulawesi 2018Palu dari atas satelit setelah gempa bumi, tsunami dan likuefaksiGempa bumi dan tsunami Sulawesi 2018 (Sulawesi)Waktu UTC2018-09-28 10:02:43ISC612780996USGS-ANSSComCatTanggal setempat28 September 2018; 5 tahun lalu (2018-09-28)Waktu setempat18:02:44...

 

American environmentalist Phil RadfordRadford as Greenpeace's executive director (2012)BornPhilip David Radford (1976-01-02) January 2, 1976 (age 48)New Brunswick, New Jersey, U.S.EducationWashington University in St. Louis (BA)[1]Occupation(s)Environmental, clean energy and democracy leaderKnown forExecutive director, Greenpeace Co-Founder, Democracy Initiative[2]PartnerEileen Radford Philip David Radford (born January 2, 1976) is an American activist who served as ...

神流川合戰日期1582年(天正十年)六月地点武藏國兒玉郡上里结果 北條軍勝利参战方 北條軍 織田軍指挥官与领导者 北條氏直北條氏邦 瀧川一益兵力 56,000 25,000伤亡与损失 500(含金窪城戰死城兵) 4,000 日語寫法日語原文神流川の戦い假名おしばらくずれ平文式罗马字kannagawanotatakai 查论编後北條氏重大戰役 立河原 小澤原 -第一次國府台 河越 第二次國府台 三增峠 神流川 天...

 

Indonesian meatball dish BaksoBakso served with bihun (rice vermicelli) and fried wontonsCourseMainPlace of originIndonesia, derived from the Chinese meatballRegion or stateNationwideServing temperatureHotMain ingredientsGround beef, tapioca, noodle, rice vermicelli, beef broth, kailan, celery, salted vegetables, fried shallotsVariationsBakwan Malang, phở bò viên (Vietnamese noodle soup with meatballs), Chinese beef ballsFood energy(per serving)1 medium ball of bakso contains 21 mg choles...