Koncept data mining, koji dolazi iz engleskog jezika, u našem se jeziku često naziva data mining. Pojam je povezan s postupkom koji se provodi kako bi se otkrili uzorci u velikoj količini podataka.
Svrha iskopavanja podataka jest izvući određene podatke iz mase podataka kako bi se stvorila struktura koja se može razumjeti i koristiti. Za to se pribjegavaju sustavima baza podataka, statističkim tehnikama i drugim resursima.
Iskopavanje podataka analizira i obrađuje podatke u potrazi za nekim uzorkom ili modelom. Jednom kada se određena struktura otkrije, nastoji je učiniti vidljivom tako da je s njom moguće raditi.
Na taj način, kroz polu-automatski ili automatski analize na podacima, rudarenje podataka uspijeva otkriti obrasce koji do sada nisu bili poznati. Od tada nastaju dodatni zadaci ili aktivnosti koje, iako ne pripadaju specifičnom polju vađenja podataka, dio su njegovog svemira.
Može se reći da postupak vađenja podataka započinje odabirom mase podataka. Zatim nastavljamo s analizom njihovih svojstava kako bismo ih transformirali i izvukli informacije koje se mogu protumačiti i procijeniti.
Preciznije, možemo ustvrditi da se kopanje podataka sastoji od tri jasno definirane faze ili faze:
- Određivanje ciljeva. Drugim riječima, stvar je utvrđivanja ciljeva ovog procesa. Osoba koja ih naređuje odlučuje o njima, a zatim ih stavlja na znanje, stručnjaku koji se bave podacima.
-Predradba podataka. Sastoji se od onoga što je odabir, čišćenje, obogaćivanje, smanjenje, pa čak i promjena u onim što su baze podataka ključne u tom procesu.
- Izbor modela. Ovu fazu zauzvrat možemo utvrditi da je podijeljena na nekoliko dijelova. Stoga se prije svega provodi statistička analiza podataka. I onda, drugo, razvija se grafički prikaz tih.
-Analiza dobivenih rezultata pomoću kojih će se moći znati u kojem je trenutku postignut, kao i jesu li postignuti ciljevi koje je osoba koja je naručila postupak vađenja podataka postigla.
Iskopavanje podataka može se koristiti, na primjer, za otkrivanje potencijalnih terorista. Analizom milijuna telefonskih poziva, e-mailova i komunikacija različitih vrsta moguće je otkriti obrazac koji omogućava identifikaciju ljudi koji planiraju izvršiti napad.
Tvrtka može posegnuti za dubinsku analizu podataka za traženje određenih varijabli među podacima ima na svojim klijentima i na taj način ponuditi određeni proizvod samo onima koji ispunjavaju određene uvjete.
Upravo u tom smislu supermarketi i hipermarketi mogu pronaći sjajnog saveznika u iskopavanju podataka. Na primjer, ako zahvaljujući tome znaju navike svojih kupaca u pogledu vikenda, mogu im biti jasni proizvodi koji se u tom razdoblju najviše konzumiraju i na taj način učiniti ih privlačnijima ili ih čak staviti više na dohvat ruke., Na taj će način biti u mogućnosti zadovoljiti kupce i poboljšati prodaju.