Data Mining

Kaj je Data Mining:

Podatkovno rudarjenje je angleški izraz, povezan z računalništvom, katerega prevod je podatkovno rudarjenje . Sestavljen je iz funkcionalnosti, ki združuje in organizira podatke, v njih najde ustrezne vzorce, asociacije, spremembe in anomalije .

Izraz podatkovno rudarjenje se je prvič pojavil leta 1990 v skupnostih baz podatkov. Podatkovno rudarjenje je korak analize procesov, znan kot KDD ( odkrivanje znanja v podatkovnih bazah ), njegov dobeseden prevod pa je "odkrivanje znanja v podatkovnih bazah".

Podatkovno rudarjenje lahko razdelimo v nekaj osnovnih korakov: raziskovanje, gradnjo modelov, opredelitev vzorca in validacijo in preverjanje.

Podatkovno rudarjenje je sorazmerno nova praksa v svetu računalništva in uporablja iskanje informacij, umetno inteligenco, prepoznavanje vzorcev in statistične tehnike za iskanje korelacij med različnimi podatki, ki omogočajo pridobivanje koristnega znanja za podjetje ali posameznika. Podjetje lahko podatkovno rudarjenje predstavlja pomembno orodje, ki spodbuja inovativnost in donosnost.

Uporaba podatkovnega rudarjenja je precej pogosta v velikih bazah podatkov, končni rezultat njihove uporabe pa je mogoče prikazati s pravili, hipotezami, odločitvenimi drevesi, dendrogrami itd.

Dobro izkopano podatkovno rudarjenje bi moralo opraviti naloge, kot so: odkrivanje nepravilnosti, učenje asociacijskega pravila (modeliranje odvisnosti), združevanje v gruče, klasifikacija, regresija in sumiranje. Proces podatkovnega rudarjenja običajno poteka z uporabo podatkov iz podatkovnega skladišča .

Obstaja več podjetij in programska oprema, ki je namenjena rudarstvu podatkov, saj je prepoznavanje vzorcev v podatkovnih bazah vedno bolj pomembno. Vendar pa identifikacija ustreznih standardov ni edinstvena za računalniški svet. Človeški možgani uporabljajo podoben proces za prepoznavanje vzorcev in pridobivanje znanja.

V zadnjih letih se podatkovno rudarjenje pogosto uporablja na področjih znanosti in inženirstva, kot so bioinformatika, genetika, medicina, izobraževanje in elektrotehnika.

Koncept podatkovnega rudarjenja je pogosto povezan s pridobivanjem informacij o vedenju ljudi. Zato v nekaterih primerih rudarjenje podatkov sproža pravna vprašanja in vprašanja, povezana z zasebnostjo in etiko. Kljub temu mnogi ljudje trdijo, da je rudarjenje podatkov etično nevtralno, saj nima etičnih posledic.

Primeri realnega podatkovnega rudarjenja

Podatkovno rudarjenje pogosto uporabljajo podjetja in organizacije za pridobivanje znanja o uporabnikih / zaposlenih / kupcih. Na primer, v javnem sektorju je mogoče navzkrižno preveriti zakonski status zaposlenega in plačo, ki jo zasluži, da bi ugotovili, ali to vpliva na njegovo zakonsko življenje.

Podjetja, kot so verige supermarketov, lahko uporabijo te navzkrižne podatke za določitev izdelkov, ki se kupujejo skupaj. Če kupec, ki kupi izdelek X, kupi tudi izdelek Y, je morda dobro, da dva izdelka postavite v bližino, da bo stranka lažje kupila.