Ievads lielapjoma datu analīzē ar mākslīgā intelekta līdzekļiem
Ievads lielapjoma datu analīzē ar mākslīgā intelekta līdzekļiem
Izglītības programmas galvenais mērķis ir sniegt pamata zināšanas par lielapjoma datu problēmām, ietverot to avotus organizācijā un ārpus tās, problēmu identificēšanu, kas saistītas ar lielapjoma datu uzglabāšanu un apstrādi, plašāk pielietotās lielapjoma datu analīzes metodes un tām atbilstošiem programmatūras rīkiem. Tādēļ noslēdzot studiju priekšmetu, studenti spēs izskaidrot galvenos lielapjoma datu avotus, to galvenās kvalitātes, kas tos padara par lielapjoma datiem, t.sk. to fiziskais apjoms, izmaiņu ātrums, sarežģītība un vērtība, ko potenciāli spēj sniegt organizācijai to pareiza izmantošana. Ņemot vērā lielās atšķirības starp lielapjoma datu pārvaldībai raksturīgiem risinājumiem un tradicionālām datu bāzu vadības sistēmām, studiju priekšmeta materiāls sniegs izpratni par šīm atšķirībām, kā arī par plašāk pielietotajiem datu modeļiem un pārvaldības praksi, ietverot pamata zināšanas par datu integrēšanas un apstrādes paņēmieniem Hadoop un Spark platformu ietvaros. Lai atklātu datos esošās likumsakarības, kas ir viena no būtiskām lielapjoma datu analīzes problēmām, studiju priekšmets sniegs pamata zināšanas par datu analīzes un likumsakarību atklāšanas metodēm, kā arī to pielietojumu un analīzes rezultātu pasniegšanu.
Programmas stundu skaits - 160 stundas
Sasniedzamais digitālo kompetenču līmenis
MĀCĪBU PROGRAMMA
| Galvenās tēmas | Stundas |
| Kas ir lielapjoma dati? - to īpašības, kvalitātes un ar tiem saistītās problēmas. Lielo datu piemēri. Lielo datu apstrādes metodes. | 20 |
| Lielapjoma datu avoti un problēmas, kas saistītas ar to apstrādi un uzglabāšanu. Datu uzglabāšanas metodes. Lielapjoma datu atlase. | 20 |
| Lielapjoma datu apstrādes programmēšanas modeļi. Lielapjoma datu apstrāde izmantojot Python valodu. | 20 |
| Plaši pielietotas lielapjoma datu analīzes metodes un to pielietojums. Mākslīgā intelektā izmantošana lielapjoma datu apstrādē. | 50 |
| Lielapjoma datu apstrādei piemēroti programmatūras rīki. Rīku izvēles kritēriji. Rīku darbības un automatizācijas pamati. Rezultātu izgūšanas metodes. | 30 |
| Datu analīzes rezultātu attēlošana. Pārskata sagatavošana | 20 |
- lielie dati
- izplatītākie apstrādes risinājumi
- Atklāšana
- Datu sagatavošana
- Modeļa plānošana
- Modeļa izveide
- Rezultātu komunikācija
- Operacionalizēšana
- Kas ir regresija?
- Viena mainīgā (faktora) lineāras regresijas modeļi
- Vairāku mainīgo (faktoru) lineāras regresijas modeļi
- Gabaliem lineāras regresijas modeļi
- Kas ir klasterēšana
- Kādos gadījumos izmanto klasterēšanu?
- K-vidējo klasterēšana;
- Klasteru skaita noteikšana
- DB-SCAN;
- Hierarhiskā klasterēšana;
- Spriešana izmantojot klasterēšanu;
- Klasifikācijas uzdevuma formulējums;
- Hipotēzes jēdziens, vienas un vairāku hipotēžu modeļi;
- Induktīvās apmācības jēdziens;
- Lēmumu koki un apmācība lēmumu kokos;
- Klasifikācijas un regresijas koki;
- Nejauši meži;
- Mākslīgo neironu tīklu (MNT) paradigmas pamati
- Tīkla apmācības pamati
- Augstākas sarežģītības tīkli un apmācība tajos
- MNT pielietojumi praksē
- Kas ir teksta analīze?
- Teksta analīzes soļi;
- Galvenās izmantotās metodes;
- Piemēri.
SASNIEDZAMIE MĀCĪŠANĀS REZULTĀTI
Pēc programmas apgūšanas izglītojamais:
- Apgūs datu analīzes projekta dzīves ciklu un dažādu dalībnieku lomas tajā;
- Spēs identificēt un atšķirt dažādas datu analīzes problēmas, t.sk. “Lielo datu” problēmas;
- Apgūs vairāku mākslīgā intelekta tehniku pielietošanu datu analīzes kontekstā;
- Spēs identificēt konkrētas problēmas risināšanai piemērotas mākslīgā intelekta tehnikas – t.sk. klasterizācija, klasifikācija, regresijas, mašīnmācīšanās (ievads);
- Spēs pielietot konkrētu programmatūras izstrādes rīkus un vides datu analīzes modeļa izstrādei un pielietošanai;
- Spēs prezentēt datu analīzes rezultātus ieinteresētajām pusēm.
