DAMIS sistemos pristatymas 6-ojoje tarptautinėje konferencijoje „Duomenų analizės metodai programų sistemoms“

2014 m. gruodžio 4-6 dienomis Druskininkuose vyko 6-oji Tarptautinė konferencija „Duomenų analizės metodai programų sistemoms”. Konferencijoje dalyvavo ir VŠĮ „Informatikos mokslų centras“ darbuotojų komanda. Konferencijoje buvo pristatytas sukurtas našiųjų skaičiavimų aplinkoje veikiantis duomenų analizės įrankis DAMIS.
DAMIS – tai atvira mokslo infrastruktūra, skirta duomenų analizei atlikti įgyvendinta panaudojus programinė įranga kaip paslauga (Solution as a Service) modelį. Sprendimas apjungia:
  • Skaičiavimo atlikimą arba kompiuterių klasteryje arba superkompiuteryje.
  • Debesijos resursų panaudojimą duomenims saugoti.
  • Individualių, poreikius atitinkantį užduočių sekų sudarymą.
Įrankio paskirtis – sudaryti galimybę našiųjų skaičiavimų aplinkoje atlikti pagrindinius duomenų analizės tyrimus (grupavimą, klasifikavimą ir kt.). Sukurtas įrankis leidžia vizualios analizės priemonėmis tirti daugiamačių duomenų projekcijas į plokštumą, duomenų grupavimąsi, duomenų panašumus, atskirų daugiamačių duomenų požymių įtaką ir tarpusavio priklausomybes.

Registravęsis naudotojas gauna:

  • Intuityvią, patogia naudotojo grafinę sąsają.
  • Galimybę nemokamai algoritmus vykdyti našiųjų skaičiavimų aplinkoje.
  • Nemokamus debesijos išteklius pradiniams duomenims įkelti ar skaičiavimų rezultatams saugoti.
  • Kurti, saugoti ir pakartotinai vykdyti našiųjų skaičiavimų užduočių sekas.

DAMIS įrankyje šiuo metu yra prieinami šie duomenų analizės metodai:

  • Pagrindinių komponenčių analizės (PCA) algoritmas.
  • Daugiamačių skalių grupei (MDS) priklausantis klasikinis SMACOF algoritmas.
  • SMACOF algoritmo Zeidelio modifikacija.
  • Diagonalinis mažoravimo algoritmas (DMA).
  • Santykinės daugiamatės skalės.
  • Dirbtiniais neuroniniais tinklais ir daugiamatėmis skalėmis grindžiamas SAMANN algoritmas.
  • Saviorganizuojančiais neuroniniais tinklais (SOM) grindžiamas algoritmas.
  • MDS ir SOM junginys.
  • Daugiasluoksnis perceptronas grindžiamas klaidos sklidimo atgal taisykle.
  • RDF (Random Decision Forest) algoritmas.
  • K-vidurkių (K-means) grupavimo algoritmas.

Palaikomi failų formatai:

DAMIS įrankiui duomenys gali būti pateikiami šiais formatais: arff, tab, txt, csv, xml, xls, zip. Taip pat naudotojas turi galimybę redaguoti arba ištrinti jau įkeltus failus. Pasirinkus failų valdymo skiltį yra rodomas jau įkeltų duomenų failų sąrašas, kuriame pateiktas kiekvieno saugomo failo pavadinimas ir dydis. Failų sąrašą galima rūšiuoti pagal duomenų failų pavadinimus, įkėlimo datą. Įkeltus ir gautus rezultatų failus po darbų sekų įvykdymo naudotojas gali atsiųsti į savo kompiuterį arba patalpinti MIDAS archyve šiais formatais: arff, zip, tab, csv, xls, xlsx.

Pristatyti rezultatai yra Europos Sąjungos struktūrinių fondų remiamo projekto Nr. VP2-3.1-IVPK-13-V-01-001 “Nacionalinis atviros prieigos mokslo informacijos duomenų archyvas”, pagal „Informacinė visuomenė visiems“ prioriteto įgyvendinimo priemonę Nr. VP2-3.1-IVPK-13-V „Mokslo duomenų archyvas“, dalis.

Tarptautinės konferencijos akimirkos: