duomenų glaudinimas
duomen glaũdinimas (angl. data compression), spūdà, duomenų pertvarkymo procesas, kurio metu mažinamas skaitmeninės informacijos kiekis – sumažinama perteklinės arba pašalinama nereikalinga informacija. Glaudinimo tikslas yra saugoti ar perduoti duomenis taip, kad jie užimtų kuo mažiau vietos duomenų laikmenoje ar ryšio kanale. Duomenų glaudinimas yra svarbi informacijos teorijos ir informatikos mokslo dalis, padedanti efektyviau saugoti ir perduoti duomenis.
Duomenų glaudinimas gali būti skirstomas į glaudinimą be nuostolių (angl. lossless compression), kai duomenys glaudinami be jokio praradimo, t. y. po atkūrimo jie tampa identiški pradiniams (taikoma glaudinant tekstinius dokumentus, duomenų bazių ir kai kuriuos vaizdų bei garsų duomenis) ir glaudinimą su nuostoliais (angl. lossy compression), kai dalis duomenų prarandama, tačiau žmogaus suvokimui reikšminga informacija išlaikoma (taikoma glaudinant nuotraukas, garso ir vaizdo įrašus, kai nedidelis kokybės praradimas yra priimtinas). Pvz., iš garso signalo pašalinami dažniai, kurių žmogus negali girdėti; iš nuotraukų pašalinama dalis informacijos, kurios žmogaus akis negali pamatyti.
Duomenų glaudinimas yra naudojamas rinkmenoms saugoti (sumažinami rinkmenų dydžiai, kad jose tilptų daugiau duomenų), duomenų šifravimui ir slaptam komunikavimui, sumažinama duomenų perdavimo apkrova interneto sraute, optimizuojama vaizdų, garso ir vaizdo įrašų saugojimas ir transliacija. Duomenų glaudinimas yra naudojamas dėl to, kad duomenų apimtis dažnai yra didesnė nei jų teikiama informacija. Pvz., 1998 ir tūkstantis devyni šimtai devyniasdešimt aštuntieji metai teikia tiek pat informacijos, tačiau pirmasis užrašas žymiai trumpesnis. Dar viena duomenų glaudinimo iliustracija gali būti skaičių sekos užrašymo suglaudinimas, pvz., skaičių seką 00000000011111111 galima užrašyti kaip 9 × 0;8 × 1 (devyni nuliai, aštuoni vienetai) – pirmu atveju tie patys duomenys užrašomi 17 simbolių, o suglaudinus reikia tik 7 simbolių. Kuo daugiau pasikartojančių duomenų yra rinkmenoje, tuo naudingesnis yra glaudinimas (gaunamas didesnis suglaudinimo laipsnis).
Sukurta daug įvairių duomenų glaudinimo metodų, kurie padeda surasti perteklinius duomenis ir pakeisti juos lakoniškesniais. Vienoje duomenų glaudinimo programoje gali būti realizuotas tiek vienas, tiek keli metodai. Jie parenkami atsižvelgiant į duomenų pobūdį. Parenkant metodus ir juos realizuojančias programas reikia rasti optimalų glaudinimo laiko ir sutaupytos atminties santykį. Ne visi duomenys yra vienodai gerai suglaudinami. Labai gerai suglaudinamos .txt, .doc, .bmp tipo bylos. Glaudinimo programų darbo rezultatas – rinkmena ar jų rinkinys, vadinamas archyvu.
Archyvai paprastai turi plėtinį, atitinkantį programą, kuria jie buvo sukurti, – .zip, .rar, .arj, .ice ir kita. Dėl šios priežasties glaudinimo programos dažniausiai vadinamos archyvavimo programomis arba tiesiog archyvatoriais. Archyve saugoma ir papildoma informacija: bylų vardai, modifikavimo datos, kontrolinės sumos (pvz., bendras vienetų skaičius bylos duomenyse). Tai padeda patikrinti, ar bylos iš archyvo atkurtos teisingai. Jei archyve yra informacija apie katalogus, toks archyvas yra vadinamas archyvu su katalogų struktūra. Šis archyvas naudingas tada, kai archyvuojami viso katalogo ir jo pakatalogių failai. Archyvavimo programa gali sukurti iš kelių rinkmenų sudarytą archyvą, nurodžius didžiausią vienos rinkmenos dydį. Toks archyvas vadinamas daugiatomiu ir jį tikslinga kurti tada, kai jį reikia įrašyti į atminties įrenginį, o archyvas vienoje rinkmenoje į jį netelpa. Archyvavimo programos visada naudoja glaudinimo be nuostolių algoritmus, nes archyvavimo tikslas yra išsaugoti rinkmenas tokias, kokios jos buvo suarchyvuotos, ir paskui atkurti jas neprarandant duomenų.
duomenų glaudinimas
Kai kurie rinkmenų formatai net ir nenaudojant archyvavimo programų turi savyje realizuotus glaudinimo algoritmus, pvz., nuotraukų formatas JPEG – nuotraukai, išsaugomai šiuo formatu, yra pritaikomas glaudinimo algoritmas su nuostoliais, t. y. pašalinami tokie duomenys, kuriuos žmogaus akis pastebi mažiausiai. Taip stengiamasi sumažinti rinkmenos dydį kuo mažiau pakenkiant vizualinei nuotraukos kokybei. JPEG kūrimo programos leidžia reguliuoti suglaudinimo lygį balansuojant tarp failo dydžio ir jo kokybės (kuo geresnė kokybė, tuo didesnis failas). Dažnai tokių failų neverta archyvuoti, nes gaištamas laikas, o duomenų apimtis sumažėja nežymiai. Tokius failus verta archyvuoti tuo atveju, jei siekima ne sutaupyti vietos, o norima daug rinkmenų paversti viena rinkmena ir patogiai perduoti ją internetu – vietoj didelio failų skaičiaus galima gauti vieną archyvo failą, pvz., nuotraukos.zip.
Dauguma rinkmenų, kuriose taikytomi glaudinimo algoritmus, naudoja glaudinimą su nuostoliais, pvz. JPEG (nuotraukos ir paveikslėliai), MP3 (garso įrašai), MPEG (vaizdo įrašai) naudoja glaudinimą su nuostoliais. PNG (nuotraukos ir paveikslėliai), FLAC (garso įrašai) naudoja glaudinimą be nuostolių.
Rinkmenų, kurios naudoja glaudinimą su nuostoliais, rinkmenos dydžio ir kokybės santykio reguliavimo ribos yra platesnės nei tų rinkmenų, kurios naudoja glaudinimą be nuostolių. Naudojant glaudinimą be nuostolių dažniausiai yra taikomas maksimalus glaudinimas, leidžiantis išlaikyti nepakitusią duomenų kokybę.
2727