HIX GURU 6801 2016-11-12

Hollosi Information eXchange /HIX/

HIX GURU 6801

Copyright (C) HIX

2016-11-12

Új cikk beküldése	(a cikk tartalma az író felelõssége)
Megrendelés	Lemondás

1.	Re: Text fajlok leghatekonyabb tomoritese mivel? (mind)	32 sor	(cikkei)
2.	uuencode (mind)	21 sor	(cikkei)
3.	Ha mar tomorites (mind)	17 sor	(cikkei)
4.	uuencode vs base64 (mind)	25 sor	(cikkei)

+ -	Re: Text fajlok leghatekonyabb tomoritese mivel? (mind)	VÁLASZ	Feladó: (cikkei)
Sziasztok! : hello.bz2 nálam 397 byte lett bzip2 maximális tömörítéssel és : szerintem bármely tömörítõ letömörítené hasonlóan picire Persze. De a hello<sortores>1000000 meg igy ASCII karakterekkel is csak 14 byte, tehat a "minimalis" eredmenyhez kepest 28-szoros meretet tud a bzip2. Es ez igazabol meg nem minimalis. Az egymilliot irhatnam 1e6 alakban, ami tovabbi 4 byte-ot sporol. Ha vesszuk, hogy csak kisbetu van benne, akkor eleg a 26 angol karakter + sortores. Ez lekodolhato 5 bittel es meg marad egy karakter a soremelesre es arra, hogy vege a szovegnek es az ismetlesek szama kovetkezik. Az egymillio binarisan lekodolhato 20 bittel, tehat a hello<sortores><ismetlodesi szam jon>1000000 az uj algoritmussal 7 karakter * 5 bit + 20 bit = 55 bit. Ezt vesd ossze most a 397 byte-tal. Es ebben a 7 byte-ban meg mindig van redundancia, mert az 5 bites karakterekbol a 32 lehetseges karakter helyett csak 6-ot hasznalunk, tehat eleg lenne 3 bit/karakter is (amiben meg mindig van redundancia), tehat 41 bit is eleg lenne, vagyis a bzip2 77-szeres meretet produkal. A problema itt persze az, hogy a tomoritesi algoritmus mar nem univerzalis, egy csomo informacio mar az algoritmusban van es nem a tomoritett eredmenyben. Erre irtam, hogy a celfajlra kihegyett algoritmus es parameter kombinacio az optimalis. Hogy ezt mennyire eri meg megkeresni, az teljesen mas lapra tartozik. Magyarul, nem csak a tomoritett fajlt kell eltarolni, hanem a (ki)tomorito programot is, es a ketto meretenek osszeget kellene minimalizalni informatikai szempontbol. Udv, marky
+ -	uuencode (mind)	VÁLASZ	Feladó: (cikkei)
Sziasztok! Az uuencode-nal nem volt feladat, hogy papirra kinyomtatva valaki utana meg be tudja gepelni. A problema abbol adodott, hogy az uucopy es az email eredetileg 7 bites karaktereket tudott, a 8. bitet vagy tovabbitottak, vagy nem (ekkor a tuloldalon ugye a 7->8 bit konverzional kinullaztak), tetszes szerint es a kuldonek nem szoltak, hogy mit csinalnak a 8. bittel. Lasd regi HIX-eket, amikor egyesek "marpedig a magyar nyelvben ekezet van, amit en hasznalok" alapon olvashatatlan karaktersorozatkent jelentek meg. Tehat itt csak egy 8->7 bites atkodolasra volt szukseg. Az EBCDIC az IBM nagygepek karakterkeszlete (en is csak szobeszedbol ismerem). A base64 a valtozatos karakterkeszletek/kodlapok/ adattovabbitasi rendszerek kozos nevezoje. Udv, marky
+ -	Ha mar tomorites (mind)	VÁLASZ	Feladó: (cikkei)
Sziasztok! Ha már ennyi szó esik a tömörítésrõl, hadd kérdezzek én is: Szóval minap unalmamban elolvastam egy hosszú egyetemi jegyzetet info kommunikáció témakörben, sok hablaty között (GDF-es jegyzetrõl van szó, jó pár éves, nem is csodálkoztam rajta :-O ), szóval azt olvastam benne, hogy a vonalas telefonon folytatott beszélgetést is átkódolják Vocoderrel, mint ahogy a mobiltelefon esetében történik, veszteséges tömörítéssel. Nem egyes alközpontokról volt szó, azt tudom, hogy vannak ilyenek, hanem úgy általánosságban, globálisan. És az jutott eszembe, hogy akkor pl. a modem, a fax mégis hogyan mûködik? Avagy ezek erre eleve felkészültek? Vagy azért nem hajlandó az 56K modem csak max 42-vel menni? Nem tudom, mert nagyon régen modemeztem, lehet, hogy már nem is mûködne a mai vonalakon? -- Török István ___
+ -	uuencode vs base64 (mind)	VÁLASZ	Feladó: (cikkei)
Mindkettõ 8 bites sorozatból csinál 6 bites sorozatot, azaz praktikusan 3 byte-ból 4-et (38 = 46). A 6 bit az 2^6 = 64 jel. A különbség annyi, hogy a uuencode és a base64 más 64 jelet választott: uuencode !"#$%&'()*+,-./0123456789:[\]^_ base64 ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/ A uuencode elõnye, hogy a használt jelek pont így vannak sorban az ASCII készletben, tehát emlékezni sem kell a sorrendre, csak a kezdõpontra. A base64 elõnye, hogy a betûkön és számokon kívül csak + és / van benne. Ez azért fontos, mert pl. az EBCDIC-ben többek között nincsenek ezek a karakterek: []\^ Tehát a uuencoded szöveget nem tudja átvinni. Üdv, Jozsi.

AGYKONTROLL ALLAT AUTO AZSIA BUDAPEST CODER DOSZ FELVIDEK FILM FILOZOFIA FORUM GURU HANG HIPHOP HIRDETES HIRMONDO HIXDVD HUDOM HUNGARY JATEK KEP KONYHA KONYV KORNYESZ KUKKER KULTURA LINUX MAGELLAN MAHAL MOBIL MOKA MOZAIK NARANCS NARANCS1 NY NYELV OTTHON OTTHONKA PARA RANDI REJTVENY SCM SPORT SZABAD SZALON TANC TIPP TUDOMANY UK UTAZAS UTLEVEL VITA WEBMESTER WINDOWS