lt.phhsnews.com


lt.phhsnews.com / Kokie yra simbolių kodavimai, pvz., ANSI ir Unicode, ir kaip jie skiriasi?

Kokie yra simbolių kodavimai, pvz., ANSI ir Unicode, ir kaip jie skiriasi?


ASCII, UTF-8, ISO-8859 ... Galbūt jūs matėte šiuos keistus vardus, kurie plaukioja aplink, bet ką daryti jie iš tikrųjų reiškia? Perskaitykite, kai paaiškiname, koks simbolių kodavimas yra ir kaip šie akronimai susiję su paprastu tekstu, kurį matome ekrane.

Fundamentiniai pastato blokai

Kai mes kalbame apie rašytinę kalbą, mes kalbame apie raides, kurie tada kuria sakinius, pastraipas ir pan. Laiškai yra simboliai, kurie vaizduoja garsus. Kai kalbate apie kalbą, tu kalbi apie garsų grupes, kurios susiburia tam tikru prasme. Kiekviena kalbos sistema turi sudėtingą taisyklių ir apibrėžimų rinkinį, kuris reglamentuoja šias reikšmes. Jei turite žodį, tai yra nenaudingas, jei nežinote, iš kokios kalbos jis yra, ir jūs naudojate jį su kitais, kurie kalba ta kalba.

(Grantos, Tulu ir Malajalių scenarijų palyginimas, Vikipedijos paveikslėlis)

Visame pasaulyje kompiuterių, mes vartojame terminą "simbolis". Simbolis yra tam tikros abstrakčios sąvokos, apibrėžtos konkrečiais parametrais, tačiau tai yra pagrindinis reikšmės vienetas. Lotynų "A" nėra tas pats kaip graikų "alfa" ar arabų "alifas", nes jie turi skirtingą kontekstą - jie yra skirtingų kalbų ir turi šiek tiek skirtingų kalbų - todėl galime sakyti, kad jie yra skirtingi simboliai. Vaizdinio simbolio vaizdavimas vadinamas "glifu", o skirtingi glikų rinkiniai vadinami šriftais. Grupės simbolių priklauso "set" arba "repertuare".

Kai įvedate pastraipą ir pakeičiate šriftą, jūs nesikeičiate raidžių fonetinių reikšmių, keičiate jų atvaizdus. Tai tik kosmetika (bet nesvarbu!). Kai kuriose kalbose, pavyzdžiui, senovės egiptiečių ir kinų, yra ideogramų; tai reiškia ne tik garsus, bet ir visas idėjas, o jų išraiškos gali skirtis priklausomai nuo laiko ir atstumo. Jei pakeisite vieną simbolį kitam, pakeisite idėją.

Charakteristikos kodavimas

(Vaizdas iš Wikipedia)

Kai įvedate kažką klaviatūroje arba įkeliate failą, kaip kompiuteris žino, ką rodyti? Štai kodėl simbolių kodavimas yra skirtas. Tekstas jūsų kompiuteryje nėra raidžių, tai yra suporuotų raidžių ir skaitmenų reikšmių serija. Simbolio kodavimas veikia kaip raktas, kurio vertės atitinka tas, kuris simbolis, panašiai kaip ortografija, diktuoja, kokie garsai atitinka tuos raides. Morzo kodas yra tam tikras simbolio kodavimas. Tai paaiškina, kaip ilgų ir trumpų vienetų grupės, pvz., Pyptelėjimai, yra simboliai. Morzo kodu simboliai yra tik anglų kalbos raidės, skaičiai ir visi sustojimai. Yra daug kompiuterio simbolių kodų, kurie verčiami į raidę, skaičių, akcento ženklus, skyrybos ženklus, tarptautinius simbolius ir tt

Dažnai šioje temoje vartojamas terminas "kodų lapai". Jie iš esmės yra simbolių kodai, kuriuos naudoja konkrečios įmonės, dažnai šiek tiek modifikuojamos. Pavyzdžiui, "Windows 1252" kodo puslapis (anksčiau vadinamas ANSI 1252) yra modifikuotas ISO-8859-1 formatas. Jie dažniausiai naudojami kaip vidinė sistema, skirta nurodyti standartines ir modifikuotas simbolių koduotes, kurios būdingos toms pačioms sistemoms. Anksčiau simbolių kodavimas nebuvo toks svarbus, nes kompiuteriai nesusiejo vienas su kitu. Kai internetas didėja, o tinklas yra įprastas įvykis, jis tampa vis svarbesnis mūsų kasdieniame gyvenime, be mūsų supratimo.

Daugelis skirtingų tipų

(Vaizdas iš sarah sosiak)

Yra daug skirtingų simbolių kodavimo, ir yra daug priežasčių. Kuris jūsų naudojamo simbolio kodavimas priklauso nuo jūsų poreikių. Jei bendraujate rusiškai, prasminga naudoti simbolių koduotę, kuri palaiko kirilica. Jei bendrausite korėjiečių kalba, tuomet jūs norėsite kažką, kas gerai atitinka "Hangul" ir "Hanja". Jei esate matematikas, tuomet jūs norite kažko, kuris gerai atspindi visus mokslo ir matematikos simbolius, taip pat graikų ir lotynų kalbų glikus. Jei esate išprotinkas, galbūt jūs naudosite iš apversto teksto. Jei norite, kad visi tokio tipo dokumentai būtų peržiūrėti kiekvienam konkrečiam asmeniui, jūs norite turėti gana paplitusią ir lengvai prieinamą kodavimą.

Pažiūrėkime į kai kuriuos dažniausiai pasitaikančius dalykus.

(ASCII lentelės ištrauka, asciitable.com vaizdas)

  • ASCII - Amerikos standartinis informacijos mainų kodas yra vienas iš senesnių simbolių kodavimo. Jis iš pradžių buvo sukurtas remiantis telegrafiniais kodais ir išsivystė laikui bėgant, įtraukiant daugiau simbolių ir kai kurių pasenusių nenaudotų kontrolinių simbolių. Tai tikriausiai yra tokia pat paprasta kaip ir šiuolaikinėse sistemose, nes tai tik lotyniškoji abėcėlė be akcentuotų simbolių. Jo 7 bitų kodavimas leidžia naudoti tik 128 simbolius, todėl visame pasaulyje yra keletas neoficialių variantų.
  • ISO-8859 - dažniausiai naudojama tarptautinės standartizacijos organizacijos simbolių kodų grupė yra 8859 Kiekvienas konkretus kodavimas žymimas numeriu, dažnai jį papildo aprašomuoju monikeriu, pvz ISO-8859-3 (lotynų-3), ISO-8859-6 (lotynų / arabų). Tai ASCII antstatas, o tai reiškia, kad pirmosios 128 kodavimo reikšmės yra tokios pačios kaip ir ASCII. Tačiau jis yra 8 bitų ir leidžia 256 simbolius, todėl jis išsiskleidžia iš ten ir apima daug daugiau simbolių, kiekvienas konkretus kodavimas sutelkiamas į skirtingus kriterijų rinkinius. "Latin-1" įtraukė daugybę akcentuotų raidžių ir simbolių, bet vėliau pakeista pakeista rinkiniu "Latin-9", kuriame pateikiami atnaujinti simboliai, pvz., "Euro" simbolis.

(Tibeto scenarijaus ištrauka, Unicode v4, iš unicode.org)

  • Unicode - Šis kodavimo standartas siekia universalumo. Šiuo metu jis apima 93 scenarijus, surengtus keliuose blokuose, ir daug daugiau darbuose. "Unicode" veikia kitaip nei kiti simbolių rinkiniai, kuriuose vietoj tiesiogiai koduojamas glikas, kiekviena vertė nukreipta toliau į "kodo tašką". Tai yra šešioliktainės reikšmės, atitinkančios simbolius, tačiau pačios glyphs pateikiamos atskirai nuo programos , pvz., savo naršyklę. Šie kodai dažniausiai vaizduojami taip: U + 0040 (tai reiškia "@"). Konkrečios koduotės pagal Unicode standartą yra UTF-8 ir UTF-16. UTF-8 bando leisti maksimalų suderinamumą su ASCII. Tai yra 8 bitų, bet leidžia visus simbolius per keitimo mechanizmą ir keletą reikšmių porų vienam simboliui. "UTF-16" lygiagretusis suderinamumas su ASCII, kad jis būtų visiškai suderinamas su 16 bitų standartu.
  • ISO-10646 - Tai nėra tikroji kodavimo sistema - tai tik Unicode simbolių rinkinys, kuris ISO standartizuotas. Tai dažniausiai svarbu, nes tai simbolių repertuaras, kurį naudoja HTML. Trūksta kai kurių iš tobulesnių "Unicode" funkcijų, leidžiančių palyginti, ir iš dešinės į kairę kartu su kairiuoju į dešinę. Vis dėlto, jis puikiai veikia naudodamasis internetu, nes leidžia naudoti daugybę scenarijų ir leidžia naršyklei interpretuoti glikus. Tai leidžia šiek tiek lengviau lokalizuoti.

Kokį kodavimą turėčiau naudoti?

Na, ASCII veikia daugeliui anglų kalbėtojų, bet ne daugeliui kitų. Dažniau matysite ISO-8859-1, kuris veikia daugelyje Vakarų Europos kalbų. Kitos ISO-8859 versijos veikia kirilicų, arabų, graikų ar kitų konkrečių scenarijų. Tačiau, jei norite rodyti kelis scenarijus toje pačioje dokumento ar toje pačioje interneto svetainėje, UTF-8 leidžia gerokai geriau suderinti. Tai taip pat puikiai tinka žmonėms, kurie naudoja tinkamas skyrybos ženklus, matematikos simbolius arba užrakto ženklus, pvz., Kvadratus ir žymėjimo langelius.

(keli dokumentai viename dokumente, "gujaratsamachar.com" ekrano kopija)

Yra Tačiau trūksta kiekvieno rinkinio. ASCII yra apribota jo skyrybos ženklais, todėl jis neįmanomas tinkamai dėl tipografiškai teisingų pataisymų. Kada nors tipo kopijuoti / įklijuoti iš "Word" tik į keistą glyfų kombinaciją? Toks yra ISO-8859 ar, tiksliau, teisingumo trūkumas, jo manoma, sąveika su OS konkrečiais kodo puslapiais (mes žiūrime į JŪS, "Microsoft"!). Didžiausias trūkumas UTF-8 yra tai, kad trūksta tinkamos paramos programų redagavimui ir publikavimui. Kita problema yra tai, kad naršyklės dažnai neinterpretuoja ir tiesiog parodo UTF-8 užkoduotojo simbolio baitų užsakymo ženklą. Dėl to rodomi nepageidaujami glyfai. Be abejo, deklaruojant vieną kodavimą ir naudojantis kitais simboliais, netinkamai juos deklaruojant / darant nuorodą į tinklalapį, naršyklėms sunku tinkamai juos pateikti ir paieškos sistemoms tinkamai juos indeksuoti.

Jūsų pačių dokumentams, rankraščiams ir pan. Galite naudotis viskuo, ko reikia, norint atlikti darbą. Kalbant apie žiniatinklį, atrodo, kad dauguma žmonių sutinka naudoti UTF-8 versiją, kurioje nenaudojamas baitų užsakymo ženklas, tačiau tai nėra visiškai vieninga. Kaip matote, kiekvieno simbolio kodavimas turi savo naudojimą, kontekstą, stipriąsias ir silpnąsias puses. Galima naudoti kaip galutinį vartotoją, tačiau jūs negalėsite tai spręsti, tačiau dabar galite imtis papildomo žingsnio į priekį, jei pasirinksite.


Kaip iš naujo įdiegti

Kaip iš naujo įdiegti "OS X" numatytas programas "El Capitan"

"OS X El Capitan" programoje yra daugybė iš anksto įdiegtų programų, iš kurių daugelis yra labai naudingos ... ir kai kurios iš jų nėra. Šių programų ištrynimas yra paprastas: tiesiog vilkite juos į šiukšliadėžę. SUSIJĘS: Kas yra "Apple" žaidimų centras, o jei jį naudojate? Sakykime, kad nusprendėte ištrinti "Game Center" programą.

(how-to)

Penkios tinkamos privataus naršymo režimo (be porno) naudojimo

Penkios tinkamos privataus naršymo režimo (be porno) naudojimo

ŽMonės šnibžda apie privatų naršymo režimą, bet tai ne tik pornografija. Tiesą sakant, tai net ne tik naršyti privačiai, bet ir kitiems tikslams. Tai vadinama inkognito režimu "Chrome", privatų naršymą "Firefox" ir "Safari", "InPrivate" naršyklę "Microsoft Edge" ir "Internet Explorer", bet tai iš esmės yra ta pati funkcija visose šiose naršyklėse.

(how-to)