DatoriProgrammēšana

ASCII (Amerikas standarta kods informācijas apmaiņai) - pamatteksta kodējums latīņu alfabēta

Saskaņā ar Starptautiskās telekomunikāciju savienības datiem, 2016. gadā ar šo vai citu regularitāti internetu izmantoja trīs ar pusi miljardu cilvēku. Lielākā daļa no viņiem pat neuzskata, ka jebkuri viņu nosūtītie ziņojumi, izmantojot datorus vai mobilos sīkrīkus, kā arī tekstus, kas tiek parādīti visu veidu monitoros, faktiski ir 0 un 1 kombinācijas. Šāda informācijas attēlošana tiek dēvēta par kodēšanu. Tas nodrošina un ievērojami atvieglo uzglabāšanas, apstrādes un pārraides īstenošanu. 1963. gadā tika izstrādāts ASV kodējums ASCII, kas ir šī raksta priekšmets.

Informācijas sniegšana datorā

No jebkura elektroniskā datora viedokļa teksts ir atsevišķu simbolu kolekcija. To skaitam pieder ne tikai vēstules, ieskaitot lielos burtus, bet arī pieturzīmes, ciparus. Papildus tiek izmantoti speciālie simboli "=", "&", "(" un atstarpes.

Simbolu kopu, kas veido tekstu, sauc par alfabētu, un to skaits ir spēks (apzīmēts kā N). Lai to noteiktu, izmantojiet izteiksmi N = 2 ^ b, kur b ir konkrēta simbola bitu skaits vai informācijas masa.

Ir pierādīts, ka alfabēts ar 256 rakstzīmju ietilpību ļauj attēlot visus nepieciešamos simbolus.

Tā kā 256 ir 8. spēks no diviem, katra simbola svars ir 8 biti.

8 bitu vienība tiek saukts par 1 bitu, tādēļ parasti ir teikt, ka jebkura rakstzīme binārajā kodā datorā saglabātajā tekstā aizņem vienu bitu atmiņu.

Kā kodēšana tiek veikta

Visi teksti tiek ievadīti personālā datora atmiņā, izmantojot tastatūras taustiņus, uz kuriem ir rakstīti skaitļi, burti, pieturzīmes un citi simboli. Atmiņā tie tiek pārsūtīti binārā kodā, ti, katrs raksturs ir saskaņots ar ierasto cilvēka decimālo kodu no 0 līdz 255, kas atbilst bināram kodam - no 00000000 līdz 11111111.

Baitta baitu rakstzīmju kodēšana ļauj procesoram veikt teksta apstrādi, lai piekļūtu katram rakstam atsevišķi. Tajā pašā laikā, lai attēlotu jebkuru rakstzīmju informāciju, pietiek ar 256 rakstzīmēm.

Rakstzīmju kodējums ASCII

Šis angļu valodas saīsinājums nozīmē Amerikas standarta kodu informācijas apmaiņai.

Pat datorizēšanas raundā kļuva skaidrs, ka jūs varat nākt klajā ar visdažādākajiem informācijas kodēšanas veidiem. Tomēr, lai pārsūtītu informāciju no viena datora uz citu, bija nepieciešams izstrādāt vienotu standartu. Tātad 1963. gadā Amerikas Savienotajās Valstīs parādījās ASCII kodējumu tabula. Tajā jebkuram datora alfabēta simbolam binārajā attēlojumā tiek piešķirts tā sērijas numurs. Sākotnēji ASCII kodējums tika izmantots tikai Amerikas Savienotajās Valstīs, un pēc tam kļuva par PC starptautisko standartu.

Tabulas saturs

ASCII kodi ir sadalīti divās daļās. Starptautiskais standarts ir tikai šī tabulas pirmā puse. Tas ietver simbolus ar kārtas skaitļiem no 0 (kodēts kā 00000000) līdz 127 (kods 01111111).

Secības numurs

N

ASCII teksta kodēšana

Simbols

0 - 31

0000 0000 - 0001 1111

Simboli ar N no 0 līdz 31 sauc par vadītājiem. Viņu funkcija ir "vadīt" teksta izvadīšanas procesu uz monitoru vai drukas ierīci, sniedzot audio signālu utt.

32 - 127

0010 0000 - 0111 1111

Rakstzīmes ar N no 32 līdz 127 (standarta daļa no tabulas) - latīņu alfabēta lielie un mazie burti, 10 cipari, pieturzīmes, kā arī dažādi kronšteini, komerciālie un citi simboli. Simbols 32 apzīmē atstarpi.

128 - 255

1000 0000 - 1111 1111

Simboli ar N no 128 līdz 255 (alternatīva tabulas vai koda lapai) var būt dažādi varianti, katram no kuriem ir savs numurs. Kodu lapa tiek izmantota, lai norādītu nacionālos alfabētos, kuri atšķiras no latīņu valodas. Jo īpaši ar tā palīdzību ASCII kodē krievu rakstzīmes.

Kodēšanas tabulā lielie un mazie burti tiek aizpildīti alfabētiskā secībā pēc otra, un skaitļi - augošā secībā. Šis princips ir saglabāts arī krievu valodas alfabētai.

Vadības rakstzīmes

ASCII kodēšanas tabula sākotnēji tika izveidota, lai saņemtu un pārsūtītu informāciju pa ierīci, kas nav izmantota ilgu laiku, piemēram, teletips. Saistībā ar to rakstzīmju kopa tika iekļauta nesadalīšanā, ko izmanto kā šīs ierīces vadības komandas. Līdzīgas komandas tika izmantotas tādās pirmskomerācijas ziņojumapmaiņas metodēs kā Morzes kods un tā tālāk.

Visbiežāk sastopamais simbols "teletype" ir NUL (00, "nulle"). To joprojām izmanto lielākajā daļā programmēšanas valodu, kas apzīmē līnijas beigas.

Ja izmanto ASCII kodējumu

Amerikas standarta kods ir nepieciešams ne tikai tastatūras teksta informācijas ievadīšanai. To izmanto arī grafikā. Jo īpaši ASCII Art Maker programmā dažādu paplašinājumu attēli pārstāv ASCII rakstzīmju simbolu diapazonu.

Līdzīgi produkti ir divu veidu: izpilda grafisko redaktoru funkciju, pārveidojot attēlus tekstā un pārveidojot "rasējumus" ASCII grafikā. Piemēram, labi pazīstams smaidiņš ir spilgts kodējuma simbola piemērs.

ASCII var izmantot arī, veidojot HTML dokumentu. Šajā gadījumā jūs varat ievadīt noteiktu rakstzīmju kopu, un, skatot lapu, ekrānā parādās simbols, kas atbilst šim kodam.

ASCII ir nepieciešams arī, lai izveidotu daudzvalodu vietnes, jo rakstzīmes, kas nav daļa no konkrētas nacionālās tabulas, tiek aizstātas ar ASCII kodiem.

Dažas funkcijas

Lai šifrētu teksta informāciju ASCII kodēšanā, sākotnēji tika izmantoti 7 biti (viens bija tukšs), taču šodien tas darbojas kā 8 bitu vienība.

Burti, kas atrodas augšdaļā un apakšā esošajās kolonnās, atšķiras tikai ar vienu bitu. Tas ievērojami samazina verifikācijas sarežģītību.

ASCII lietošana programmā Microsoft Office

Ja nepieciešams, šāda tekstuālās informācijas kodēšanas veidu var izmantot Microsoft teksta redaktoros, piemēram, Notepad un Office Word. Tomēr, ierakstot, šajā gadījumā nebūs iespējams izmantot dažas funkcijas. Piemēram, jūs nevarat veikt lobēšanu, jo ASCII kodējums saglabā tikai informācijas nozīmi, ignorējot tā vispārējo izskatu un formu.

Standartizācija

ISO ir pieņēmusi ISO 8859 standartus. Šī grupa definē astoņu bitu kodējumus dažādām valodu grupām. Jo īpaši ISO 8859-1 ir paplašināta ASCII, kas ir tabula Amerikas Savienotajām Valstīm un Rietumeiropai. Un ISO 8859-5 ir galds, kas tiek izmantots kirilicai, ieskaitot krievu valodu.

Vairākiem vēsturiskiem iemesliem ISO 8859-5 standarts netika izmantots ļoti ilgi.

Pašreizējā krievu valodā kodēšana patiešām tiek izmantota:

  • CP866 (Kods 866) vai DOS, ko bieži sauc par alternatīvu GOST kodēšanu. To aktīvi izmantoja līdz pagājušā gadsimta 90. gadu vidum. Šobrīd gandrīz neizmanto.
  • KOI-8. Kodējums tika izstrādāts 1970.-1980. Gados, un šobrīd tas ir standarts pasta ziņojumiem RuNet. To plaši izmanto OS Unix ģimenē, ieskaitot Linux. KOI-8 "krievu" versija tiek saukta par KOI-8R. Turklāt ir arī citas kirilicas valodas versijas, piemēram, ukraiņu.
  • Kods Page 1251 (CP 1251, Windows - 1251). To izstrādāja Microsoft Corporation, lai Windows vidē sniegtu krievu valodas atbalstu.

Pirmā standarta CP866 galvenā priekšrocība bija pseidogrāfisko rakstzīmju saglabāšana tādās pašās pozīcijās kā Extended ASCII. Tas ļāva palaist nemainītas teksta programmas, ārvalstu produkciju, piemēram, slaveno Norton Commander. Šobrīd CP866 tiek izmantots programmām, kas izstrādātas sistēmā Windows, kas darbojas pilnekrāna teksta režīmā vai teksta logos, ieskaitot FAR pārvaldnieku.

Datora teksti, kas rakstīti CP866 kodē, nesen ir diezgan reti, taču to lieto Krievijas failu nosaukumos Vindous.

"Unikoda"

Šobrīd šī kodēšana ir visplašāk izplatītā. Unicode kodi ir sadalīti reģionos. Pirmajā (no U + 0000 līdz U + 007F) ietilpst ASCII kodi ar kodiem. Tad seko dažādu nacionālo skriptu apzīmējumiem, kā arī pieturzīmēm un tehniskajiem simboliem. Turklāt daļa no Unicode kodiem ir rezervēta, ja nākotnē ir jāiekļauj jauni simboli.

Tagad jūs zināt, ka ASCII kodē katrs raksturs tiek attēlots kā 8 nulles un vienas kombinācijas. Ne-speciālistiem šī informācija var šķist nevajadzīga un neinteresanta, bet nevēlaties zināt, kas notiek jūsu datora "smadzenēs"?

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 lv.birmiss.com. Theme powered by WordPress.