ASCII

FONT SIZE:
fontsize_dec
fontsize_inc
25-09-2017 Arvid Bendz A

ASCII, generelt udtalt eller er et tegn kode baseret på det latinske alfabet, som anvendes i moderne engelsk. Det blev skabt i 1963 af den amerikanske Standards Committee som en omarbejdning eller videreudvikling af kodesæt derefter bruges i telegrafi. Senere, i 1967, er med små bogstaver inkluderet, og nogle kontrol koder blev omdefineret til at danne den kode kendt som US-ASCII.

ASCII kode bruger 7 bit til at repræsentere de tegn, selv om det oprindeligt anvendte en ekstra bit, der anvendes til at detektere transmissionsfejl. Det er ofte fejlagtigt kaldes andet end 8 bit ASCII tegnkoder, som ISO-8859-1 standard, hvilket er en udvidelse, der bruger 8 bit til at give yderligere tegn, der anvendes i andre sprog end engelsk, såsom spansk.

ASCII blev offentliggjort som standard for første gang i 1967 og blev sidst opdateret i 1986. I øjeblikket definerede koder til 32 ikke kan udskrives tegn, hvoraf de fleste er kontrol tegn, der har en indvirkning på, hvordan tekst behandles, mere 95 andre printbare tegn, der følger dem i nummereringen.

Næsten alle moderne edb-systemer bruger ASCII eller en kompatibel udvidelse til at repræsentere tekst og styreenheder, der håndterer tekst og tastatur. Du må ikke forveksle ALT + antal tastatur koder til ASCII-koder.

Oversigt

Computere kun forstå tal. ASCII-koden er en numerisk repræsentation af en karakter, såsom 'a' eller 'andre formateringskoder repræsenterer tegn, ASCII er en metode til korrespondance mellem bitstrenge og en række symboler, således at kommunikationen mellem digitale enheder samt dens behandling og opbevaring. ASCII-tegn kode eller en kompatibel udvidelse bruges i næsten alle computere, især personlige computere og arbejdsstationer. Det mest passende navn for denne karakter kode er "US-ASCII".

ASCII er strengt taget en kodeks for syv bits, hvilket betyder at bruge kæder bit repræsenteres med syv binære cifre til at repræsentere information karakter. På det tidspunkt, hvor ASCII-koden blev indført mange computere, der arbejder med grupper af otte bits, som den mindste enhed af information; hvor den ottende bit er almindeligt anvendt som en paritet bit fejl kontrolfunktioner i kommunikationslinjer eller andre enhedsspecifikke funktioner. Maskiner, som ikke anvender paritetskontrol tildelt den ottende bit til nul i de fleste tilfælde, selv om andre systemer som computere Prime, der udføres PRIME sat den ottende bit kode ASCII til én. ASCII-koden definerer en sammenhæng mellem bestemte tegn og bit-sekvenser; udover at forbeholde et par kontrol koder for tekstbehandlingsprogram, og definerer ikke nogen mekanisme til at beskrive struktur eller udseende af teksten i et dokument; disse spørgsmål er specificeret af andre sprog som sprog etiketter.

Historie

ASCII-koden blev udviklet inden for telegrafi og først anvendt kommercielt som en fjernskriver kode fremmes af Bell datatjenester. Bell havde planlagt at bruge en seks-bit kode afledt fieldata, som tilføjede tegnsætning og små bogstaver ældste Baudot fjernskriver kode, men blev overtalt til at slutte sig til underudvalget for agenturet amerikanske standarder, som var begyndt at udvikle ASCII-kode. Baudot hjalp med at automatisere afsendelse og modtagelse af telegraf beskeder, og tog mange karakteristika fra morsekode; Men i modsætning til Morse-koden, Baudot anvendte kode konstant længde. Sammenlignet med de første telegraf-koder, den foreslåede Bell kode og ASA resulterede i en mere praktisk omorganisering for at bestille lister, og tilføjede funktioner som "escape-sekvens. American Standards Agency, som senere blev til American National Standards Institute, offentliggjort første gang i 1963. ASCII ASCII offentliggjort i 1963 havde en pil, der peger op i stedet for den cirkumfleks og en pil, der peger på den venstre i stedet for understregning. 1967-versionen tilføjede små bogstaver, ændret navnene på nogle kontrol koder og begge ændret af sted koder ACK og ESC styring af området med små bogstaver til området for kontrol koder. ASCII blev opdateret i overensstemmelse hermed og offentliggjort som ANSI X3.4-1968, ANSI X3.4-1977, og til sidst ANSI X3.4-1986. Andre organer for standardisering har offentliggjort tegnkoder er identiske med ASCII. Disse tegnkoder kaldes ofte ASCII, ASCII selvom strengt definerede kun af ASA / ANSI-standarder:

  • Den europæiske Computer Manufacturers Association offentliggjorde udgaver af sin klon af ASCII, ECMA-6 i 1965, 1967, 1970, 1973, 1983 og 1991. udgave 1991 er identisk med ANSI X3.4-1986.
  • Den Internationale Standardiseringsorganisation offentliggjorde sin version ISO 646 i 1967, 1972, 1983 og 1991. I særdeleshed ISO 646: 1972 etableret en række specifikke versioner til hvert land, hvor tegnsætningstegn blev erstattet med ikke-engelske tegn. ISO / IEC 646: 1991 Den internationale reference Version er den samme som i ANSI X3.4-1986.
  • Den Internationale Telekommunikationsunion offentliggjorde sin version af ANSI X3.4-1986, ITU anbefaling T.50, i 1992. I begyndelsen af ​​1970'erne, udgivet en version som CCITT V.3.
  • DIN udgivet en version af ASCII som standard DIN 66003 i 1974.
  • Arbejdsgruppen Internet Engineering offentliggjorde en version i 1969 som RFC 20, og sætte standarden for internettet, er baseret på ANSI X3.4-1986, med udgivelsen af ​​RFC 1345 i 1992.
  • IBM version af ANSI X3.4-1986 blev offentliggjort i den tekniske litteratur IBM kode side 367.

ASCII-koden er også inkluderet i sin sandsynlige nødhjælp, Unicode, som udgør de første 128 tegn.

ASCII kontrol tegn

ASCII forbeholder de første 32 koder for kontrol tegn: koder oprindeligt beregnet til ikke at repræsentere printable oplysninger, men at styre enheder ved hjælp af ASCII. For eksempel, karakter 10 repræsenterer den "nye linje" gør et gennembrud printerpapir, og karakter 27 repræsenterer "flygte" -tasten ofte ligger i det øverste venstre hjørne fælles tastaturer funktion. Koden 127, en anden særlig karakter, er at "slette". Selv om denne funktion er magen til andre kontrolforanstaltninger tegn, ASCII designere udtænkt denne kode til "delete" et afsnit af perforeret papir ved at bore huller enhver mulig position specificitetsattestering, som erstatter enhver forudgående information. Siden kode 0 blev ignoreret, var det muligt at forlade huller og foretage korrektioner senere. Mange af de ASCII kontrol tegn tjener til at markere pakker af data, eller kontrollere datatransmissionsprotokoller. Stedfortræder Flygte og tillod en kommunikationsprotokol, for eksempel markere binære data, så de indeholdt koder med den samme kode som karakteren af ​​protokollen, og at modtageren kan fortolke som data i stedet som deres egne tegn i protokollen. Designerne af kode ASCII udtænkt karakterer af adskillelse til brug i magnetbånd-systemer. To af enhedens kontrol tegn, almindeligvis kaldes XON og XOFF tegn normalt udøves funktioner af flow kontrol til at styre strømmen til en langsom enhed fra en hurtig enhed, således at dataene ikke mætte kapacitet modtagelse af den langsomme enhed og gå tabt. Tidlige brugere af ASCII vedtaget nogle af styrekoderne at repræsentere "meta" som end-of-line, begyndende / slutningen af ​​et dataelement, etc. Disse opgaver ofte konflikt, så en del af indsatsen for at konvertere data fra et format til et andet indebærer at gøre de rigtige metadata konverteringer. For eksempel, tegnet, der repræsenterer end-of-line i tekstfiler varierer med operativsystemet. Når filer fra et system til et andet, konvertering systemet må erkende disse tegn markerer end-of-line og handle i overensstemmelse hermed kopieret. I øjeblikket brugere anvender færre ASCII kontrol tegn,. Mærk moderne sprog, moderne kommunikationsprotokoller, passage af tekstbaserede grafik-baserede enheder, nedgangen af ​​fjernskrivere, har hulkort og papirbaner venstre mest forældede kontrol tegn.

Printable ASCII-tegn

Tegnet "plads": det mellemrum mellem ord, og er normalt produceret af mellemrumstasten på et tastatur. Koder 33-126 er kendt som printbare tegn, og repræsenterer bogstaver, tal, tegnsætningstegn og forskellige symboler. Den syv-bit ASCII forudsat syv "nationale" karakter, og hvis den særlige kombination af hardware og software gør det muligt, kan du bruge tastekombinationer til at simulere andre internationale tegn: i disse tilfælde backspace kan gå forud en åben grav accent eller et Tøddel eller et "brand vejrtrækning".

Strukturelle træk

  • Cifrene 0 til 9 er repræsenteret med deres default værdi 0011 binære værdier.
  • Bitstrenge af små og store bogstaver adskiller sig kun i én bit, hvilket forenkler omdannelsen af ​​en gruppe til en anden.

Andre navne for ASCII

RFC 1345 IANA rekord og tegnkoder, genkende følgende alternative navne til ASCII til brug på internettet.

  • ANSI_X3.4-1968
  • ANSI_X3.4-1986
  • ASCII
  • US-ASCII
  • os
  • Iso646 USA
  • ISO_646.irv: 1991
  • iso-go-6
  • IBM367
  • cp367
  • csASCII

Af disse er kun navnene "USA-ASCII" og "ASCII" meget udbredt. Ofte findes i parameteren "tegnkode" option på Content-Type header nogle MIME-meddelelser, der svarer element "meta" af nogle HTML-dokumenter, og i erklæringen del af karakter kodning header Nogle XML-dokumenter.

ASCII-varianter

Som computerteknologi spredt over hele verden, blev forskellige standarder udviklet og selskaberne udviklet mange variationer af kode ASCII til at lette skrivningen af ​​andre sprog end engelsk, der vil bruge latinske bogstaver. Du kan finde nogle af disse variationer, der er klassificeret som "Udvidet ASCII", selv om udtrykket undertiden fejlagtigt anvendes til at dække alle varianter, selv dem, der ikke bevare den oprindelige kode sæt syv-bit ASCII-tegn. ISO 646, det første forsøg på at rette op på den pro-engelske skævhed tegnkodning, skabte problemer med kompatibilitet, da det var også et tegn kode 7 bit. Han havde ikke angive yderligere koder, så omfordelt nogle specielt til de nye sprog. Derfor blev det umuligt at vide, hvilken version af teksten blev kodet, og dermed kunne tekstbehandlingsprogrammer behandle en enkelt variant. Den teknologi forbedret og bidrog midler til at repræsentere information kodet i den ottende bit af hver byte, hvilket frigør denne bit, som tilføjede andre 128 yderligere tegnkoder, der var til rådighed for nye opgaver. For eksempel IBM udviklet siderne 8-bit kode, såsom tegntabel 437, der erstattede de kontrolforanstaltninger tegn med grafiske symboler som smil, og tildelte yderligere grafiske tegn til de øverste 128 bytes af tegntabel. Nogle operativsystemer som DOS, kunne arbejde med disse sider af koden, og producenter af personlige computere omfattede støtte til disse sider i deres hardware. Otte-bit standarder som ISO 8859 og Mac OS Roman blev udviklet som sande udvidelser af ASCII, efterlader de første 127 intakte tegn og tilføje udelukkende yderligere værdier over de 7-bit. Dette tillod repræsentation af en bredere vifte af sprog, men disse standarder fortsatte med at lide uforenelighed og begrænsninger. Selv i dag, ISO-8859-1 og Windows-1252-version og de oprindelige 7-bit ASCII koder er mest almindeligt anvendte tegn.

Unicode Universal Character Set ISO / IEC 10646 definerer en meget større sæt tegn, og forskellige former for kodning er begyndt at erstatte ISO 8859 og ASCII hurtigt i mange miljøer. Mens stort set ASCII bruger 7-bit-koder, og Unicode UCS bruge "kodepunkter" eller relativt abstrakte pointere: positive tildelt sekvenser af 8 eller flere bits til tegn. For kompatibilitet, Unicode og UCS tildele de første 128 pointere til de samme tegn som ASCII-koden. På denne måde kan du tænke på ASCII som en meget lille delmængde af Unicode og UCS. Den populære UTF-8-kodning anbefaler, ved hjælp af en til fire 8-bit værdier for hver pointer, hvor de første 128 værdier peger på de samme tegn som ASCII. Andre tegnkodninger som UTF-16 er som ASCII i, hvordan de repræsenterer de første 128 tegn af Unicode, men har tendens til at bruge 16 til 32 bit pr karakter, kræver det en ordentlig konvertering således at der er overensstemmelse mellem de to tegn koder. Ordet beskriver ASCIIbético ordination i rækkefølge efter ASCII-koder i stedet for alfabetisk.

ASCIIZ eller ASCIZ forkortelsen refererer til en tegnstreng nul afsluttet. Det er meget normalt for ASCII-koden er indlejret i andre systemer mere sofistikeret kodning og dette bør være klart, hvilken rolle ASCII-koden for tegnoversigten bord eller en computer.

ASCII Art

ASCII kode er støtte fra et mindretal kunstform, ASCII kunst, som består af sammensætningen af ​​billeder ved hjælp af printbare ASCII-tegn. Effekten er blevet sammenlignet med pointillismen, fordi de billeder produceret af denne teknik normalt ses nærmere, når den ses fra en afstand. ASCII kunst begyndte som et eksperimenterende kunst, men blev hurtigt populær som ressource til at repræsentere billeder ude af stand til at behandle grafik såsom telexer terminaler, e-mails eller nogle printere understøtter.

Selvom ASCII kunst kan være sammensat manuelt ved hjælp af en teksteditor, kan du også automatisk konvertere billeder og videoer i ASCII ved hjælp af software som f.eks AAlib bibliotek, som har opnået en vis popularitet. Aalib understøttes af nogle grafikprogrammer, videospil og spillere.

Forrige artikel Arturo MENCHACA
Næste artikel ABBA Gold