ASCII
Kod Piawai Amerika untuk Pertukaran Maklumat atau juga dikenali dengan singkatan Inggerisnya ASCII ("American Standard Code for Information Interchange") adalah satu format yang lazim digunakan untuk fail teks dalam komputer dan internet. Kod ASCII telah dibangunkan oleh American National Standards Institute (ANSI).
Dalam fail yang menggunakan kod ASCII, setiap aksara (angka, abjad dan simbol khas) diwakili oleh sejumlah 7 bit nombor perduaan yang terdiri daripada rentetan tujuh '0' atau '1'. Ia melibatkan sejumlah 128 aksara biasa dengan tambahan 128 aksara lanjutan.
Saya telah mengesahkan cadangan yang telah diberikan oleh Setiausaha Kewangan berkenaan dengan piawaian yang perlu diwujudkan semasa merakam Kod Piawai untuk kegunaan Perkongsian maklumat di atas pita magnetik dan pita kertas semasa digunakan di atas komputer. Semua komputer atau peralatan yang mempunyai konfigurasi yang hampir serupa yang di bawa masuk ke dalam senarai peralatan kerajaan Federal pada dan selepas 1 Julai 1969 hendaklah mempunyai kemampuan untuk menggunakan Kod Piawai untuk kegunaan Perkongsian maklumat dan format piawai untuk pita magnetik dan pita kertas jika bahan ini akan digunakan.
— Lyndon B. Johnson, Memorandum Kelulusan pengambilan Kod Piawai oleh Kerajaan Federal bagi tujuan Perkongsian Maklumat pada 11 Marc 1968 di Gerhard Peters (ed.) Projek Presiden Amerika, [2]
Pengenalan
[sunting | sunting sumber]Seperti kod-kod komputer yang lain, ASCII memberikan rujukan yang spesifik kepada susunan bit digital dan juga glyph (contohnya simbol) untuk sebuah bahasa penulisan. Ini membolehkan peralatan digital berkomunikasi antara satu sama lain untuk memproses, menyimpan dan berkomunikasi menggunakan maklumat berdasarkan simbol.Proses "encode" Kod ASCII [1]- atau "compatible extension" - digunakan hampir di setiap komputer umum, terutama komputer peribadi dan pusat pekerjaan. Nama MIME yang digunakan untuk proses "encode" ini adalah "US-ASCII".".[2]
Walaupun pengecualian kepada beberapa Kod Kawalan ASCII yang menggunakan format berdasarkan barisan,ko ASCII tidak ditakrifkan di mana-mana mekanisma untuk takrifan kepada struktur atau penampilan sesebuah perkataan didalam sebuah dokumen. Skema lain seperti bahasa markup, alamat dan format dokumen.
Kod ASCII adalah kod tujuh bit, ini bermakna ia menggunakan susunan tujuh angka binari dari angka desimal 0 hingga 127 untuk mewakili setiap simbol. Sewaktu kod ASCII diperkenalkan, banyak komputer pasa masa itu menggunakan lapan-bit bait ( kumpulan bit, yang dikenali sebagai Oktet, sebagai unit terkecil untuk data. Di dalam kod ASCII tujuh-bit, bit ke-8 biasanya digunakan sebagai bit pariti untuk memeriksa jika terdapat sebarang kesalahan didalam talian komunikasi atau untuk fungsi peralatan yang lain. Mesin yang menggunakan pemeriksaan pariti biasanya akan menetapkan bit kelapan kepada 0.[3]
Institut Piawai Nasional Amerika ( the United States of America Standards Institute atau USASI) telah membangunakan kod ASCII merujuk kepada sistem enkod mesin telepencetak terdahulu. Di dalam linkungan tahun 1956an, Ivan Idelson di Ferranti di UK, telah memulakan penggunaan kod Cluff-Foster-Idelson diatas 7 pita kertas perentas untuk komuniti BSI. Kod ini telah menjadi kod ASCII. Kod ASCII sendiri telah buat pertama kalinya digunakan secara komersil pada tahun 1963 sebagai kod tujuh-bit untuk telepencetak yang digunakan oleh rangkaian American Telephone & Telegraph's TWX (Teletype Wide-area eXchange). TWX pada asalnya menggunakan kod lima-bitkod Baudot, yang juga digunakan oleh syarikat pencabar meraka iaitu sistem Telex telepencetak. Sistem Belll telah merancang untuk menaik taraf ke kod enam-bit sehubungan daripada projek Fieldata, yang telah memuatkan tanda kata nama dan juga huruf kecil ke dalam kod Baudot. Namun telah dipujuk untuk memasuki Pertubuhan Standard Amerika ( merupakan cabang dari Institut Standard Nasional Amerika ANSI) sebagai salah satu daripada rangkaian komiti yang telah memulakan pembangunan kod ASCII.[perlu rujukan]
Jika dibandingkan dengan kod telegraf terdahulu, seperti contoh kod Bell dan kod ASCII, kedua-duanya telah melalui susunan semua untuk kesesuaian penyusunan kod terutama dari segi abjab di dalam sebuah senarai. Selain itu, terdapat tambahan beberapa fungsi kepada peralatan lain selain telepencetak. Bob Bemer telah memperkenalkan fungsi baru seperti contoh aturan escape.[perlu rujukan] Rakannya Hugh McGregor Ross telah membantu untuk memperkenalkan hasilnya itu mengikut kata Bemer, "kod ASCII yang asal adalah dikenali sebagai kod Bemer-Ross di Eropah".[perlu rujukan]
Kod ASCII telah dikemaskini dari masa ke semasa dan telah dicetak sebagai USASI X3.4-1968, ANSI X3.4-1977, dan akhirnya ANSI X3.4-1986.
Pertubuhan-pertubuhan Piawai Antarabangsa yang lain telah memperkenalkan kod-kod lain seperti ISO 646, dimana kod ini mempunyai banyak persamaan dan hampir sama dengan kod ASCII, dengan penambahan untuk beberapa simbol yang digunakan oleh kawasan atau negara-negara tersebut di mana tidak terdapat di dalam abjab Inggeris, selain simbol-simbol matawang seperti contoh Matawang United Kingdom yang menggunakan Pound Sterling (£). Walaupun kod-kod ini kadangkalanya merujuk kepada ASCII, namun ASCII yang asli adalah mengikut piawaian ANSI.
Kod ASCII telah dimasukkan didalam penggantinya unikod sebagai simbol 128 dan kebawah.
Simbol kawalan ASCII
[sunting | sunting sumber]ASCII menyimpan 32 kod pertama (nombor 0-31 titik perpuluhan) untuk dijadikan sebagai Simbol kawalan: kod asal yang tidak membawa sebarang maklumat yang boleh dicetak, namun begitu selain untuk mengawal peralatan seperti mesin cetak yang menggunakan ASCII, atau untuk menyediakan maklumat-meta mengenai laluan data seperti yang tersimpan di atas pita magnetik. Sebagai contoh, simbol 10 membawa maksud fungsi "line feed" yang akan menyebabkan mesin cetak menggerakkan kertas ke hadapan dan simbol 8 adalah merujuk kepada "backspace".
lihat Seni ASCII
Dedua | Okt | Dek | Heks | Kep | PTP | TKK | KLA}} | Penerangan |
---|---|---|---|---|---|---|---|---|
000 0000 | 000 | 0 | 00 | NUL | ␀ | ^@ | \0 | Null character |
000 0001 | 001 | 1 | 01 | SOH | ␁ | ^A | Start of Header | |
000 0010 | 002 | 2 | 02 | STX | ␂ | ^B | Start of Text | |
000 0011 | 003 | 3 | 03 | ETX | ␃ | ^C | End of Text | |
000 0100 | 004 | 4 | 04 | EOT | ␄ | ^D | End of Transmission | |
000 0101 | 005 | 5 | 05 | ENQ | ␅ | ^E | Enquiry | |
000 0110 | 006 | 6 | 06 | ACK | ␆ | ^F | Acknowledgment | |
000 0111 | 007 | 7 | 07 | BEL | ␇ | ^G | \a | Bell |
000 1000 | 010 | 8 | 08 | BS | ␈ | ^H | \b | Backspace[d][i] |
000 1001 | 011 | 9 | 09 | HT | ␉ | ^I | \t | Horizontal Tab |
000 1010 | 012 | 10 | 0A | LF | ␊ | ^J | \n | Line feed |
000 1011 | 013 | 11 | 0B | VT | ␋ | ^K | \v | Vertical Tab |
000 1100 | 014 | 12 | 0C | FF | ␌ | ^L | \f | Form feed |
000 1101 | 015 | 13 | 0D | CR | ␍ | ^M | \r | Carriage return[h] |
000 1110 | 016 | 14 | 0E | SO | ␎ | ^N | Shift Out | |
000 1111 | 017 | 15 | 0F | SI | ␏ | ^O | Shift In | |
001 0000 | 020 | 16 | 10 | DLE | ␐ | ^P | Data Link Escape | |
001 0001 | 021 | 17 | 11 | DC1 | ␑ | ^Q | Device Control 1 (oft. XON) | |
001 0010 | 022 | 18 | 12 | DC2 | ␒ | ^R | Device Control 2 | |
001 0011 | 023 | 19 | 13 | DC3 | ␓ | ^S | Device Control 3 (oft. XOFF) | |
001 0100 | 024 | 20 | 14 | DC4 | ␔ | ^T | Device Control 4 | |
001 0101 | 025 | 21 | 15 | NAK | ␕ | ^U | Negative Acknowledgement | |
001 0110 | 026 | 22 | 16 | SYN | ␖ | ^V | Synchronous Idle | |
001 0111 | 027 | 23 | 17 | ETB | ␗ | ^W | End of Trans. Block | |
001 1000 | 030 | 24 | 18 | CAN | ␘ | ^X | Cancel | |
001 1001 | 031 | 25 | 19 | EM | ␙ | ^Y | End of Medium | |
001 1010 | 032 | 26 | 1A | SUB | ␚ | ^Z | Substitute | |
001 1011 | 033 | 27 | 1B | ESC | ␛ | ^[ | \e[f] | Escape[g] |
001 1100 | 034 | 28 | 1C | FS | ␜ | ^\ | File Separator | |
001 1101 | 035 | 29 | 1D | GS | ␝ | ^] | Group Separator | |
001 1110 | 036 | 30 | 1E | RS | ␞ | ^^ | Record Separator | |
001 1111 | 037 | 31 | 1F | US | ␟ | ^_ | Unit Separator | |
111 1111 | 177 | 127 | 7F | DEL | ␡ | ^? | Delete[e][i] |
Kod ASCII yang asal hanya menggunakan kosakata diskripsi yang pendek untuk semua simbol kawalan. Kadangkala, keadaan ini dibiarkan dengan sengaja (di mana simbol akan digunakan dengan cara yang berlainan di atas sambungan terminal berbanding dengan saluran data) dan kadangkala menyebabkan lebih banyak ketidaksinambungan (sepertimana "padam" bermaksud).
Secara dasarnya, Teletype corporation model siri 33 merupakan peralatan yang telah memberikan pengaruh besar kepada interpretasi simbol-simbol ini. Peralatan ini merupakan sebuah terminal percetakan yang dilengkapi dengan teknologi pita kertas untuk menebuk lubang dan mentafsirnya. Pita kertas merupakan antara medium yang terkenal untuk pengaturcaraan simpanan data jangka masa panjang sehingga tahun 1980an, dan menggunakan kos perkhidmatan yang rendah dan dalam masa yang sama lebih lasak jika dibandingakan dengan pita magnet. Selain itu, mesin Teletype 33 menggunakan kod 17 (Control-Q, DC1, juga dikenali sebagai XON), 19 (Control-S, DC3, juga dikenali sebagai XOFF), dan 127 (Padam) telah menjadi simbol de-facto standard. Oleh kerana kekunci atas untuk kekunci O boleh jua memaparkan simbol anak panah kiri ( dari ASCII-1963, yang mempunyai simbol ini disebalik simbol underscore), penggunaan kod 15 (Control-O, Shift In) yang tidak rasmi juga di takrifkan sebagai "padam simbol sebelumnya" juga telah digunakan oleh kebanyakan sistem perkongsian masa tetapi telah berkurangan disebabkan keadaan.
Penggunaaan Control-S (XOFF, simbol untuk "transmisi Nyahaktif") sebagai simbol amaran tangan bersalaman untuk menyuruh penghantar supaya menghentikan tranmisi disebabkan oleh arus lebihan, dan Control-Q (XON, "transmisi aktif") untuk menyambung penghantaran, dimana boleh dibandingkan dengan teknik yang digunakan pada hari ini di dalam sistem-sistem sebagai teknik kawalan data keluar secara manual. Di dalam sesetengah sistem, Control-S mengekalkan fungsinya tetapi Control-Q digantikan dengan Control-S kedua untuk fungsi penyambungan penghantaran data.
Simbol kawalan ruang bukan putih
[sunting | sunting sumber]RFC 2822 merujuk kepada NO-WS-CTL, Simbol kawalan ruang bukan putih. Simbol-simbol ini adalah simbol kawalan yang tidak memasukkan pembawa kembali (carriage return), pengisi barisan (line feed) dan simbol ruang putih (white space character)(lihat disini), contohnya: huruf desimal 1–8, 11–12, 14–31, dan 127.
Simbol ASCII yang boleh dicetak
[sunting | sunting sumber]Kod 32, simbol "space", memberikan jarak antara dua perkataan, hasilnya adalah seperti apabila kita menekan "spacebar" di atas papan kekunci di atas komputer.Kod 32 hingga 126, dikenali sebagai simbol yang boleh dicetak, mewakili huruf, angka, tanda seruan, dan beberapa simbol yang lain.
ASCII tujuh-bit memberikan tujuh simbol "national" dan, jikalau peralatan dan perisian membenarkan. Overstrikes boleh digunakan untuk memaparkan simbol antarabangsa tambahan: di dalam senario ini, "backspace" boleh di gunakan sebagai grave accent (di mana sebagai standard penduduk Amerika dan British, tetapi hanya standard berikut juga dikenali sebagai "opening single quoation mark"), backtick atau breath mark (inverted vel).
Binary | Oct | Dec | Hex | Glyph |
---|---|---|---|---|
010 0000 | 040 | 32 | 20 | SP |
010 0001 | 041 | 33 | 21 | ! |
010 0010 | 042 | 34 | 22 | " |
010 0011 | 043 | 35 | 23 | # |
010 0100 | 044 | 36 | 24 | $ |
010 0101 | 045 | 37 | 25 | % |
010 0110 | 046 | 38 | 26 | & |
010 0111 | 047 | 39 | 27 | ' |
010 1000 | 050 | 40 | 28 | ( |
010 1001 | 051 | 41 | 29 | ) |
010 1010 | 052 | 42 | 2A | * |
010 1011 | 053 | 43 | 2B | + |
010 1100 | 054 | 44 | 2C | , |
010 1101 | 055 | 45 | 2D | - |
010 1110 | 056 | 46 | 2E | . |
010 1111 | 057 | 47 | 2F | / |
011 0000 | 060 | 48 | 30 | 0 |
011 0001 | 061 | 49 | 31 | 1 |
011 0010 | 062 | 50 | 32 | 2 |
011 0011 | 063 | 51 | 33 | 3 |
011 0100 | 064 | 52 | 34 | 4 |
011 0101 | 065 | 53 | 35 | 5 |
011 0110 | 066 | 54 | 36 | 6 |
011 0111 | 067 | 55 | 37 | 7 |
011 1000 | 070 | 56 | 38 | 8 |
011 1001 | 071 | 57 | 39 | 9 |
011 1010 | 072 | 58 | 3A | : |
011 1011 | 073 | 59 | 3B | ; |
011 1100 | 074 | 60 | 3C | < |
011 1101 | 075 | 61 | 3D | = |
011 1110 | 076 | 62 | 3E | > |
011 1111 | 077 | 63 | 3F | ? |
Binary | Oct | Dec | Hex | Glyph |
---|---|---|---|---|
100 0000 | 100 | 64 | 40 | @ |
100 0001 | 101 | 65 | 41 | A |
100 0010 | 102 | 66 | 42 | B |
100 0011 | 103 | 67 | 43 | C |
100 0100 | 104 | 68 | 44 | D |
100 0101 | 105 | 69 | 45 | E |
100 0110 | 106 | 70 | 46 | F |
100 0111 | 107 | 71 | 47 | G |
100 1000 | 110 | 72 | 48 | H |
100 1001 | 111 | 73 | 49 | I |
100 1010 | 112 | 74 | 4A | J |
100 1011 | 113 | 75 | 4B | K |
100 1100 | 114 | 76 | 4C | L |
100 1101 | 115 | 77 | 4D | M |
100 1110 | 116 | 78 | 4E | N |
100 1111 | 117 | 79 | 4F | O |
101 0000 | 120 | 80 | 50 | P |
101 0001 | 121 | 81 | 51 | Q |
101 0010 | 122 | 82 | 52 | R |
101 0011 | 123 | 83 | 53 | S |
101 0100 | 124 | 84 | 54 | T |
101 0101 | 125 | 85 | 55 | U |
101 0110 | 126 | 86 | 56 | V |
101 0111 | 127 | 87 | 57 | W |
101 1000 | 130 | 88 | 58 | X |
101 1001 | 131 | 89 | 59 | Y |
101 1010 | 132 | 90 | 5A | Z |
101 1011 | 133 | 91 | 5B | [ |
101 1100 | 134 | 92 | 5C | \ |
101 1101 | 135 | 93 | 5D | ] |
101 1110 | 136 | 94 | 5E | ^ |
101 1111 | 137 | 95 | 5F | _ |
Binary | Oct | Dec | Hex | Glyph |
---|---|---|---|---|
110 0000 | 140 | 96 | 60 | ` |
110 0001 | 141 | 97 | 61 | a |
110 0010 | 142 | 98 | 62 | b |
110 0011 | 143 | 99 | 63 | c |
110 0100 | 144 | 100 | 64 | d |
110 0101 | 145 | 101 | 65 | e |
110 0110 | 146 | 102 | 66 | f |
110 0111 | 147 | 103 | 67 | g |
110 1000 | 150 | 104 | 68 | h |
110 1001 | 151 | 105 | 69 | i |
110 1010 | 152 | 106 | 6A | j |
110 1011 | 153 | 107 | 6B | k |
110 1100 | 154 | 108 | 6C | l |
110 1101 | 155 | 109 | 6D | m |
110 1110 | 156 | 110 | 6E | n |
110 1111 | 157 | 111 | 6F | o |
111 0000 | 160 | 112 | 70 | p |
111 0001 | 161 | 113 | 71 | q |
111 0010 | 162 | 114 | 72 | r |
111 0011 | 163 | 115 | 73 | s |
111 0100 | 164 | 116 | 74 | t |
111 0101 | 165 | 117 | 75 | u |
111 0110 | 166 | 118 | 76 | v |
111 0111 | 167 | 119 | 77 | w |
111 1000 | 170 | 120 | 78 | x |
111 1001 | 171 | 121 | 79 | y |
111 1010 | 172 | 122 | 7A | z |
111 1011 | 173 | 123 | 7B | { |
111 1100 | 174 | 124 | 7C | | |
111 1101 | 175 | 125 | 7D | } |
111 1110 | 176 | 126 | 7E | ~ |
Struktur ASCII
[sunting | sunting sumber]- Angka 0-9 diwakili oleh nilai mereka di dalam angka binari menggunakan 0011 ( ini bermaksud, mengubah BCD kepada ASCII adalah dengan hanya mengambil BCD masing-masing secara berasingan dan menambah 0011 kepadanya.
- Huruf kecil dan huruf besar hanya berbeza dari segi Susunan bit dengan perbezaan 1 bit sahaja, dengan meringkaskan kotak pertukaran kepada ujian terhad ( untuk mengelakkan pertukaran simbol yang bukan huruf) dan hanya satu operasi bit. Kotak pertukaran pantas adalah penting kerana ia sering digunakan untuk situasi pengabaian simbol di dalam carian algoritma .
- Perbandingan dengan EBCDIC, huruf kecil dan huruf besar masing-masing memenuhi 26 posisi secara berturutan.
Rujukan
[sunting | sunting sumber]- ^ International Organization for Standardization (December 1, 1975). "The set of control characters for ISO 646". Internet Assigned Numbers Authority Registry. Alternate U.S. version: [1] Diarkibkan 2006-03-05 di Wayback Machine. Accessed August 7, 2005.
- ^ Internet Assigned Numbers Authority (January 28, 2005). "Character Sets". Accessed August 7, 2005.
- ^
A Tex Primer for Scientists (dalam bahasa English). CRC Press. January 1, 1995. m/s. 13. ISBN 0-8493-7159-7. Unknown parameter
|coauthors=
ignored (|author=
suggested) (bantuan); Check date values in:|date=
(bantuan);|access-date=
requires|url=
(bantuan)CS1 maint: unrecognized language (link)