Format ng Pagbabago ng Unicode (UTF)

May -Akda: Monica Porter
Petsa Ng Paglikha: 15 Marso. 2021
I -Update Ang Petsa: 1 Hulyo 2024
Anonim
Unicode Encoding! UTF-32, UCS-2, UTF-16, & UTF-8!
Video.: Unicode Encoding! UTF-32, UCS-2, UTF-16, & UTF-8!

Nilalaman

Kahulugan - Ano ang ibig sabihin ng Unicode Transformat Format (UTF)?

Ang Format ng Pagbabago ng Unicode (UTF) ay isang format ng pag-encode ng character na magagawang i-encode ang lahat ng mga posibleng puntos ng character code sa Unicode. Ang pinaka-praktikal ay ang UTF-8, na kung saan ay isang variable-haba na pag-encode at gumagamit ng mga yunit ng 8-bit code, na idinisenyo para sa paurong na pagkakatugma sa pag-encode ng ASCII.


Ang Format ng Pagbabago ng Unicode ay kilala rin bilang Format ng Pagbabago ng Universal.

Isang Panimula sa Microsoft Azure at ang Microsoft Cloud | Sa buong gabay na ito, malalaman mo kung ano ang lahat ng cloud computing at kung paano makakatulong ang Microsoft Azure sa iyo upang lumipat at patakbuhin ang iyong negosyo mula sa ulap.

Ipinapaliwanag ng Techopedia ang Format ng Pagbabagong-anyo ng Unicode (UTF)

Ang Format ng Pagbabago ng Unicode ay isa sa dalawang encodings na ginamit sa Unicode, ang isa pa ay ang Universal Character Set (UCS). Pareho silang ginamit upang mapa ang hanay ng mga puntos ng Unicode code sa mga pagkakasunud-sunod ng mga term na halaga ng code. Ang mga numero sa mga pangalan ng pag-encode ay nagpapahiwatig kung gaano karaming mga piraso ang ginagamit sa isang halaga ng code ng pag-encode. Nangangahulugan lamang ito na ang bawat natatanging karakter ay naatasan ng isang tagatukoy ng code na tinatawag na mga puntos ng code.


Ang iba't ibang uri ng mga pag-encode ng UTF ay kinabibilangan ng:

  • UTF-1 - Nagretiro na hinalinhan ng UTF-8, hindi na bahagi ng Unicode Standard
  • UTF-7 - Gumagamit ng 7 bits para sa pag-encode at pangunahing ginagamit sa, ngunit ngayon ay itinuturing na hindi na ginagamit
  • UTF-8 - Gumagamit ng isang 8-bit variable-width na pag-encode upang ma-maximize ang pagiging tugma sa ASCII
  • UTF-16 - 16-bit variable-lapad na pag-encode
  • Ang UTF-32 - 32-bit na nakapirming-lapad na pag-encode
  • Ang UTF-EBCIDC - Gumagamit ng 8 bits at dinisenyo upang maging katugma sa Extended Binary Coded Decimal Interchange Code (EBCDIC)