Tokenization

May -Akda: Louise Ward
Petsa Ng Paglikha: 8 Pebrero 2021
I -Update Ang Petsa: 18 Mayo 2024
Anonim
What Is Tokenization?
Video.: What Is Tokenization?

Nilalaman

Kahulugan - Ano ang ibig sabihin ng Tokenization?

Ang Tokenization ay ang pagkilos ng paghiwalay ng isang pagkakasunud-sunod ng mga string ng mga piraso tulad ng mga salita, keyword, parirala, simbolo at iba pang mga elemento na tinatawag na mga token. Ang mga token ay maaaring indibidwal na mga salita, parirala o kahit na buong pangungusap. Sa proseso ng tokenization, ang ilang mga character tulad ng mga bantas na marka ay itinapon. Ang mga token ay nagiging input para sa isa pang proseso tulad ng pag-parse at pagmimina.


Ang tokenization ay ginagamit sa agham ng computer, kung saan ito ay gumaganap ng isang malaking bahagi sa proseso ng pag-aaral ng lexical.

Isang Panimula sa Microsoft Azure at ang Microsoft Cloud | Sa buong gabay na ito, malalaman mo kung ano ang lahat ng cloud computing at kung paano makakatulong ang Microsoft Azure sa iyo upang lumipat at patakbuhin ang iyong negosyo mula sa ulap.

Ipinapaliwanag ng Techopedia ang Tokenization

Ang Tokenization ay nakasalalay sa karamihan sa simpleng heuristik upang paghiwalayin ang mga token sa pamamagitan ng pagsunod sa ilang mga hakbang:

  • Ang mga token o salita ay pinaghihiwalay ng whitespace, mga marka ng bantas o mga linya ng linya
  • Ang mga puting puwang o bantas na marka ay maaaring o hindi kasama depende sa pangangailangan
  • Ang lahat ng mga character sa loob ng magkakasalungat na mga string ay bahagi ng token. Ang mga token ay maaaring binubuo ng lahat ng mga alpha character, alphanumeric character o numeric character lamang.

Ang mga token mismo ay maaari ring maging mga separator. Halimbawa, sa karamihan ng mga wika sa programming, ang mga identifier ay maaaring mailagay kasama ang mga operator ng aritmetika nang walang mga puting puwang. Kahit na tila ito ay lilitaw bilang isang solong salita o token, ang grammar ng wika ay aktwal na isinasaalang-alang ang matematiko operator (isang token) bilang isang separator, kaya kahit na maraming mga token ay bunched up nang magkasama, maaari pa rin silang ihiwalay sa pamamagitan ng matematika operator.