Mojibake

Mojibake (文字化け, pronunțat /modʑibake/) este denumirea caracterelor incorecte, ilizibile, afișate atunci când un software de calculator nu reușește să afișeze corect textul. La utilizarea calculatoarelor, textul este codificat cu ajutorul unei codificări de caractere. În transfer, fiecare caracter este înlocuit de poziția (sau numărul) sa în codificare. Pentru a afișa din nou caracterul, poziția este din nou înlocuită cu caracterul. Atunci când codificarea originală nu este specificată, se poate utiliza un caracter diferit atunci când numărul este înlocuit din nou cu caracterul pentru afișare. Unicode a fost introdus pentru a rezolva această problemă: UTF-8 este capabil să codifice cele mai comune caractere în 2 octeți.

Înainte de introducerea Unicode, se foloseau și alte codificări de caractere. De exemplu, ISO-8859 conține 15 codificări diferite. Acestea sunt aceleași pentru caracterele utilizate în mod obișnuit în limba engleză. Acestea au mai multe "blocuri" de "caractere speciale", care sunt clasate diferit pentru fiecare codificare.



Iată cum poate arăta un site web dacă se utilizează o codificare greșită a fontului.Zoom
Iată cum poate arăta un site web dacă se utilizează o codificare greșită a fontului.

Articolul din Wikipedia în japoneză despre Mojibake folosește codificarea UTF-8. Această captură de ecran arată cum arată acesta, atunci când este decodificat folosind codificarea standard Windows CP1252.Zoom
Articolul din Wikipedia în japoneză despre Mojibake folosește codificarea UTF-8. Această captură de ecran arată cum arată acesta, atunci când este decodificat folosind codificarea standard Windows CP1252.

Originea cuvântului

Mojibake este un cuvânt japonez. Cuvântul 文字化け ([moʥibake]) este compus din două părți. 文字 (moji) înseamnă literă, caracter. 化け (bake), de la verbul 化ける (bakeru), înseamnă a apărea deghizat, a lua forma, a se schimba în rău. La propriu, înseamnă "mutație de caracter".



Întrebări și răspunsuri

Î: Ce înseamnă "mojibake"?


R: Mojibake este termenul pentru caracterele incorecte și ilizibile care apar atunci când software-ul calculatorului nu reușește să afișeze corect textul.

Î: Cum este codificat textul atunci când se utilizează computerele?


R: Textul este codificat cu ajutorul unei codificări de caractere, în care fiecare caracter este înlocuit cu poziția sau numărul său în codificare.

Î: Ce se întâmplă atunci când codificarea originală nu este specificată la transferul de text?


R: Atunci când codificarea originală nu este specificată, este posibil să se utilizeze un caracter diferit atunci când numărul este înlocuit cu caracterul pentru afișare.

Î: Ce este Unicode și cum rezolvă această problemă?


R: Unicode este un standard de codificare a caracterelor care poate reprezenta majoritatea caracterelor în doi octeți. Acesta rezolvă problema utilizării diferitelor codificări de caractere și asigură afișarea corectă a caracterelor.

Î: Care sunt câteva exemple de alte codificări de caractere care au fost utilizate înainte de Unicode?


R: ISO-8859 este un exemplu de altă codificare de caractere care a fost utilizată înainte de Unicode.

Î: Câte codificări diferite conține ISO-8859?


R: ISO-8859 conține 15 codificări diferite.

Î: Caracterele speciale din ISO-8859 sunt aceleași pentru toate codificările sale?


R: Nu, caracterele speciale din ISO-8859 sunt depuse diferit pentru fiecare codificare.

AlegsaOnline.com - 2020 / 2023 - License CC3