Skip to content

Commit

Permalink
Follow-up of #23776 (#23963)
Browse files Browse the repository at this point in the history
* Fix #23767

* minor changes

* http to https

* Minor review for #23776

* Apply typofix suggestion from @cw118

Co-authored-by: Carolyn Wu <[email protected]>

---------

Co-authored-by: Quentin <[email protected]>
Co-authored-by: Carolyn Wu <[email protected]>
  • Loading branch information
3 people authored Oct 13, 2024
1 parent d0df5af commit ea0b454
Showing 1 changed file with 5 additions and 3 deletions.
8 changes: 5 additions & 3 deletions files/fr/glossary/unicode/index.md
Original file line number Diff line number Diff line change
@@ -1,19 +1,21 @@
---
title: Unicode
slug: Glossary/Unicode
l10n:
sourceCommit: eb061bd719102c148cf87d12fd7056ed0c5071c8
---

{{GlossarySidebar}}

Unicode est un {{Glossary("Character set","jeu de caractères")}} standard qui énumère et définit les {{Glossary("Character","caractères")}} des différentes langues du monde, systèmes d'écriture et symboles.

En attribuant un nombre à chaque caractère, les programmeurs peuvent {{Glossary("Character encoding", "encoder des caractères")}}, pour permettre aux ordinateurs de stocker, traiter et transmettre toute combinaison de langues dans le même fichier ou programme.
En attribuant un nombre à chaque caractère, les développeuses et développeurs peuvent {{Glossary("Character encoding", "encoder des caractères")}}, pour permettre aux ordinateurs de stocker, traiter et transmettre toute combinaison de langues dans le même fichier ou programme.

Avant Unicode, il était difficile et sujet aux erreurs de mélanger les langues dans les mêmes données. Par exemple, un jeu de caractères stockait des caractères japonais et un autre l'alphabet arabe. S'il n'était pas clairement indiqué quelles parties des données étaient dans quel jeu de caractères, d'autres programmes et ordinateurs affichaient incorrectement le texte ou l'endommageaient pendant le traitement. Si vous avez déjà vu du texte des caractères comme des citations entre guillemets en cursives (`“”`) remplacés par du charabia comme `£`,alors vous avez vu ce problème, connu sous le nom [Mojibake](https://fr.wikipedia.org/wiki/Mojibake).
Avant Unicode, il était difficile et sujet aux erreurs de mélanger les langues dans les mêmes données. Par exemple, un jeu de caractères stockait des caractères japonais et un autre l'alphabet arabe. S'il n'était pas clairement indiqué quelles parties des données appartenaient à quel jeu de caractères, d'autres programmes et ordinateurs affichaient incorrectement le texte ou l'endommageaient pendant le traitement. Si vous avez déjà vu du texte ou des caractères comme des citations entre guillemets anglais (&ldquo;&rdquo;) remplacés par du charabia comme `£`, alors vous avez vu ce problème, connu sous le nom [Mojibake](https://fr.wikipedia.org/wiki/Mojibake).

L'encodage de caractères Unicode le plus courant sur le Web est {{Glossary("UTF-8")}}. D'autres encodages existent, comme UTF-16 ou l'obsolète UCS-2, mais UTF-8 est recommandé.

## Voir aussi

- [Unicode](https://fr.wikipedia.org/wiki/Unicode) sur Wikipédia
- [The Unicode Standard : A Technical Introduction](https://www.unicode.org/standard/principles.html) (en)
- [<i lang="en">The Unicode Standard: A Technical Introduction</i>](https://www.unicode.org/standard/principles.html) (en anglais)

0 comments on commit ea0b454

Please sign in to comment.