> Tous les forums > Forum Multimédia
 Code UTF8 pour les caractères avec accent pour vos sous-titres
Ajouter un message à la discussion
Page : [1] 
Page 1 sur 1
regedice
  Posté le 14/11/2019 @ 20:06 
Aller en bas de la page 
Astucien

Hello,

Il arrive parfois qu'on se retrouve avec des caractères étranges dans des sous-titres en français, à cause des accents = à â é ê è etc...

Voilà la famille concernée

à = Ã (il y a un espace à côté du caractère spécial)
À = À
â = â
ç = ç
Ç = Ç
é = ù
ê = ê
Ê = Ê
è = è
î = î
ï = ï
ô = ô
œ = Å“
ù = ù
û = û

° = °

à compléter...

Nouveaux caractères découverts [2019.12.08]

ï = ï



Modifié par regedice le 08/12/2019 23:26
Publicité
skale
 Posté le 15/11/2019 à 00:03 
Aller en bas de la page Revenir au message précédent Revenir en haut de la page
Petit astucien

Moi je faisais en retirant tous les caractères spéciaux avec bloc note.

Ca peut être long à faire mais en fait il y en a peu par rapport au caractère "normal".



Modifié par skale le 15/11/2019 00:05
regedice
 Posté le 15/11/2019 à 00:07 
Aller en bas de la page Revenir au message précédent Revenir en haut de la page
  Astucien

skale a écrit :

Moi je faisais en retirant tous les caractères spéciaux avec bloc note.

Ca peut être long à faire mais en fait il y en a peu par rapport au caractère "normal".

C'est parce que j'ai dû faire cela, à nouveau, ce soir, que j'ai pensé utile de l'indiquer ici...

Je ne sais pas s'il existe un petit outil capable de "réparer" ces fichiers en français ayant été traités par un logiciel anglophone ?

skale
 Posté le 15/11/2019 à 00:23 
Aller en bas de la page Revenir au message précédent Revenir en haut de la page
Petit astucien

Si j'utilisais un logiciel génial pour resynchroniser le son et la vidéo et aussi pour traiter le texte.

Et tu pouvais corriger ou bien améliorer la qualité du sous titrage.

Time adjuster

Je sais, d'après tes écrits, que tu t'y connais bien en multimédia alors dis moi ce que t'en penses ?



Modifié par skale le 15/11/2019 00:31
skale
 Posté le 15/11/2019 à 00:25 
Aller en bas de la page Revenir au message précédent Revenir en haut de la page
Petit astucien

"réparer" ces fichiers en français ayant été traités par un logiciel anglophone ?

Tu me fais douter ?

https://www.commentcamarche.net/download/telecharger-34055234-time-adjuster



Modifié par skale le 15/11/2019 00:30
regedice
 Posté le 15/11/2019 à 17:13 
Aller en bas de la page Revenir au message précédent Revenir en haut de la page
  Astucien

J'utilise le bon vieux "subrip" depuis une dizaine d'années...

Mais parfois je préfère éditer et corriger avec bloc-notes tout simplement

Comme ce problème de conversion de caractères n'est pas uniquement en rapport avec le sous-titrage, ce serait sympa d'avoir un petit éditeur de texte qui peut, automatiquement, reconnaître ces caractères et les remplacer par la lettre adéquate.

;)

skale
 Posté le 15/11/2019 à 21:25 
Aller en bas de la page Revenir au message précédent Revenir en haut de la page
Petit astucien

Avec notepad et la commande Edition/Remplacer soit ctrl+h c'est rapide pour changer les caractères spéciaux.

C'est surement cette procédure que tu fais

capoucci
 Posté le 15/11/2019 à 21:41 
Aller en bas de la page Revenir au message précédent Revenir en haut de la page
Petit astucien

Bonjour,

Comme ce problème de conversion de caractères n'est pas uniquement en rapport avec le sous-titrage, ce serait sympa d'avoir un petit éditeur de texte qui peut, automatiquement, reconnaître ces caractères et les remplacer par la lettre adéquate.

Notepad++ le fait.

Extrait de https://zestedesavoir.com/tutoriels/1114/comprendre-les-encodages/3-pratique/

Première remarque, Notepad++ détecte automatiquement l’encodage et l’indique dans la barre de statut (en bas, encadré en bleu). C’est déjà mieux. En passant, remarquons la mention « Dos\Windows ». Elle indique le style utilisé pour les fins de ligne. On avait vu qu’il existait plusieurs conventions, selon les OS. Ici, notre fichier utilise le style Windows, c’est-à-dire CRLF.

Ensuite, le menu « Encodage » permet de changer en direct l’encodage utilisé. Comme dans les navigateurs web, les options « Encoder en xxx » changent l’interprétation des octets existants ; en plus, elles déterminent le codage des caractères nouvellement insérés. Pour modifier l’encodage d’un fichier, il ne faut pas cliquer sur « Encoder en xxx », car cela n’adapte pas le contenu existant ; pour ça, il faut faire « Convertir en xxx ».

Enfin, on a quand même plus de choix que dans le Bloc-Notes !

Après cet aperçu, faites un tour dans la configuration de votre éditeur. Il y a certainement des options qui nous intéressent.

Cordialement.

hido
 Posté le 15/11/2019 à 22:53 
Aller en bas de la page Revenir au message précédent Revenir en haut de la page
  Astucien

Bonjour

Ce n'est pas normal il faut changer l'encodage des caractères dans les paramètres du lecteur de vidéo.

Il est réglé sur quel encodage ?

Publicité
regedice
 Posté le 16/11/2019 à 00:56 
Aller en bas de la page Revenir au message précédent Revenir en haut de la page
  Astucien

capoucci a écrit :

Bonjour,

Comme ce problème de conversion de caractères n'est pas uniquement en rapport avec le sous-titrage, ce serait sympa d'avoir un petit éditeur de texte qui peut, automatiquement, reconnaître ces caractères et les remplacer par la lettre adéquate.

Notepad++ le fait.

Extrait de https://zestedesavoir.com/tutoriels/1114/comprendre-les-encodages/3-pratique/

Première remarque, Notepad++ détecte automatiquement l’encodage et l’indique dans la barre de statut (en bas, encadré en bleu). C’est déjà mieux. En passant, remarquons la mention « Dos\Windows ». Elle indique le style utilisé pour les fins de ligne. On avait vu qu’il existait plusieurs conventions, selon les OS. Ici, notre fichier utilise le style Windows, c’est-à-dire CRLF.

Ensuite, le menu « Encodage » permet de changer en direct l’encodage utilisé. Comme dans les navigateurs web, les options « Encoder en xxx » changent l’interprétation des octets existants ; en plus, elles déterminent le codage des caractères nouvellement insérés. Pour modifier l’encodage d’un fichier, il ne faut pas cliquer sur « Encoder en xxx », car cela n’adapte pas le contenu existant ; pour ça, il faut faire « Convertir en xxx ».

Enfin, on a quand même plus de choix que dans le Bloc-Notes !

Après cet aperçu, faites un tour dans la configuration de votre éditeur. Il y a certainement des options qui nous intéressent.

Cordialement.

Merci pour cette astuce !

hido a écrit :

Bonjour

Ce n'est pas normal il faut changer l'encodage des caractères dans les paramètres du lecteur de vidéo.

Il est réglé sur quel encodage ?

Tu prends un texte en français tu le passes dans un logiciel de sous-titrage en anglais et ça donne ça !

Là c'est le fichier TXT/SRT source qui est déjà comme-ça, voilà pourquoi il faut le corriger !

Alyves
 Posté le 16/11/2019 à 08:43 
Aller en bas de la page Revenir au message précédent Revenir en haut de la page
Petit astucien

Bonjour,

Je ne suis pas absolument sur d'avoir bien compris le problème mais quand j'ai des caractères "bizarres" qui apparaissent dans les sous titres lors d'une lecture, sur une télé par exemple, j'ouvre le fichier .srt avec le bloc-notes et, sans rien modifier, je l’enregistre en UTF-8 : case "Encodage" de la fenêtre "Enregistrer sous".

Dans le cas de sous titres (non incrustés dans la vidéo) d'un fichier en Mkv, il peut être nécessaire d'en extraire le fichier de sous titres puis de le "remuxer"

après sa mise en UTF-8.

Ces caractères "bizarres"sont dus à un encodage en ANSI du fichier de sous titres .srt qui est mal interprété par le lecteur.

Bonne journée

regedice
 Posté le 16/11/2019 à 13:23 
Aller en bas de la page Revenir au message précédent Revenir en haut de la page
  Astucien

Faut que je retente la chose... Parce que c'est un tout petit peu plus complexe que ça les fichiers SRT, d'ailleurs on en trouve de plusieurs sortes et ceux corrigés ou créés par subrip n'ont pas le même poids que les autres, par exemple.

regedice
 Posté le 08/12/2019 à 22:29 
Aller en bas de la page Revenir au message précédent Revenir en haut de la page
  Astucien

capoucci a écrit :

Bonjour,

Comme ce problème de conversion de caractères n'est pas uniquement en rapport avec le sous-titrage, ce serait sympa d'avoir un petit éditeur de texte qui peut, automatiquement, reconnaître ces caractères et les remplacer par la lettre adéquate.

Notepad++ le fait.

Extrait de https://zestedesavoir.com/tutoriels/1114/comprendre-les-encodages/3-pratique/

Première remarque, Notepad++ détecte automatiquement l’encodage et l’indique dans la barre de statut (en bas, encadré en bleu). C’est déjà mieux. En passant, remarquons la mention « Dos\Windows ». Elle indique le style utilisé pour les fins de ligne. On avait vu qu’il existait plusieurs conventions, selon les OS. Ici, notre fichier utilise le style Windows, c’est-à-dire CRLF.

Ensuite, le menu « Encodage » permet de changer en direct l’encodage utilisé. Comme dans les navigateurs web, les options « Encoder en xxx » changent l’interprétation des octets existants ; en plus, elles déterminent le codage des caractères nouvellement insérés. Pour modifier l’encodage d’un fichier, il ne faut pas cliquer sur « Encoder en xxx », car cela n’adapte pas le contenu existant ; pour ça, il faut faire « Convertir en xxx ».

Enfin, on a quand même plus de choix que dans le Bloc-Notes !

Après cet aperçu, faites un tour dans la configuration de votre éditeur. Il y a certainement des options qui nous intéressent.

Cordialement.

Je me reprends la tête, j'ai téléchargé notepad++ la dernière version portable, mais rien à faire, ça fait encore plus de dégâts quand j'applique une modification !

regedice
 Posté le 08/12/2019 à 22:59 
Aller en bas de la page Revenir au message précédent Revenir en haut de la page
  Astucien

Qu'est-ce que j'ai pu perdre mon temps avec ce notepad++, je n'ai rien réussi à faire d'autre que de me prendre la tête !

En y regardant de plus près, je suis très surpris que personne n'ait créé un petit outil pour nous corriger ça simplement et rapidement ?!

capoucci
 Posté le 08/12/2019 à 23:48 
Aller en bas de la page Revenir au message précédent Revenir en haut de la page
Petit astucien

Qu'est-ce que j'ai pu perdre mon temps avec ce notepad++, je n'ai rien réussi à faire d'autre que de me prendre la tête

Désolé, donc, nous saurons que ça ne fonctionne pas avec les fichiers vidéos.

Daneel Olivaw
 Posté le 09/12/2019 à 00:42 
Aller en bas de la page Revenir au message précédent Revenir en haut de la page
  Maître astucien

Le code ASCII est codé sur un octet seulement. Le code UTF-8 est codée sur 1 à 4 octets selon le rang. La longueur de chaque caractère est variable.

Quand un éditeur de texte quelconque ouvre un fichier codé en ASCII, donc en un octet, il ne peut pas savoir que le groupe de caractères û représente le caractère û en UTF-8. Pour lui, ce sont 2 caractères indépendants. Si tu lui demande de convertir le texte en UTF-8, il va convertit à en UTF-8 et » en UTF-8 et non pas le groupe û en un seul caractère UTF-8.

Donc une fois qu'un texte en UTF-X a été ouvert et sauvegardé avec un editeur ASCII, les caractères accentués sont perdus. Reconvertir en UTF-8 ne les remettra pas en place.

Et le blocnote sait très bien transcoder de ASCII en UTF. D'ailleurs, c'est UTF-8 par défaut. Pas besoin de Notepad++.

Il suffit de cliquer sur Fichiers ---> Enregistrer sous et de choisir l'encodage.



Modifié par Daneel Olivaw le 09/12/2019 00:51
regedice
 Posté le 09/12/2019 à 18:21 
Aller en bas de la page Revenir au message précédent Revenir en haut de la page
  Astucien

Je n'ai pas les mêmes choix que toi pour la sauvegarde et apparemment, ce fichier est figé, comme si il avait déjà été corrigé pour une partie mais pas pour le reste !

Pour ceux qui veulent tester -> https://www.addic7ed.com/show/6382

C'est le dernière SRT pour l'épisode 9

Page : [1] 
Page 1 sur 1

Vous devez être connecté pour poster des messages. Cliquez ici pour vous identifier.

Vous n'avez pas de compte ? Créez-en un gratuitement !


Sujets relatifs
Solution pour convertir vos sous-titres SUP en SRT
Voici un site de sous-titres pour les films
Video :Log. SIMPLE pour changer les sous titres ??
sous titres pour film ?
Probleme pour lire les avi avec mon lecteur
avec quoi modifiez vous les sous titres srt??
Graver un DVD avec les sous-titres
encoder un film avec les sous titres!!!
graver avec les sous-titres
quelqun a un logiciel pour sous titrer les dvix
Plus de sujets relatifs à Code UTF8 pour les caractères avec accent pour vos sous-titres
 > Tous les forums > Forum Multimédia