> Tous les forums > Forum Multimédia
 Code UTF8 pour les caractères avec accent pour vos sous-titres
Ajouter un message à la discussion
Page : [1] 
Page 1 sur 1
regedice
  Posté le 14/11/2019 @ 20:06 
Aller en bas de la page 
Maître astucien

Hello,

Il arrive parfois qu'on se retrouve avec des caractères étranges dans des sous-titres en français, à cause des accents = à â é ê è etc...

Voilà la famille concernée

à = Ã (il y a un espace à côté du caractère spécial)
À = À
â = â
ç = ç
Ç = Ç
é = ù
ê = ê
Ê = Ê
è = è
î = î
ï = ï
ô = ô
œ = Å“
ù = ù
û = û

° = °

à compléter...

Nouveaux caractères découverts [2019.12.08]

ï = ï



Modifié par regedice le 08/12/2019 23:26
Publicité
skale
 Posté le 15/11/2019 à 00:03 
Aller en bas de la page Revenir au message précédent Revenir en haut de la page
Astucien

Moi je faisais en retirant tous les caractères spéciaux avec bloc note.

Ca peut être long à faire mais en fait il y en a peu par rapport au caractère "normal".



Modifié par skale le 15/11/2019 00:05
regedice
 Posté le 15/11/2019 à 00:07 
Aller en bas de la page Revenir au message précédent Revenir en haut de la page
  Maître astucien

skale a écrit :

Moi je faisais en retirant tous les caractères spéciaux avec bloc note.

Ca peut être long à faire mais en fait il y en a peu par rapport au caractère "normal".

C'est parce que j'ai dû faire cela, à nouveau, ce soir, que j'ai pensé utile de l'indiquer ici...

Je ne sais pas s'il existe un petit outil capable de "réparer" ces fichiers en français ayant été traités par un logiciel anglophone ?

skale
 Posté le 15/11/2019 à 00:23 
Aller en bas de la page Revenir au message précédent Revenir en haut de la page
Astucien

Si j'utilisais un logiciel génial pour resynchroniser le son et la vidéo et aussi pour traiter le texte.

Et tu pouvais corriger ou bien améliorer la qualité du sous titrage.

Time adjuster

Je sais, d'après tes écrits, que tu t'y connais bien en multimédia alors dis moi ce que t'en penses ?



Modifié par skale le 15/11/2019 00:31
skale
 Posté le 15/11/2019 à 00:25 
Aller en bas de la page Revenir au message précédent Revenir en haut de la page
Astucien

"réparer" ces fichiers en français ayant été traités par un logiciel anglophone ?

Tu me fais douter ?

https://www.commentcamarche.net/download/telecharger-34055234-time-adjuster



Modifié par skale le 15/11/2019 00:30
regedice
 Posté le 15/11/2019 à 17:13 
Aller en bas de la page Revenir au message précédent Revenir en haut de la page
  Maître astucien

J'utilise le bon vieux "subrip" depuis une dizaine d'années...

Mais parfois je préfère éditer et corriger avec bloc-notes tout simplement

Comme ce problème de conversion de caractères n'est pas uniquement en rapport avec le sous-titrage, ce serait sympa d'avoir un petit éditeur de texte qui peut, automatiquement, reconnaître ces caractères et les remplacer par la lettre adéquate.

;)

skale
 Posté le 15/11/2019 à 21:25 
Aller en bas de la page Revenir au message précédent Revenir en haut de la page
Astucien

Avec notepad et la commande Edition/Remplacer soit ctrl+h c'est rapide pour changer les caractères spéciaux.

C'est surement cette procédure que tu fais

capoucci
 Posté le 15/11/2019 à 21:41 
Aller en bas de la page Revenir au message précédent Revenir en haut de la page
Petit astucien

Bonjour,

Comme ce problème de conversion de caractères n'est pas uniquement en rapport avec le sous-titrage, ce serait sympa d'avoir un petit éditeur de texte qui peut, automatiquement, reconnaître ces caractères et les remplacer par la lettre adéquate.

Notepad++ le fait.

Extrait de https://zestedesavoir.com/tutoriels/1114/comprendre-les-encodages/3-pratique/

Première remarque, Notepad++ détecte automatiquement l’encodage et l’indique dans la barre de statut (en bas, encadré en bleu). C’est déjà mieux. En passant, remarquons la mention « Dos\Windows ». Elle indique le style utilisé pour les fins de ligne. On avait vu qu’il existait plusieurs conventions, selon les OS. Ici, notre fichier utilise le style Windows, c’est-à-dire CRLF.

Ensuite, le menu « Encodage » permet de changer en direct l’encodage utilisé. Comme dans les navigateurs web, les options « Encoder en xxx » changent l’interprétation des octets existants ; en plus, elles déterminent le codage des caractères nouvellement insérés. Pour modifier l’encodage d’un fichier, il ne faut pas cliquer sur « Encoder en xxx », car cela n’adapte pas le contenu existant ; pour ça, il faut faire « Convertir en xxx ».

Enfin, on a quand même plus de choix que dans le Bloc-Notes !

Après cet aperçu, faites un tour dans la configuration de votre éditeur. Il y a certainement des options qui nous intéressent.

Cordialement.

hido
 Posté le 15/11/2019 à 22:53 
Aller en bas de la page Revenir au message précédent Revenir en haut de la page
  Astucien

Bonjour

Ce n'est pas normal il faut changer l'encodage des caractères dans les paramètres du lecteur de vidéo.

Il est réglé sur quel encodage ?

Publicité
regedice
 Posté le 16/11/2019 à 00:56 
Aller en bas de la page Revenir au message précédent Revenir en haut de la page
  Maître astucien

capoucci a écrit :

Bonjour,

Comme ce problème de conversion de caractères n'est pas uniquement en rapport avec le sous-titrage, ce serait sympa d'avoir un petit éditeur de texte qui peut, automatiquement, reconnaître ces caractères et les remplacer par la lettre adéquate.

Notepad++ le fait.

Extrait de https://zestedesavoir.com/tutoriels/1114/comprendre-les-encodages/3-pratique/

Première remarque, Notepad++ détecte automatiquement l’encodage et l’indique dans la barre de statut (en bas, encadré en bleu). C’est déjà mieux. En passant, remarquons la mention « Dos\Windows ». Elle indique le style utilisé pour les fins de ligne. On avait vu qu’il existait plusieurs conventions, selon les OS. Ici, notre fichier utilise le style Windows, c’est-à-dire CRLF.

Ensuite, le menu « Encodage » permet de changer en direct l’encodage utilisé. Comme dans les navigateurs web, les options « Encoder en xxx » changent l’interprétation des octets existants ; en plus, elles déterminent le codage des caractères nouvellement insérés. Pour modifier l’encodage d’un fichier, il ne faut pas cliquer sur « Encoder en xxx », car cela n’adapte pas le contenu existant ; pour ça, il faut faire « Convertir en xxx ».

Enfin, on a quand même plus de choix que dans le Bloc-Notes !

Après cet aperçu, faites un tour dans la configuration de votre éditeur. Il y a certainement des options qui nous intéressent.

Cordialement.

Merci pour cette astuce !

hido a écrit :

Bonjour

Ce n'est pas normal il faut changer l'encodage des caractères dans les paramètres du lecteur de vidéo.

Il est réglé sur quel encodage ?

Tu prends un texte en français tu le passes dans un logiciel de sous-titrage en anglais et ça donne ça !

Là c'est le fichier TXT/SRT source qui est déjà comme-ça, voilà pourquoi il faut le corriger !

Alyves
 Posté le 16/11/2019 à 08:43 
Aller en bas de la page Revenir au message précédent Revenir en haut de la page
Petit astucien

Bonjour,

Je ne suis pas absolument sur d'avoir bien compris le problème mais quand j'ai des caractères "bizarres" qui apparaissent dans les sous titres lors d'une lecture, sur une télé par exemple, j'ouvre le fichier .srt avec le bloc-notes et, sans rien modifier, je l’enregistre en UTF-8 : case "Encodage" de la fenêtre "Enregistrer sous".

Dans le cas de sous titres (non incrustés dans la vidéo) d'un fichier en Mkv, il peut être nécessaire d'en extraire le fichier de sous titres puis de le "remuxer"

après sa mise en UTF-8.

Ces caractères "bizarres"sont dus à un encodage en ANSI du fichier de sous titres .srt qui est mal interprété par le lecteur.

Bonne journée

regedice
 Posté le 16/11/2019 à 13:23 
Aller en bas de la page Revenir au message précédent Revenir en haut de la page
  Maître astucien

Faut que je retente la chose... Parce que c'est un tout petit peu plus complexe que ça les fichiers SRT, d'ailleurs on en trouve de plusieurs sortes et ceux corrigés ou créés par subrip n'ont pas le même poids que les autres, par exemple.

regedice
 Posté le 08/12/2019 à 22:29 
Aller en bas de la page Revenir au message précédent Revenir en haut de la page
  Maître astucien

capoucci a écrit :

Bonjour,

Comme ce problème de conversion de caractères n'est pas uniquement en rapport avec le sous-titrage, ce serait sympa d'avoir un petit éditeur de texte qui peut, automatiquement, reconnaître ces caractères et les remplacer par la lettre adéquate.

Notepad++ le fait.

Extrait de https://zestedesavoir.com/tutoriels/1114/comprendre-les-encodages/3-pratique/

Première remarque, Notepad++ détecte automatiquement l’encodage et l’indique dans la barre de statut (en bas, encadré en bleu). C’est déjà mieux. En passant, remarquons la mention « Dos\Windows ». Elle indique le style utilisé pour les fins de ligne. On avait vu qu’il existait plusieurs conventions, selon les OS. Ici, notre fichier utilise le style Windows, c’est-à-dire CRLF.

Ensuite, le menu « Encodage » permet de changer en direct l’encodage utilisé. Comme dans les navigateurs web, les options « Encoder en xxx » changent l’interprétation des octets existants ; en plus, elles déterminent le codage des caractères nouvellement insérés. Pour modifier l’encodage d’un fichier, il ne faut pas cliquer sur « Encoder en xxx », car cela n’adapte pas le contenu existant ; pour ça, il faut faire « Convertir en xxx ».

Enfin, on a quand même plus de choix que dans le Bloc-Notes !

Après cet aperçu, faites un tour dans la configuration de votre éditeur. Il y a certainement des options qui nous intéressent.

Cordialement.

Je me reprends la tête, j'ai téléchargé notepad++ la dernière version portable, mais rien à faire, ça fait encore plus de dégâts quand j'applique une modification !

regedice
 Posté le 08/12/2019 à 22:59 
Aller en bas de la page Revenir au message précédent Revenir en haut de la page
  Maître astucien

Qu'est-ce que j'ai pu perdre mon temps avec ce notepad++, je n'ai rien réussi à faire d'autre que de me prendre la tête !

En y regardant de plus près, je suis très surpris que personne n'ait créé un petit outil pour nous corriger ça simplement et rapidement ?!

capoucci
 Posté le 08/12/2019 à 23:48 
Aller en bas de la page Revenir au message précédent Revenir en haut de la page
Petit astucien

Qu'est-ce que j'ai pu perdre mon temps avec ce notepad++, je n'ai rien réussi à faire d'autre que de me prendre la tête

Désolé, donc, nous saurons que ça ne fonctionne pas avec les fichiers vidéos.

Daneel Olivaw
 Posté le 09/12/2019 à 00:42 
Aller en bas de la page Revenir au message précédent Revenir en haut de la page
  Maître astucien

Le code ASCII est codé sur un octet seulement. Le code UTF-8 est codée sur 1 à 4 octets selon le rang. La longueur de chaque caractère est variable.

Quand un éditeur de texte quelconque ouvre un fichier codé en ASCII, donc en un octet, il ne peut pas savoir que le groupe de caractères û représente le caractère û en UTF-8. Pour lui, ce sont 2 caractères indépendants. Si tu lui demande de convertir le texte en UTF-8, il va convertit à en UTF-8 et » en UTF-8 et non pas le groupe û en un seul caractère UTF-8.

Donc une fois qu'un texte en UTF-X a été ouvert et sauvegardé avec un editeur ASCII, les caractères accentués sont perdus. Reconvertir en UTF-8 ne les remettra pas en place.

Et le blocnote sait très bien transcoder de ASCII en UTF. D'ailleurs, c'est UTF-8 par défaut. Pas besoin de Notepad++.

Il suffit de cliquer sur Fichiers ---> Enregistrer sous et de choisir l'encodage.



Modifié par Daneel Olivaw le 09/12/2019 00:51
regedice
 Posté le 09/12/2019 à 18:21 
Aller en bas de la page Revenir au message précédent Revenir en haut de la page
  Maître astucien

Je n'ai pas les mêmes choix que toi pour la sauvegarde et apparemment, ce fichier est figé, comme si il avait déjà été corrigé pour une partie mais pas pour le reste !

Pour ceux qui veulent tester -> https://www.addic7ed.com/show/6382

C'est le dernière SRT pour l'épisode 9

Page : [1] 
Page 1 sur 1

Vous devez être connecté pour participer à la discussion.
Cliquez ici pour vous identifier.

Vous n'avez pas de compte ? Créez-en un gratuitement !
Recevoir PC Astuces par e-mail


La Lettre quotidienne +226 000 inscrits
Avec l'actu, des logiciels, des applis, des astuces, des bons plans, ...

Les bonnes affaires
Une fois par semaine, un récap des meilleurs offres.

Les fonds d'écran
De jolies photos pour personnaliser votre bureau. Une fois par semaine.

Les nouveaux Bons Plans
Des notifications pour ne pas rater les bons plans publiés sur le site.

Les bons plans du moment PC Astuces

Tous les Bons Plans
99,99 €Disque dur Toshiba N300 4 To à 99,99 €
Valable jusqu'au 23 Juin

Cdiscount propose actuellement le disque dur Toshiba N300 4 To à 99,99 € livré gratuitement. On le trouve ailleurs à partir de 119 €. Ce disque dur interne CMR est optimisé pour les NAS, il possède 128Mo de cache et offre d'une vitesse de rotation de 7200 tpm.


> Voir l'offre
1 €Audible (livres audio) à 1 € par mois pendant 6 mois [Amazon Prime]
Valable jusqu'au 25 Juin

L'abonnement Audible, qui permet d'écouter des livres audio est en ce moment à 1 € par mois pendant 6 mois pour les membres Amazon Prime au lieu de 9,95 €. Notez que l'offre est résiliable à tout moment et facilement. L'abonnement Audible vous permet de bénéficier un crédit audio par mois,  échangeable contre n'importe quel livre audio parmi une large sélection de 500 000 titres, peu importe sa durée ou son prix. Vous pourrez télécharger et d'écouter (même hors connexion) vos livres via l'application Audible ou directivement via le site.

Vous n'avez pas le temps de lire ? Avec Audible, écoutez vos livres en voiture, en marchant, en faisant du sport, ...

L'offre est réservée aux membres Amazon Prime. Si vous n'êtes pas encore membre, vous pouvez essayer le service Amazon Prime gratuitement et sans engagement pendant 30 jours (livraison gratuite en 1 jour ouvré, streaming Amazon Prime Vidéo, musique en streaming illimité, stockage de manière sécurisée et illimitée vos photos, emprunt gratuit d'ebook, ...). A la fin de ces 30 jours gratuits, vous pourrez continuer à utiliser ce service pour 49 € / an ou bien le stopper sans frais.


> Voir l'offre
69,99 €Ecouteurs intra-auriculaires sans fil Bluetooth Jabra Elite 65t à 69,99 €
Valable jusqu'au 24 Juin

Darty fait une promotion sur les écouteurs intra-auriculaires sans fil Bluetooth Jabra Elite 65t qui passent à 69,99 € livrés gratuitement. On les trouve ailleurs à partir de 110 €. Côté son, l'égaliseur personnalisable vous permet d'ajuster le rendu sonore tandis que la technologie avancée à quatre microphones supprime les bruits de fond lors des appels pour des conversations limpides. Au quotidien, ces écouteurs Jabra restent parfaitement en place et proposent même une fonction de commande vocale simplifiée. 

Enfin, vous apprécierez les 5 heures d'autonomie avec une seule charge, qui se transforment en 15 heures avec l'étui de recharge compact.  Les Jabra Elite 65t sont certifiés IP55 et offrent une garantie de 2 ans contre l’humidité et la poussière. Où que vous soyez et quelle que soit votre activité, vous profitez d’une liberté absolue pour les appels et la musique.


> Voir l'offre

Sujets relatifs
Solution pour convertir vos sous-titres SUP en SRT
Voici un site de sous-titres pour les films
Video :Log. SIMPLE pour changer les sous titres ??
sous titres pour film ?
Probleme pour lire les avi avec mon lecteur
avec quoi modifiez vous les sous titres srt??
Graver un DVD avec les sous-titres
encoder un film avec les sous titres!!!
graver avec les sous-titres
quelqun a un logiciel pour sous titrer les dvix
Plus de sujets relatifs à Code UTF8 pour les caractères avec accent pour vos sous-titres
 > Tous les forums > Forum Multimédia