Détecter la langue d'un texte
Nouveau concours destiné aux débutants. Cette fois-ci, vous devez, à partir d'un texte, détecter la langue dans laquelle il est écrit. Difficile à première vue

, surtout pour un concours débutant...
EpreuveDétecter la langue d'un texte est en fait assez simple. Pour cela, on utilise l'analyse fréquentielle des lettres. C'est à dire que l'on va chercher combien de fois une lettre apparait dans une texte. Mais quel rapport avec la langue

? Eh bien suivant chaque langue, la fréquence moyenne d'utilisation d'une lettre dans un texte change. Par exemple, dans le français, la lettre qui revient le plus est la lettre E. En comparant donc les fréquences des lettres entre le français et l'anglais par exemple (
http://fr.wikipedia.org/wiki/Analyse_fr%C3%A9quentielle), on constate que la lettre H apparait très peu dans le français (0,77%) alors qu'elle apparait beaucoup dans l'anglais (5.27%); et inversement pour le U.
Je vais donc vous donner la méthode générale pour trouver la langue d'un texte :
Dans un premier temps, vous cherchez combien de fois une ou plusieurs lettres (les lettres H et U sont bien adaptées) apparaissent dans un texte puis vous exprimez le résultat en pourcentage (nombre d'apparition de la lettre sur le nombre total de lettres, en excluant les espaces).
Ensuite, vous cherchez le pourcentage moyen, entre celui du français et celui de l'anglais, correspondant à la lettre étudiée, qui se rapproche le plus de votre résultat. Vous faite ce test pour chaque lettre.
Une fois les tests réalisés, vous serez en mesure de donner la langue du texte.
Vous l'avez compris, vous devez faire un programme qui permet de déterminer la langue d'un texte écrit
soit en français soit en anglais.
Vos tests devrons porter sur n'importe quel texte. Le web en est rempli, il suffit de faire un copier-coller. Prenez de préférence des textes assez long. L'analyse n'en sera que meilleure.
Fin de l'épreuveVous avez deux semaines.
Fin de l'épreuve :
samedi 13 décembre à minuitParticipantsGratte