AccueilAccueil  ­PortailPortail  ­CalendrierCalendrier  ­FAQFAQ  ­RechercherRechercher  ­S'enregistrerS'enregistrer  ­ConnexionConnexion  
Poster un nouveau sujet   Répondre au sujetPartager | 
 

 [Bases] Détecter la langue d'un texte

Voir le sujet précédent Voir le sujet suivant Aller en bas 
AuteurMessage
XWindoo
Admin


Nombre de messages: 67
Classement: non classé
Concours gagnés: aucun
Points: 0 pts
Date d'inscription: 14/05/2008

MessageSujet: [Bases] Détecter la langue d'un texte   Dim 30 Nov - 17:20

Détecter la langue d'un texte



Nouveau concours destiné aux débutants. Cette fois-ci, vous devez, à partir d'un texte, détecter la langue dans laquelle il est écrit. Difficile à première vue scratch , surtout pour un concours débutant...


Epreuve

Détecter la langue d'un texte est en fait assez simple. Pour cela, on utilise l'analyse fréquentielle des lettres. C'est à dire que l'on va chercher combien de fois une lettre apparait dans une texte. Mais quel rapport avec la langue Suspect ? Eh bien suivant chaque langue, la fréquence moyenne d'utilisation d'une lettre dans un texte change. Par exemple, dans le français, la lettre qui revient le plus est la lettre E. En comparant donc les fréquences des lettres entre le français et l'anglais par exemple (http://fr.wikipedia.org/wiki/Analyse_fr%C3%A9quentielle), on constate que la lettre H apparait très peu dans le français (0,77%) alors qu'elle apparait beaucoup dans l'anglais (5.27%); et inversement pour le U.

Je vais donc vous donner la méthode générale pour trouver la langue d'un texte :
Dans un premier temps, vous cherchez combien de fois une ou plusieurs lettres (les lettres H et U sont bien adaptées) apparaissent dans un texte puis vous exprimez le résultat en pourcentage (nombre d'apparition de la lettre sur le nombre total de lettres, en excluant les espaces).
Ensuite, vous cherchez le pourcentage moyen, entre celui du français et celui de l'anglais, correspondant à la lettre étudiée, qui se rapproche le plus de votre résultat. Vous faite ce test pour chaque lettre.
Une fois les tests réalisés, vous serez en mesure de donner la langue du texte.


Vous l'avez compris, vous devez faire un programme qui permet de déterminer la langue d'un texte écrit soit en français soit en anglais.
Vos tests devrons porter sur n'importe quel texte. Le web en est rempli, il suffit de faire un copier-coller. Prenez de préférence des textes assez long. L'analyse n'en sera que meilleure.



Fin de l'épreuve

Vous avez deux semaines.
Fin de l'épreuve : samedi 13 décembre à minuit


Participants

Gratte


Dernière édition par XWindoo le Dim 30 Nov - 20:23, édité 1 fois
Revenir en haut Aller en bas
Voir le profil de l'utilisateur http://microcontest.forumstech.com
gratte



Nombre de messages: 32
Age: 19
Localisation: le larderet (week end + vacs) et poligny (semaine)
Classement: 3e
Concours gagnés: aucun
Points: 0 pts
Date d'inscription: 11/11/2008

MessageSujet: Re: [Bases] Détecter la langue d'un texte   Dim 30 Nov - 19:44

je me jete a l'eau, je participe :$ je sais que je suis pas gater mais tant pi (lol)

après tout je sais compter les voyelles (lol)
Revenir en haut Aller en bas
Voir le profil de l'utilisateur
Th3.Truth.Z



Nombre de messages: 23
Classement: 1er (ex-aequo)
Concours gagnés: 1
Points: 0 pts
Date d'inscription: 11/11/2008

MessageSujet: Re: [Bases] Détecter la langue d'un texte   Ven 5 Déc - 20:05

yop, moi jm'inscris, domage que la méthode soit déjà donnée mais c'est pas grave.

Quel est le critère pour le classement? Ou il faut seulement réussir?
Revenir en haut Aller en bas
Voir le profil de l'utilisateur
XWindoo
Admin


Nombre de messages: 67
Classement: non classé
Concours gagnés: aucun
Points: 0 pts
Date d'inscription: 14/05/2008

MessageSujet: Re: [Bases] Détecter la langue d'un texte   Ven 5 Déc - 22:07

Heu... y'a pas de critères a priori...
Revenir en haut Aller en bas
Voir le profil de l'utilisateur http://microcontest.forumstech.com
 

[Bases] Détecter la langue d'un texte

Voir le sujet précédent Voir le sujet suivant Revenir en haut 
Page 1 sur 1

Permission de ce forum:Vous ne pouvez pas répondre aux sujets dans ce forum
μContest :: Concours C/C++ :: Intelligence artificielle-
Poster un nouveau sujet   Répondre au sujet