Utilisateur:Habddou

Un article de Wikipédia, l'encyclopédie libre.


Sommaire

[modifier]

TER SUJET 25 : Calcul de vecteurs conceptuels à partir d'un réseau lexical étiqueté pondéré.

[modifier] Sujet

Pour chaque terme et sens du réseau de JeuxDeMots [1]et [2], on souhaite calculer de façon itérative un vecteur conceptuel. Pour le vecteur d'un noeud donné du réseau, son calcul se fait comme une fonction des vecteurs des termes auxquels ce noeud est relié (les relations étant orientées, étiquetées et pondérées). Si aucun vecteur n'est disponible pour un noueud voisin, ce dernier est tiré au hasard. Une opération de séparation (sur la base d'un modèle de particules se repoussant via une force en 1/d**2) est ensuite appliqué de façon à "écarter" les vecteurs accidentellement proches. Il s'agira de modéliser précisément ce modèle et de l'expérimenter en grandeur réelle.


[modifier] Encadrant

  • Mathieu Lafourcade [3].

[modifier] Membres du groupe

  1. LOPEZ Cedric : tatinos34@hotmail.com
  2. ZOUANI Abderrahmane : habddou@hotmail.com


[modifier] Buts

  • Calculer un vecteur global (taille 1000 par défaut).
  • Repulsion entre les vecteurs.

Supplementaires:

  • Calculer un vecteur pour chaque type de relation.
  • L'application php/mysql doit être capable de tourner sans arrêt (->approche incrémentale)

[modifier] Langages utilisés

  • SQL: mySQL
  • PHP5


[modifier] Notions à connaître

  • Vecteur conceptuel : voir publications de M.Lafourcade [4].
  • Calcul d'un vecteur .
  • Modele Particulaire : particules qui se repoussent

Les particules de charges ayant le même signe se repoussent, et s'attirent si elles ont des signes différents.

eid : id de la relation
t : type de la relation
w : poids
wr: poids de la relation

Pour chaque noeud, calculer un vecteur conceptuel avec représentation du sens. Trouver le chemin le plus court dans le réseau de mots. Pour calculer la valeur du vecteur : produit scalaire + cos proche de 1 : si proche de 1 alors colinéaire donc vecteur identique.

Structure de données pour calculer si 2 vecteurs sont proches ou pas -> méthode par émergence.

au départ :

  • fixer la taille des vecteurs (100)
  • quel est le vecteur de ce mot
  • si il n'existe pas on le trie au hasard.
  • Tous les vecteurs ont la même norme.

Pour la répulsion : (noeud=vecteur)

  • Chercher les 10 points les plus proches,
  • Les comparer avec tous les autres (utiliser un prog JAVA ou C pour faire le calcul) Prog pouvant être fourni par l'encadrant.

Base de données : pour être exploitable il faut avoir une version compilé de ce savoir ==> les vecteurs.

NB : réfléchir sur la taille idéale d'un vecteur.


[modifier] Base de Données

On a crée une base de données avec deux tables dans mysql.

  • la premiere table contient les données : eid(identifiant), mot, vecteur( a crée a partie de fonctions php).
  • La deuxieme table contient les données: rid(identifiant de la relation), eid1(identifiant du premier mot), eid2( (identifiant du deuxiéme mot), w(poid de la relation) .

[modifier] Fonctions

Pour avoir les vecteurs conceptuels voulus on a crées plusieurs fonctions, en suivant les étapes suivantes:

1. Crée un vecteur conceptuel au hasard si il n'existe pas.
2. Coder le vecteur dans la base de données mySql, et le décoder pour faire des opération comme calcul de la norme et l'addition de vecteurs.
3. Calcul d'un vecteur conceptuel en additionnant les vecteurs qui sont en relation avec lui selon le poids de la relation.

  • Détails:

Pour chaque mot on regarde dans la base s’il n’a pas encore de valeur on lui attribue une valeur au hasard selon un codage qu’on a mit en place avec deux fonction une pour coder et l’autre pour le décoder. S’il existe on commence le calcul du vecteur global avec une fonction itérative qui le calcule en addition le vecteur lui même avec tout les vecteurs qui sont en relation avec lui, en multipliant à chaque fois le poids de chaque relation avec son vecteur.

  • Fonction random1000($eid) : insere un nouveau vecteur dans la base suivant le eid et le retourne (tableau).
  • Fonction lireVecteur($eid) : retourne le vecteur ( tableau) correspondant à eid si il existe sinon elle le fabrique et le retourne.
  • Fonction Vecteur2String ($vecteur): notre vecteur est définie sous forme de tableau de 1000 cases, pour chaque case cette fonction transforme notre vecteur en chaîne.
  • Fonction String2Vecteur ($string): transforme la chaîne crée en vecteur .
  • Fonction normeVecteur($eid): renvoie la norme d'un vecteur en calculant la racine carré de la somme des carrés de tout les éléments du tableau .

La forme du vecteur :

x1 x2 x3 x4 ...... x1000

La norme = racine ( (x1)² + (x2)² + (x3)² + ....(x1000)² ) .

  • Fonction sommeVecteur($vecteur) : calcul la somme des vecteurs avec la formule V1 = V1+ W*V2 .

[modifier] Planning

  • 29 Janvier : Premiere reunion avec l'encadrant .
  • 6 Fevrier : Cahier de charges à rendre .

- Le titre du projet
- Les noms des encadrants
- Les noms des étudiants (ayant effectivement participés aux réunions età sa rédaction)
- Une présentation du sujet (pas la recopie de ce qui est sur mon siteweb) en 1 ou 2 pages : contexte, objectifs, contraintes...
- Une présentation du planning de travail envisagé explicitant quels sontles résultats escomptés et à quelles échéances
- Une présentation de la méthode de travail mise en place : quelle répartition entre les différents membres, quelle communication entre les membres et avec les encadrants.
- Enfin, un schéma de synthèse (type diagramme de Gantt) représentant la répartition temporelle (et la durée) de chacune des différentes tâches identifiées (en précisant leurs exécutants) dans le projet sur les 14semaines du TER (du 16 janvier au 25 avril).


  • 4 Avril : debut de la redaction du rapport .


  • 25 Avril : Rapport à rendre .

[modifier] LE FORUM

[modifier] Notes et références

[1] jeux de mots : http://www.lirmm.fr/jeuxdemots .
[2] Le Rézo : http://www.lirmm.fr/jeuxdemots/rezo.php .
[3] http://www.lirmm.fr/~lafourcade .
[4] publications : http://www.lirmm.fr/~lafourcade/ML-biblio/lafourcade-publications.html .

Vecteur conceptuel :
http://www.lirmm.fr/~lafourcade/ML-biblio/MMA2001/MMA-CONCEPVECv6.pdf
http://www.lirmm.fr/~schwab/Publications/SLL-taln2007-VF.pdf
http://www.atala.org/doc/actes_taln/AC_0042.pdf
http://www.cavi.univ-paris3.fr/lexicometrica/jadt/jadt2002/PDF-2002/schwab_lafourcade_prince.pdf.

Electromagnetisme :
http://www.cerimes.education.fr/e_doc/forces/electromagnetique.htm .
http://pagesperso-orange.fr/jean-jack.micalef/theme_28.html.
http://fr.wikipedia.org/wiki/Gravitation .

La Norme et la distance :

http://fr.wikipedia.org/wiki/Norme_%28mathématiques%29 .
http://fr.wikipedia.org/wiki/Distance_%28mathématiques%29 .


Notion de vecteur avec TAl : http://www.google.fr/search?hl=fr&q=873+concepts+larousse&btnG=Recherche+Google&meta= .