Discuter:Sémato

Un article de Wikipédia, l'encyclopédie libre.

Pour Wikifier cet article, il faudra réviser le style et le contenu pour adopter un point de vue plus neutre. Dimitridf (d) 1 avril 2008 à 19:04 (CEST) Article révisé. De mon point de vue, l'article est maintenant wikifié. Dimitridf (d) 2 avril 2008 à 15:24 (CEST)


Cette page présente deux méthodes complémentaires sur la catégorisation sémantique dont l'une est implémentée dans le logiciel décrit. C'est une information neutre et utile car l'analyse de texte utilise régulièrement les deux approches. Il n'y a rien de promotionnel dans cette présentation.

Le débat au fond est ailleurs : doit-on permettre ou interdire des pages qui décrivent des logiciels? Les logiciels ont aujourd'hui une importance phénoménale et je ne crois pas qu'une encyclopédie moderne puisse en faire l'économie. Si certains veulent quand même tenir ce débat, il serait plus décent de le faire sur la bonne tribune, au Bistro peut-être, et non sur le dos d'un logiciel particulier. Pieradipol (d) 5 avril 2008 à 14:14 (CEST)

Les logiciels ne sont pas interdits sur WP: il y en a plusieurs de présents (vlc, nvu... voir la Catégorie:Logiciel) et il y a même un modèle d'infobox qui leur est dédié. Il n'y a pas de règle bien précise sur leur admission: d'après Wikipédia:Critères d'admissibilité des articles#Logiciel, il faut une notoriété a priori. C'est ce critère qui était au cœur du débat à la suppression il y a quelque temps (sur Wikipédia:Pages à supprimer/Sémato (logiciel)).
Le meilleur endroit pour lancer un débat sur les logiciels étant le Discussion Projet:Informatique à mon avis. Par contre, celui qui a posé ce bandeau ne précise pas sur cette page ce qu'il reproche à l'article; je vais lui poser la question. Romainhk (QTx10) 5 avril 2008 à 15:03 (CEST)
Je n'avais pas vu que cette page avait fait l'objet d'une procédure de suppression. Puisque le résultat a été la conservation, j'ai retiré la bandeau {{admissibilité}} que j'avais ajouté. Cependant, et c'est la raison de mon ajout, cet article ne contient aucun élément montrant la notoriété du logiciel (ce qui est étonnant pour un article conservé à l'issue d'une PàS et révisé depuis). Existe-t-il des sources externes et fiables pour confirmer les infos de l'article ? Même après avoir lu Pages à supprimer/Sémato, je ne vois pas en quoi cet article est admissible. --Christophe (d) 5 avril 2008 à 18:45 (CEST)
Dimitridf avait apparemment trouvé des références sur Google Scholar (cf. 'Neutre') mais elles ne figurent pas dans l'article. Romainhk (QTx10) 5 avril 2008 à 20:00 (CEST)
J'ai trouvé deux papiers faisant référence à Sémato. Le premier ne fait qu'une courte description du logiciel, et le second ne le décrit pas du tout :
  • [1] (page 15) : « logiciel informatique d’analyse textuelle SÉMATO, qui offre une catégorisation préalable du matériel qualitatif, permettant de guider le processus de codification. »
  • [2] (page 3)
Les 2 papiers ont parmi leurs auteurs des membres de l'université du Québec à Montréal (2 auteurs sur 3 pour le premier, 2 sur 2 pour le second). Difficile dans ce cas de les considérer comme des éléments probants de notoriété (ceci dit sans juger le logiciel sur son utilité / efficacité). Sémato a-t-il au moins fait l'objet d'une publication de la part de ses auteurs ? Je n'ai pas trouvé de réf sur le site. --Christophe (d) 6 avril 2008 à 10:55 (CEST)


Je croyais que le débat sur la notoriété était terminé avec la décision de non suppression de la page. Il semble que les règles ne soient pas respectées et que le débat se poursuit. Je crois donc utile d'apporter quelques informations supplémentaires.

Il faut en premier lieu comprendre que l'appellation Sémato a un peu plus de deux ans. Nos travaux préalables (les mêmes auteurs) ont conduit à la construction des logiciels Nomino et Termino qui ont reçu une audience internationale. Deux ans pour un logiciel, c'est court et pourtant, Sémato a déjà de nombreux utilisateurs. En 2007-2008 plus de 200 projets universitaires ont utilisé Sémato incluant plusieurs mémoires et thèses. C'est énorme pour ce domaine très pointu.

Sémato est aussi utilisé par des laboratoires importants qui l'ont déjà intégré comme outil de base :

Le MATEB (Groupe de recherche international en Biotechnologies) : http://mateb.uqam.ca/

La Chaire MCD (Mondialisation, Citoyenneté et Démocratie , Centre international reconnu entre autres pour son utilisation des techniques d'analyse du discours) : http://www.chaire-mcd.ca/ato-mcd/semato.html

Le Geirso (Groupe de recherche international sur l'étude de la chaîne du médicament) : http://www.geirsomedicaments.uqam.ca/partenaires/

Le Centre ATO reconnu internationalement depuis plus de 20 ans pour tous ses outils d'analyse de texte : http://www.ling.uqam.ca/ato/


Deux professeurs de méthodologie en analyse qualitative, Pierre Mongeau et Johanne Saint-Charles ont rédigé un Guide d'utilisation de Sémato : http://www.er.uqam.ca/nobel/r32700/Semato/Guide_Semato%202006.pdf

Leurs articles décrivent leur utilisation de Sémato et certains principes du logiciel. Voici quelques références récentes  :


--Saint-Charles, J. et Bélanger, D. (2006) « La sous-représentation politique des femmes militantes au sein de l’organisation syndicale à la CSQ », Université du Québec à Montréal, Département de communication sociale et publique, 58 pages.

--Saint-Charles, J., M.E. Rioux-Pelletier, D. Fournier et L. Gervais (à paraître). « Mieux comprendre les attentes et perspectives des jeunes travailleuses pour assurer la relève dans les groupes de femmes. » In Réflexion synthèse sur la question de l’intergénérationnel. Sous la direction de Anne Quéniart et Rock Hurtubise. Collection LSP des éditions ENSP.

--Saint-Charles, J., Fournier, D., Gervais, L. et Rioux-Pelletier, M. E. (2007). « Pour assurer la relève dans les groupes de femmes ; mieux comprendre les attentes et perspectives des jeunes féministes », Communication dans le cadre du colloque "Le féminisme québécois aujourd'hui : ouverture ou déradicalisation ?" de L’Alliance de recherche IREF/Relais-femmes sur le mouvement des femmes québécois, Montréal.

--Saint-Charles, J. et Mongeau, P. (2007) « The words that come to mind when I think of you », Communication dans le cadre du XXVIe International Sunbelt Social Network Conference, Corfu, Grèce.

Maillé, M.-È., Saint-Charles, J. et Lucotte, M. (soumise). « Scientists and Journalists: How to Bridge the Gap in Environmental Sciences? », Public Understanding of Science.

--Saint-Charles, J., Mongeau, P., Mertens, F., Mergler, D., Davidson, R. et Lucotte, M. (2006). « A communication perspective on knowledge sense making: participatory research on mercury in the Amazon », Communication (sur invitation) dans le cadre du Eighth International Conference on Mercury as a Global Pollutant, Wisconsin, États-Unis (août).

--Saint-Charles, J., Mongeau, P., Mertens, F., Farella, N., Davidson, R., Mergler, D. et Lucotte, M. (2006). « What are they really talking about? Paths of diffusion : quantitative and qualitative network analysis », Communication dans le cadre du XXVe International Sunbelt Social Network Conference, Vancouver, Canada.


Voici d'autres liens sur Sémato :

http://autokteb.org/2007/09/06/explorez-vos-textes-avec-semato/

http://www.amgagne.koumbit.org/Microsoft%20Word%20-%20Mon%20memoire%202005.pdf

http://www.santepub-mtl.qc.ca/Publication/pdfjeunesse/reussitescolairestmichel.pdf

http://www.sociopole.cnrs.fr/canada.htm

http://lajoie.uqam.ca/Lajoie-Legare-2005.pdf

http://www.cinbiose.uqam.ca/publications/auteurs.php (sélectionnez Johanne Saint-Charles)

http://aemdc.blogspot.com/2006/03/formation-semato.html

http://analyses.ishs.ulg.ac.be/logiciels/semato.html

http://www.cabuzel.com/home/?option=com_mamboz&Itemid=67&cat=/Informatique/Logiciels/Gestion


Dans sa prime enfance, Sémato a eu Guidexpert-ato pour nom (autour de 2005). On trouvera aussi :

http://www-sop.inria.fr/axis/cmi/preactes.pdf

http://www.er.uqam.ca/nobel/evalu/filemanager/fichiers/toto/HumaniTIC_01_01.pdf


Sémato est le dernier né des auteurs de deux logiciels très répandus : Nomino et Termino. Ces deux logiciels ont obtenu une reconnaissance universitaire internationale et Nomino a aussi eu un succès commercial remarquable : il a fait l'objet d'une start-up de 8 millions de dollars (http://www.nominotechnologies.com/). Ces logiciels ne sont pas Sémato mais la problématique en quelque sorte est toujours la même : comment aider à la catégorisation sémantique des textes. La notoriété elle, se transmet d'un logiciel à l'autre. Cette façon de voir est peut-être propre au monde des logiciels, mais elle est bien réelle et incontournable. Pensez aux différentes versions, successives dans le temps des systèmes d'exploitation. Dans un domaine très proche du nôtre, pensez aux logiciels Nudist et Nvivo (de Tom Richards).

Ainsi, pour Nomino, quelques liens :

http://isdm.univ-tln.fr/PDF/isdm6/isdm6a58_lelu.pdf

http://patrick.seguela.free.fr/these_ps_ch1.PDF

http://ftp.informatik.rwth-aachen.de/Publications/CEUR-WS/Vol-14/poitou/poitou.html

http://www-sop.inria.fr/acacia/personnel/Laurent.Alamarguy/these/WSM2004.pdf

http://www.droit.univ-paris5.fr/HTMLpages/enseignants/staff/delforge/recherche/publications/WsEKAW2000.pdf

http://www.cavi.univ-paris3.fr/lexicometrica/jadt/jadt2002/PDF-2002/lelu.pdf

http://www.olst.umontreal.ca/pdf/textHomme.pdf

http://recherche.univ-montp3.fr/rachel/spip/IMG/pdf/Anis.pdf

http://www.uquebec.ca/bp/actualite/0423/UQ1104.html

http://w3.univ-tlse2.fr:8880/erss/index.jsp?perso=rebeyrol&subURL=Articles/condamines_rebeyrolle_2004.pdf

http://www.ling.uqam.ca/forum/corpus/messages/3c.html

http://webu2.upmf-grenoble.fr/adest/seminaires/lelu02/ADEST2001_SA_AL.htm

http://desnotables.com/GESTIONDUFIEF.COM/Exemples/zerospam/cas/nomino/lancementmedia/template_journalistes.html

http://www.myriam.ca/blt6134/outils.html

http://portal.acm.org/citation.cfm?id=1283882

http://ftp.informatik.rwth-aachen.de/Publications/CEUR-WS/Vol-314/44.pdf

http://www.uquebec.ca/uqss/IRS_01/UQAM/data/2001D0909.html

http://citeseer.ist.psu.edu/761026.html

http://hypermedia.univ-paris8.fr/Hypertexte%20dynamique/riao2000.pdf

http://www.olst.umontreal.ca/pdf/DrouinPhD2002.pdf


et pour Termino, quelques liens :

http://www.few.vu.nl/~vmalaise/TheseVMalaise.pdf

http://atala.biomath.jussieu.fr/je/010310/Aussenac_Biebow_Szulman.resume.html

http://www.cavi.univ-paris3.fr/lexicometrica/jadt/jadt2004/pdf/JADT_092.pdf

http://www.ling.uqam.ca/sato/publications/bibliographie/Ind_lang.htm

http://www.realiter.net/spip.php?article682

http://www.uhb.fr/langues/balneo/html/inv9459.htm

http://www.sdc2006.org/cdrom/contributions/Jalabert_et_al_IC06.pdf

http://www.dit.bretagne.ens-cachan.fr/People/Claude.Jard/Stage04MIT1_YvesPol.pdf

http://www.revue-texto.net/Inedits/Rastier/Rastier_Terme.html

http://portal.acm.org/citation.cfm?doid=980451.980939


J'espère que ces informations vous permettront de clore le débat sur l'admissibilité de Sémato. Pieradipol (d) 6 avril 2008 à 18:44 (CEST)

Que le debat de suppression se soit conclus par le choix de conserver l'article ne doit pas empêcher la discussion sur le fond de l'article, à savoir le manque de sources permettant de vérifier les infos et accessoirement montrant la notoriété du logiciel (et, même si je n'en avais pas l'intention, il n'est pas interdit de reproposer un article à la suppression). L'utilisation du logiciel par des projets / laboratoires est justement le genre d'infos que j'attendais (et, je pense, qu'attendaient ceux qui avaient des réticences à conserver l'article) et qui devrait maintenant figurer dans l'article (si des sources sont disponibles à ce sujet). Serait-il possible d'intégrer ceci à l'article (parce que mettre ces infos seulement en page de discussion, ça ne vaut rien) ? --Christophe (d) 6 avril 2008 à 20:51 (CEST)
J'ai ajouté 4 liens sur la page. Cela ne vous semble pas suffisant ?Pieradipol (d) 6 avril 2008 à 21:12 (CEST)
Les sources ajoutées parlent du fonctionnement du logiciel, ce qui est déjà bien. Ce que j'ai voulu dire au-dessus, c'est que l'article gagnerait grandement à contenir des infos (sourcées) concernant la diffusion et l'utilisation du logiciel par d'autres laboratoires. A la lecture de l'article, on a pour l'instant l'impression que le logiciel n'est pas sorti de son labo d'origine (en tout cas, rien ne dit le contraire). --Christophe (d) 7 avril 2008 à 10:03 (CEST)
J'ai ajouté de nouvelles références (3 niveaux) :

1- Description du logiciel. Il ne faut pas s'attendre à trouver plusieurs descriptions de Sémato sur le WEB, car la documentation en ligne est très complète (plus de 200 pages). Une exception de taille toutefois : Le Guide d'utilisation de Sémato, livre-méthode, écrit par deux professeurs, à l'usage des étudiants en communication.

2- Centres d'utilisation. Des laboratoires ou des chaires d'enseignement. Ces liens ne décrivent pas Sémato, ce sont des exemples d'organismes universitaires intégrateurs. Plusieurs de leurs membres utilisant le logiciel, ils ont développé un support informatique adapté à leurs besoins. J'en ai mis deux, qui appartiennent à des univers très différents (sociologie et gestion).

3- Des forums d'information spécialisés. J'ai mis un lien sur un tel forum, spécialisé dans les logiciels d'analyse en littérature.

Le laboratoire d'origine de Sémato est le centre ATO, connu depuis 20 ans pour ses logiciels en analyse de texte. J'ai ajouté le lien.

En fait, des liens externes mis comme ça sans explication (sauf à lire la page de discussion) ne servent pas à grand chose. J'ai ajouté un petit paragraphe histoire de mieux présenter les choses. Ce n'est pas le tout de mettre des liens montrant l'utilisation du logiciel par d'autres labo. Ces liens doivent appuyer des propos : ici, il s'agit de dire tout simplement que le logiciel est utilisé par des labo/équipes tels que ..., ..., et ...
Pour le MATEB, le lien externe ne faisait pas référence à Sémato.
Il reste le lien vers autokteb.org que je ne sais pas trop comment introduire dans le texte. --Christophe (d) 8 avril 2008 à 08:37 (CEST)
Merci. J'ai corrigé le lien sur le MATEB, il fallait descendre sur ATO. J'ai aussi réintégré le forum en opposant ce type d'utilisation polpulaire à l'intégration de Sémato dans des chaînes de traitement informatique de laboratoires universitaires. Pieradipol (d) 8 avril 2008 à 13:58 (CEST)