|
La sémantique d’un récit : état de l’art et perspectives.Fionn Murtagh, Adam Ganz. La revue MODULAD, numéro 42, 2010.
Résumé
On s’intéresse ici à la sémantique
de l’information sous deux aspects : (i) l’ensemble de toutes les relations
binaires, (ii) la reconnaissance et le suivi des changements ainsi que des
anomalies. Dans le premier cas, on munit l’espace des textes ou des sous textes
d’un côté, et l’espace des mots de l’autre côté, d’ une métrique euclidienne
dans un cadre commun. Dans le deuxième cas, on modélise l’information par une
métrique ultramétrique. Une façon d’aboutir à une représentation euclidienne
consiste à faire une analyse des correspondances, qui s’applique par exemple à
des tableaux en entrée de fréquences. A partir de la représentation
euclidienne, on munit l’espace de l’information d’une ultramétrique qui permet
de construire une classification hiérarchique. En l’occurrence dans ce travail,
on contraindra l’ultramétrique à respecter l’ordre induit par les séquences
temporelles. Après une revue de l’existant pour l’analyse de la sémantique des
scripts de films, on s’intéresse à la question suivante : serait-il
possible d’analyser de façon analogue la sémantique de la littérature de la
recherch
Mots clés
Analyse des correspondances,
classification ascendante hiérarchique, classification sous contrainte de
contiguïté, analyse textuelle
Abstract
We study
two aspects of information semantics: (i) the collection of all relationships,
(ii) tracking and spotting anomaly and change. The first is implemented by
endowing all relevant information spaces with a Euclidean metric in a common
projected space. The second is modeled by an induced ultrametric. A very
general way to achieve a Euclidean embedding of different information spaces
based on cross-tabulation counts (and from other input data formats) is
provided by Correspondence Analysis. From there, the induced ultrametric that
we are particularly interested in takes a sequential – e.g. temporal – ordering
of the data into account. Following a review of approaches adopted in the
analysis of filmscript we look at how similar approaches can be applied to the
scholarly literature.
Key words
Correspondence
Analysis, hierarchical clustering, contiguity constrained clustering, text
analysis
Article
|