Le hasard a aidé Dominique Labbé quand il lui a permis de démontrer que Corneille est l’auteur des principaux chefs d’œuvre joués sous le nom de Molière : Tartuffe, Dom Juan, Le Misanthrope, L’Avare… Mais la chance ne sert que ceux qui sont préparés à la recevoir.
C’est durant l’été 1967, à l’occasion d’un « travail d’étudiant », que Dominique Labbé a pu entrevoir la puissance des ordinateurs et leurs applications possibles dans les sciences humaines et sociales, notamment le traitement de la langue.
Sa thèse sur le discours communiste (à la Fondation des Sciences Politiques de 1969 à 1975) figure parmi les premières études françaises couplant l’informatique et la statistique appliquée au langage. Il a ensuite généralisé ces outils au discours politique – notamment François Mitterrand et Charles de Gaulle, les déclarations gouvernementales – mais aussi au vocabulaire syndical, à la langue des affaires et, enfin, à l’ensemble de la littérature française moderne (XVIIe – XXe siècles).
Depuis 1969, Dominique Labbé a mis au point des calculs adaptés à l’étude de la langue et, surtout, il attache, à chaque mot, une étiquette comportant sa graphie standardisée, sa catégorie grammaticale et son « entrée de dictionnaire » (par exemple, l’infinitif du verbe). Ces techniques d’étiquetage (ou « lemmatisation ») se sont généralisées dans le monde entier à partir des années 1980. Mais, en France, la modélisation, comme l’étiquetage, ont été récusés par les principaux responsables de la recherche en informatique appliquée au langage. Ces choix condamnent probablement le français à la marginalisation dans un siècle dominé par les industries de la langue et de l’information. Les travaux de Dominique Labbé suggèrent qu’une autre voie aurait peut-être été possible. Sans doute est-ce pour cela qu’ils sont passionnément discutés.
Depuis la publication de Corneille dans l’ombre de Molière, le travail de Dominique Labbé a été l’objet d’une vive polémique. L’auteur a répondu de manière circonstanciée aux arguments qu’on lui opposait dans un texte accessible en ligne.