De l’Ontologie philosophique aux ontologies informatiques : implications sémantiques d’un passage du singulier au pluriel
Charles Bodon est titulaire d’un master LoPhiSc : Logique, Philosophie des Sciences et Philosophie de la Connaissance de l’Université Paris 1 Panthéon-Sorbonne.
Résumé :
Cet article se propose de tracer les liens théoriques qu’entretiennent l’intelligence artificielle et certaines traditions philosophiques à propos de l’ontologie, du langage, et de l’esprit. On tâchera de mettre en perspective ce en quoi l’intelligence artificielle contemporaine hérite, poursuit, et renouvelle de façon pratique des problématiques anciennes concernant les caractéristiques de l’intelligence humaine et la représentation des connaissances. En introduisant les ontologies informatiques, on cherchera à présenter l’importance des sciences humaines aujourd’hui pour la recherche en intelligence artificielle, tout en soulignant le dialogue permanent que celle-ci a pu entretenir avec la philosophie à travers l’histoire. On conclura en défendant l’intérêt de ces outils pour l’interdisciplinarité des sciences.
Mots clefs : Intelligence artificielle – Ontologie – Ontologies informatiques – Philosophie du langage – Interdisciplinarité
Abstract:
This article sets out to trace the theoretical links between artificial intelligence and certain philosophical traditions about ontology, language, and the mind. We will try to put into perspective what contemporary artificial intelligence inherits, pursues, and practically renews ancient issues concerning the characteristics of human intelligence and knowledge representation. By introducing computer ontologies, we will seek to present the importance of the human sciences today for research in artificial intelligence while emphasizing the permanent dialogue that it has been able to maintain with philosophy throughout history. We will conclude by defending the interest of these tools for the interdisciplinarity of science.
Keywords: Artificial intelligence – Ontology – Computer ontologies – Philosophy of language – Interdisciplinarity
Introduction
Le nom « intelligence artificielle » (IA) est techniquement né en 1956 lors de la conférence de Dartmouth organisée (entre autres) par Marvin Minsky et John McCarthy. Cette révolution technologique ayant pour précurseurs théoriques les articles d’Alan Turing On computable numbers (1936-37) où il développe le concept de « machine universelle » (qu’il convient d’appeler aujourd’hui « machine de Turing »), et Computing Machinery and Intelligence (1950) où il introduit le célèbre « test de Turing » visant à déterminer la possibilité qu’une telle machine soit douée de pensée.
De cet héritage sont issues les ontologies informatiques. Apparus au début des années 1990-2000, ces modèles informatiques ont pour spécificité d’entretenir une parenté par leur nom et démarche avec l’ontologie en philosophie. Tout en les présentant ainsi que leur lien avec l’ontologie philosophique, il va s’agir ici d’insister sur le caractère social qu’impliquent naturellement ces outils. Car, cette technologie, loin d’ignorer les critiques que la philosophie a su adresser aux sciences cognitives, permet une réactivation et un réinvestissement de certaines problématiques philosophiques au cœur des sciences formelles. Ce qui, comme on va le soutenir, favorise l’interdisciplinarité et l’unité de la science en général plutôt que son essaimage.
I. Philosophie et Informatique
I.1. Un être qui se comprend en plusieurs sens
Avant d’introduire les ontologies informatiques, il convient de présenter brièvement l’origine historique du terme « Ontologie » pour en comprendre la correspondance avec la représentation des connaissances en IA. Son cheminement historique étant plus que large et ses définitions dépendantes des conceptions philosophiques, on ne s’attardera que sur quelques caractères de cette notion. Ceux-ci vont permettre de voir comment l’Ontologie va progressivement s’introduire dans les domaines de la logique mathématique et de l’intelligence artificielle, tout en conservant ses problématiques métaphysiques.
Il est cependant difficile de donner une définition unique de ce qu’est l’Ontologie. Car, en donner une définition particulière c’est déjà s’engager dans un certain parti pris théorique et conceptuel, alors que cette discipline se veut justement universelle. On assumera donc ici pleinement l’orientation formelle et analytique que l’on va suivre et qui sied à celle des ontologies informatiques que l’on va présenter. L’usage de la majuscule et du singulier pour « l’Ontologie » va progressivement se distinguer de la minuscule et du pluriel associés aux « ontologies » informatiques, et ce changement de nombre ne sera pas sans importance pour qualifier certains des enjeux théoriques et pratiques associés à ces machines.
Car, comme on va tâcher de le défendre ici, les ontologies informatiques font passer l’Ontologie d’une pensée sous le paradigme traditionnel de l’Un, de l’Être, à celui de la multiplicité des langages, des agents, et des ontologies au sens philosophique du terme. On emploiera donc la majuscule lorsqu’on se référera de manière générale à la branche de la métaphysique qu’est l’Ontologie, et la minuscule pour parler de son rapport à l’informatique ou une tradition philosophique spécifique.
Issue du grec ancien ôn, ontos, qui veut dire « être » et de logos, signifiant « discours », « étude », « science », l’Ontologie désigne en philosophie la « science de l’être ». Dans un premier temps, on peut dire naïvement que l’Ontologie pose la question « qu’est-ce qui est ? » [1]. Les questions spécifiques que pose l’Ontologie peuvent-être : Quelle est la relation d’un objet avec ses propriétés ? Qu’est-ce qui assure l’identité à travers le temps ? Qu’est-ce qui fonde l’unité des objets ? Qu’est-ce qu’un monde ? Est-ce que l’existence est une propriété ?[2]
Ces questions vont notamment se poser chez les ingénieurs informaticiens quand il s’agira de définir « l’enquête ontologique » pour construire les ontologies : c’est-à-dire choisir le mode d’existence des entités que l’on va défendre dans une ontologie (réalisme, idéalisme, conceptualisme, ou autre). Car toutes les ontologies informatiques ne suivent pas la même enquête et cette divergence de point de vue chez les ingénieurs s’inscrit depuis l’histoire même de l’Ontologie. À propos de « ce qui est », les philosophes ont eu différentes conceptions qui peuvent s’illustrer par trois principaux programmes d’ontologies philosophiques dont vont hériter les ontologies informatiques contemporaines[3].
Tout d’abord, une partie de « l’ontologie aristotélicienne » (si l’on peut la qualifier ainsi bien que son existence précède d’environ 2000 ans l’apparition du terme « Ontologie » au xvie-xviie siècle) peut être considérée comme une métaphysique des modes d’accusation de l’être qui recherche selon quels sens « l’être » peut être désigné. Ce projet s’illustre par cet extrait en Métaphysique Γ (IV), 2 (1300a-1005a) : « L’être se prend en plusieurs acceptions, mais c’est toujours relativement à un terme unique, à une même nature déterminée. ».
On peut comprendre cette formule d’Aristote dans le sens où l’on peut dire de plusieurs façons « ce qui est », mais que toutes ces façons ont en commun le fait de se rapporter à une notion plus fondamentale qu’est « l’Être ». On trouve en cela plusieurs catégories pour le désigner : Substance, Quantité, Qualité, Relation, Lieu, Temps, Posture, Possession, Action, Affect. L’ensemble de ces catégories va ensuite être récupéré par les logiciens modernes du xxe et xxie siècle afin de formaliser ce qui sera appelé le « calcul des prédicats », lequel sera la logique de base utilisée par les ontologies informatiques pour formaliser les entités d’un domaine.
L’autre approche de l’Ontologie que l’on peut considérer comme une influence pour les ontologies informatiques est l’ontologie formelle que développe Edmund Husserl dans ses Recherches Logiques au début du xxe siècle. En partant du projet cartésien de fondation de la philosophie en tant que science suivant la Mathesis Universalis, la recherche d’une mathématique universelle, il fera de son ontologie une étude des formes et relations grâce à une assimilation de la logique à l’Ontologie.
L’ontologie formelle husserlienne cherche à définir ce qui constitue l’existence à partir de sa manifestation formelle. Elle vise à déterminer les relations entre les catégories de l’être à partir de formes logiques pures : Objet, État de choses, Propriétés, Nombre, Relation, Ordre, Tout, Partie, etc. C’est entre autres cette concentration sur les relations entre les catégories dont vont hériter les ontologies informatiques : ce seront avant tout les relations formelles que les entités entretiennent entre elles qui vont être calculées dans ces artefacts informatiques.
C’est ensuite par le courant de la philosophie analytique que l’Ontologie va approfondir son lien avec la logique et la philosophie du langage. Chez Quine (1948) l’Ontologie va prendre place dans la structure et la sémantique du discours d’une théorie scientifique. Pour Quine, on peut établir une correspondance entre le discours scientifique et la validité de l’inférence logique qui traite des relations entre des catégories formelles comme la proposition, la vérité, le sujet, le prédicat, etc. L’ambition d’un tel programme étant de pouvoir tenir un discours scientifique et clarifié sur l’Ontologie en délimitant le pouvoir expressif de ses énoncés à la syntaxe logico-mathématique. Ce passage se caractérise entre autres par le rejet de l’implicite métaphysique de l’expression « ce qui est » à laquelle va être substituée l’expression « il-y-a ».
Glissement sémantique qui n’est pas sans importance. Car, l’on passe ici d’une ontologie comme étant une recherche à propos de l’identité fondamentale de l’Être et du principe universel de ses manifestations, à une considération de l’ontologie comme étant un stock d’entités quantifiables comprises dans un domaine fini, localisé, et dont on peut faire l’inventaire en évacuant certaines notions métaphysiques non réductibles au format logique.
Le critère pour qu’une entité appartienne au discours scientifique (« l’engagement ontologique » selon le mot de Quine) sera ici de pouvoir la réduire à une variable (x, y, z,…) liée à un quantificateur logique existentiel « ∃ » ou universel « ∀ ». C’est notamment cette approche logico-linguistique de l’Ontologie qui va permettre à un système informatique comprenant au moins la logique du premier ordre de lire, interpréter, et donner une représentation des entités en les quantifiant. Ceci par exemple avec des formules (ici simples) où P est un prédicat quelconque, tel que : ∃xPx = Il existe un x qui est P ; ∀yPy = Pour tout y, y est P. Toute entité ne pouvant appartenir au discours logique ne fait donc pas partie de l’ontologie telle qu’on l’a définie.
Ce bref panorama de l’origine philosophique du terme « Ontologie » ainsi que sa progressive mise en relation avec la logique va permettre d’expliciter maintenant comment peut être définie une ontologie informatique aujourd’hui.
I.2. La représentation formelle des connaissances et ses définitions
Les ontologies informatiques héritent particulièrement du premier courant de l’IA, l’IA dite « symbolique », qui considère que l’intelligence est un système computo-symbolique qui consiste à manipuler des signes linguistiques et mathématiques pour calculer et représenter des concepts. Cette approche sera notamment théorisée à l’aide de ce que Minsky (1974) va nommer des « cadres » (frames). Un cadre est un modèle qui sert à représenter une connaissance complexe ou une scène du monde en la traitant comme un ensemble fini composé de sous-ensembles et d’éléments simples (à la manière d’une mosaïque ou du pointillisme) qui, une fois reliés entre eux par des relations logiques, donnent une image complète (un souvenir d’enfance, un salon d’appartement, un goûter d’anniversaire, une fontaine qui s’illumine).
C’est ensuite John McCarthy en 1980 qui va récupérer le terme « Ontologie » pour l’appliquer à l’intelligence artificielle. Cette récupération peut être controversée, car les ontologies informatiques ne sont pas des réflexions théoriques ou conceptuelles sur la nature de « l’Être ». En suivant la tradition analytique, les ontologies n’ont pas la prétention ni la même démarche métaphysique que leur homonyme philosophique. Elles ne visent par conséquent pas à décrire les causes, conditions ou principes premiers d’un champ scientifique ni des objets qu’il contient. Il s’agit moins de définir la nature profonde des objets (comme pouvait chercher à le faire l’ontologie aristotélicienne ou tout autre ontologie fondamentale), que de cartographier des entités et leurs relations (conceptuelles, sociales, linguistiques) dans un domaine précis.
Une telle récupération du mot « Ontologie » au sens analytique du terme se justifie alors par le fait que les ontologies informatiques permettent de répliquer techniquement la démarche inventoriale à la base du programme de l’ontologie logique.
Pour approcher une première définition de ce qu’est une ontologie informatique, on peut dire sobrement qu’il s’agit d’un outil ou artefact informatique qui représente les entités, les énoncés, et la connaissance d’un domaine de spécialité. Cependant, au fil des années plusieurs définitions se sont proposées. Bien qu’elles s’accordent généralement sur l’usage communautaire de ces outils, elles ne se rejoignent pas nécessairement sur l’enquête ontologique à suivre. Par exemple :
Il s’agit du terme utilisé se référant à la compréhension partagée d’un domaine d’intérêt qui peut être utilisé comme cadre unificateur pour résoudre les problèmes de communication entre les gens et d’interopérabilité entre les systèmes. (Uschold & Gruninger, 1996)
Une ontologie est un catalogue des types de choses supposées exister dans un domaine, du point de vue d’une personne utilisant un langage pour parler du domaine. (Sowa, 1999)
Une ontologie est un artefact de représentation, compris comme une taxonomie dont le but est de modéliser les relations et combinaisons entre classes d’objets et universaux. […] Elles représentent (ou cherchent à représenter) la réalité de manière à ce que différentes personnes puissent comprendre les termes qu’elles contiennent[4]. (Arp, Smith, Spear, 2015)
Cependant, une des premières définitions données par Gruber (1993) fait généralement consensus, et c’est celle-ci que l’on suivra ici : « Une ontologie est une spécification partagée d’une conceptualisation. ».
On peut la comprendre ainsi : une ontologie représente une tentative de consensus à propos d’un domaine scientifique dont les connaissances et objets sont préalablement définis conceptuellement. Un concept représentant l’idée d’un objet, ou la manière dont on parle de l’objet, plutôt que l’objet matériel en tant que tel. Il est important de retenir que les modèles des ontologies informatiques sont précisément des représentations formelles qui restent limitées à un contexte informatique. Par conséquent, les ontologies informatiques ne visent pas à capturer directement l’objet en question, mais plutôt à modéliser celui-ci à partir de concepts qui lui font référence.
Mais, les concepts utilisés pour un domaine en particulier ne sont pas les mêmes pour toutes les ontologies informatiques. Pour ainsi dire, et comme en témoigne la liste non-exhaustive des définitions présentées, il existe autant d’ontologies informatiques qu’il y a d’enquêtes ontologiques possibles. Selon que le domaine à représenter soit un domaine précis et restreint (par exemple une pathologie rare en pneumologie et son traitement) ou plus généraliste (par exemple l’inventaire des philosophes occidentaux au xxe siècle), alors les propriétés à retenir et les concepts à formaliser ne se construisent pas de la même manière.
Il existe en effet plusieurs types d’ontologies ne traitant pas des mêmes entités. Certaines s’occupant d’objets concrets (en médecine par exemple l’objet « cœur » ou plus précisément encore l’objet « ventricule droit »), d’autres de concepts abstraits (le Temps, l’Espace, le Processus), ou encore certaines d’entités « passerelles » permettant de lier entre eux entités concrètes et concepts abstraits[5]. Aussi, pour favoriser l’interopérabilité entre des ontologies de différents domaines, une des méthodes possibles consiste à construire une ontologie spéciale dans le cadre théorique et métaphysique d’une ontologie générale déjà existante dite « fondationnelle » ou « top-ontology » (par exemple BFO, DOLCE, OntoMénélas), et dont le réalisme que celle-ci suit sert alors de référence à plusieurs ontologies particulières.
D’un point de vue de l’histoire de la représentation des connaissances, ces outils informatiques sont également l’aboutissement de nombreuses traditions comme le rapportent Declerck & Charlet (2014) et Monnin (2015).
Les ontologies informatiques héritent : a) des structures hiérarchiques d’organisation des étants comme l’arbre de Porphyre au iiie siècle, b) de la systémique des classifications taxonomiques en biologie, c) des réseaux sémantiques représentant formellement les associations d’idées et de concepts entre eux, d) du projet de création d’un langage mathématique universel (la caractéristique universelle) de Leibniz, e) de l’analyse sémiotique initiée par les graphes existentiels du logicien Charles Sanders Peirce au xixe siècle, f) jusqu’à leur réintroduction dans les années 1980 par John Sowa sous la dénomination de « graphes conceptuels » pour l’ingénierie des connaissances et l’intelligence artificielle.
C’est par l’informatisation de ces représentations hiérarchiques de l’existant et différentes méthodologies de calcul et de formalisation des connaissances que les ontologies informatiques vont apparaître.
D’un point de vue formel, l’ontologie informatique est un treillis : il s’agit donc d’une structure algébrique qui admet différentes relations d’ordre sur ses éléments. L’ontologie informatique se présente ainsi comme une collection d’entités classées et ordonnées, avec pour spécificité de préciser le type de relation que ces entités entretiennent entre elles. Utilisant entre autres le langage informatique OWL (Web Ontology Language), les ontologies organisent les entités en les définissant par classes (par exemple, la classe « Félins ») et en instances (ou individus) de classes (par exemple, un chat nommé « Ulysse » qui appartient à la classe « Félins »).
La relation de subsomption « est_un » est généralement la plus usitée : il s’agit d’une relation d’inclusion où un concept particulier est compris dans un autre plus général (par exemple pour donner la proposition « Ulysse est_un Félin »). Elle permet de représenter des relations sémantiques telles que l’hyperonymie, l’hyponymie, la synonymie, et autres. Ces relations entre entités peuvent ensuite être calculées par la machine, ce qui permet par exemple en médecine d’analyser l’hérédité ou risques de transmissions d’une pathologie et ainsi de servir de système d’aide à la décision pour un médecin. Par exemple : si A possède la propriété génétique B, que B est une propriété qui se transmet aux descendants, et que C est un descendant de A, la machine peut déduire que C hérite de B.
En plus de leur puissance de calcul, ces systèmes permettent de formaliser les relations des professionnels d’un domaine afin d’en assurer la communication et la coopération. Par leur représentation graphique, les ontologies permettent de spacialiser les rôles des acteurs d’un domaine (que peuvent par exemple être les médecins d’un service particulier) afin de donner aperçu visuel de leur organisation et échanges. Cette représentation facilite ainsi la centralisation des données issues de leurs interactions sous un format textuel qui peut être traité à la fois par des agents humains et par des machines.
De manière plus générale, on peut donc se représenter les ontologies informatiques comme des cartes mentales numériques qui relient des concepts entre eux dans des réseaux sémantiques à plusieurs branches et niveaux. Elles ont pour avantages de représenter des connaissances, de cadrer l’état de l’art d’un domaine, et de permettre à une machine de calculer les propriétés et relations entre les concepts pour répondre à des requêtes émises par un utilisateur.
II. L’être et le langage du point de vue de la machine
Cependant, la place du langage dans l’élaboration d’une ontologie étant primordiale, le rapport entre le mot et la chose à laquelle il réfère pose de nombreux problèmes de sémantique.
Selon Rastier (1996) il n’existe pas a priori de traduction idéale entre une langue vernaculaire et un langage formel : comment peut-on alors s’assurer que, par exemple, la représentation mentale d’un patient particulier pour un médecin corresponde bien à la représentation du concept codé « P(x) » pour une ontologie biomédicale ? On a dit que l’ontologie informatique n’entretient pas de rapport direct avec les objets qu’elle décrit et n’y accède que par des concepts qui y font référence. Or, c’est précisément la nature logico-mathématique de cette référence qui contraste avec la représentation mentale et intuitive que l’humain a des concepts. Il peut alors y avoir une perte de signification dans l’interface humain-machine quand il s’agit de traduire dans un langage logique abstrait (qui n’accepte que le tiers exclu et le binaire) les propositions du langage naturel qui, elles, sont émises depuis un contexte vivant doué de nuances.
D’un point de vue technique, c’est ici l’interopérabilité sémantique humain-machine qui est mise en question : c’est-à-dire la capacité pour plusieurs agents et systèmes de fonctionner ensemble et d’échanger des connaissances tout en conservant la pertinence et la signification de l’information. Pour y répondre, les acteurs établissent des normes informatiques et équivalences sémantiques qui permettent d’homogénéiser la compréhension humaine des termes et les définitions formelles des concepts pour la machine.
Mais, même si cette réponse technique résout en partie la dimension pratique de l’interface humain-machine, il faut s’interroger sur les raisons philosophiques de ces différences de langage pour en délimiter les enjeux pour l’IA en général et pour les ontologies informatiques en particulier. On verra ainsi au passage de cette enquête quelques thématiques et problématiques philosophiques avec lesquelles les ontologies renouent.
II.1. Un langage mécanique sans signification
Concernant le langage naturel, Descartes dans sa lettre du 23 novembre 1646 au marquis de Newcastle s’intéressait déjà à ses mécanismes et son rapport à l’esprit. En décrivant les animaux comme des « machines », il explique que leurs automatismes passionnels ne leur permettent pas d’appréhender le monde de la même façon qu’un être humain. Cette distinction résidant principalement dans le fait que le langage humain exprime des signes qui indiquent l’exercice d’une pensée, là où celui de la machine n’est que pur mécanisme.
Par le signe du langage, la pensée humaine se manifeste dans la mesure où il indique l’à-propos de l’esprit vis-à-vis d’un objet en particulier. Le langage humain dispose donc d’un caractère intentionnel qui le sort de l’automatisme, car il rapporte des pensées ou des sensations contextuelles. Tandis qu’une machine qui agirait pareil à un humain n’implique pas qu’elle dispose en elle d’une pensée qui soit le moteur de son action, car ses mouvements réguliers ne dépendent de rien d’autre que de l’agencement nécessaire de ses organes internes. Descartes insiste dans la Ve partie du Discours de la méthode sur cette spécificité humaine en soutenant l’impossibilité de concevoir une machine qui serait capable d’adapter ses signes à tout type de contexte, même si elle imitait parfaitement le langage ou la raison humaine.
C’est ici une première critique similaire à celles que le fonctionnalisme va subir au xxe siècle, notamment dans l’expérience de pensée dite de la « Chambre chinoise » proposée par Searle (1980), ou encore par la critique de la référence selon Putnam (1984).
Searle imagine un individu A n’ayant aucune connaissance du mandarin et enfermé dans une chambre. Ce dernier dispose cependant des règles de la syntaxe de cette langue, ce qui lui permet de répondre à des questions qui lui seraient posées dans cette même langue par un autre locuteur B situé à l’extérieur de la chambre. Searle fait observer que même si A est capable de dialoguer en mandarin, on ne peut relever de sa part aucune compréhension étant donné qu’il ne fait qu’appliquer à la lettre des règles grammaticales dont il ne comprend que l’usage logique, mais pas la signification. Il conclut qu’il en est de même pour la machine lorsque celle-ci interprète une proposition : un système computo-symbolique n’est alors rien d’autre qu’un jeu syntaxique sans compréhension de la sémantique d’un langage.
Mais, les traducteurs automatiques du langage (TAL) faisant de nos jours d’immenses progrès, la machine semble pourtant parfois comprendre ce qu’on lui dit, puisqu’elle répond souvent correctement aux questions dont elle maîtrise la grammaire. C’est ici un problème d’anthropomorphisation du discours de la machine que souligne Putnam.
Pour Putnam, l’humain qui jugerait le discours d’une machine comme étant doué de pensée, car cohérent, vient du fait que ce dernier considère que ce discours correspond à une « représentation conventionnelle » de l’objet auquel il réfère. Si par exemple la machine parle de photosynthèse végétale de manière précise, il est possible qu’elle le fasse de façon tout à fait correcte. En revanche, ce qui est correct ici n’est pas la « compréhension » qu’a la machine de la photosynthèse, mais simplement le fait que le modèle théorique scientifique de photosynthèse tel qu’un humain se le représente est correctement décrit. Le discours de la machine ne portant jamais directement sur le réel, car celle-ci ne possède pas de référence pour la photosynthèse, ou même simplement pour les plantes. Elle ne fait qu’organiser uniquement des mots entre eux selon un modèle scientifique préétabli et attendu qu’elle a appris, ce qui procure l’illusion d’une référence à un objet du monde.
II.2. Une pensée artificielle isolée du monde extérieur
De ces critiques on peut ainsi conclure que la machine évolue selon une logique sans signifiés : c’est-à-dire sans idées ni intuitions comme cela serait le cas pour un humain et seulement dans un espace conceptuel formalisé et représenté par le calcul.
La définition que donne Gruber (1993) de « ce qui est » pour une ontologique informatique est éloquente en ce sens : pour une ontologie « ce qui est, c’est ce qui est représenté ». Nef (2010) observe ici que l’on retrouve dans cette formule la thématique du solipsisme et de l’immatérialisme à la Berkeley pour qui « être, c’est être perçu », mais adaptée à l’IA : il n’y a pas de réalité extérieure autre que ce que le système de la machine modélise, et les choses n’existent qu’en tant qu’elles sont calculables. On obtient ainsi ici, comme l’indique F. Nef, une « assimilation du domaine de l’être au domaine du discours [logique] ». De fait, les machines qui utilisent des ontologies informatiques ne sont pas en mesure d’entretenir un rapport immédiat avec le monde : elles n’accèdent qu’à des descriptions logico-mathématiques des concepts.
Ce qui a pour conséquence le constat suivant : « ce qui est » n’est ni plus ni moins pour les ontologies informatiques que ce qui suit la syntaxe logique d’un langage formel. À leurs « yeux », les machines manipulent des signes logico-linguistiques qui sont sans identité avec des objets qui seraient hors du complexe propositionnel.
Cette restriction du monde des machines par les limites de leur langage trouve un écho dans la formule de Wittgenstein (1921) : « 5.6 : Les frontières de mon langage sont les frontières de mon monde. ». On constate ici que c’est précisément ce qu’une machine ne peut pas exprimer autrement par un langage formel qui l’empêche de voir le monde comme un humain qui emploie le langage naturel. Ce dernier étant essentiellement plus riche sémantiquement qu’une langue mécanisée.
En ce sens, l’IA symbolique dispose d’un rapport au monde conditionné par son propre « langage artificiel » intérieur et privé, dont la ressemblance avec le langage naturel humain se limite à l’application des règles grammaticales et logiques pour agencer les mots entre eux.
Sur ce point, l’IA hérite de la théorie en philosophie de l’esprit du « langage de la pensée » : l’hypothèse selon laquelle il préexiste au langage extérieur oral ou écrit un langage intérieur qui fonctionne sur la base d’une manipulation logique des représentations mentales. On retrouve déjà cette assimilation de la pensée à une forme de langage intérieur chez Platon dans le Théétète, 189e-190a :
Théétète : Qu’est-ce que tu appelles penser ?
Socrate : Une discussion que l’âme elle-même poursuit tout du long avec elle-même à propos des choses qui lui arrive d’examiner. […] De sorte que moi, avoir des opinions j’appelle cela parler, et que l’opinion, je l’appelle un langage, prononcé, non pas bien sûr à l’intention d’autrui ni par la voix, mais en silence à soi-même.
C’est ensuite en passant par Guillaume d’Ockham, philosophe nominaliste et moine franciscain du xive siècle avec la théorie de l’oratio in mente qu’apparaît l’hypothèse d’une structure de l’esprit comme étant une combinaison de représentations mentales simples, qui associées ensemble permettent d’en former des plus complexes. Cette hypothèse culminant dans sa version moderne au xxe siècle avec le computationnalisme de Fodor (1975), lequel défend une conception de la cognition qui associe le raisonnement et langage humain à une manipulation de symboles à la manière d’un ordinateur. Sauf qu’ici, on opère un renversement : ce n’est plus la machine qui imite le fonctionnement de l’esprit humain, mais l’esprit qui est définitivement considéré à la manière d’une machine de Turing qui calcule des symboles.
Cependant, ce langage interne qui fait le propre de la machine peut-il vraiment être associé à une pensée comme Turing (1948, 1950) le considérait ? On peut seulement dire que si les machines ont une « pensée logique », celle-ci est purement formelle et ne peut pas contrôler ou interférer dans la signification ou la vérité des propositions qu’elles traitent. Spear (2006) nomme par ailleurs « solipsisme informatique » ce phénomène, maintenant ainsi une proximité sémantique supplémentaire avec l’immatérialisme de Berkeley. En revanche, cette réflexion sur la signification ou la vérité des propositions des IAs appartient à la communauté scientifique qui va définir ce qu’il-y-a dans le domaine pour lequel ces machines vont être utilisées. Il est donc nécessaire qu’une ontologie sociale soit à la base de la construction des ontologies informatiques pour pouvoir donner un sens à leur usage.
III. Des ontologies formalisées à l’ontologie sociale
Que les ontologies informatiques soient si dépendantes de leurs enquêtes ontologiques et langages pour définir leur cadre de recherche peut être considéré comme un argument en faveur de l’interdisciplinarité des sciences. Car, c’est une pluralité d’acteurs qui doivent alors intervenir autour de ces outils : linguistes pour définir les termes, philosophes pour travailler les concepts, ingénieurs pour construire les ontologies, et tous autres champs disciplinaires nécessaires à l’élaboration d’une ontologie spécifique (par exemple les médecins pour une ontologie biomédicale). Ces acteurs usants de codes et de langages tout aussi différents, et qui pourtant, par l’intermédiaire des machines, parviennent à synthétiser en un but commun leurs échanges. Ces artefacts informatiques disposent donc d’une nature « interactionnelle » qui permet de favoriser l’interface humain-humain et l’interface humain-machine.
Car la machine ne peut évidemment pas tout faire comme un être vivant. La critique de Dreyfus (1972) envers la conception computationnelle de l’esprit rappelle que la machine n’étant pas située dans un corps sensible, elle ne peut alors rendre compte du savoir-faire naturel d’une pratique ou d’une connaissance vécue quand elle traite des propositions du langage. Pour Dreyfus, la réalité ne peut pas être uniquement représentée comme une simple fragmentation de faits indépendants les uns des autres et intégrés dans une vision ensembliste comme le proposait Minsky avec son modèle des cadres. En effet, rien ne garantit que tous les phénomènes soient réductibles à une modélisation atomique et logico-mathématique.
Or, la recherche en IA a intégré ces remarques, et ce sans nier la sensibilité humaine ou la nature logique de la machine. Ici, celles-ci sont dans une relation de complémentarité. Par les ontologies informatiques, l’interface humain-machine répond au paradoxe formulé par Hans Moravec en 1980 qui peut se résumer ainsi :
Ce qui est facile pour la machine est difficile pour l’humain (par exemple, résoudre des problèmes mathématiques complexes), et ce qui est facile pour l’humain est difficile pour la machine (par exemple, comprendre la signification d’un contexte particulier ou réaliser une action sensorimotrice).
Dans le cas présent, les ontologies calculent les relations complexes entre les entités d’un domaine et les acteurs donnent sens aux données qu’ils interprètent. La machine sert ici de support cognitif à l’humain et celui-ci permet de cadrer son apprentissage du langage naturel en adaptant les données obtenues au contexte approprié. L’humain et la machine suppléant ainsi aux difficultés propres de son partenaire dans un but commun de représentation et de clarification des connaissances et de la signification.
Les différentes critiques de l’IA que l’on a pu voir ne sont donc aujourd’hui pas ignorées et certains programmes de recherche tendent aujourd’hui à reconsidérer la définition de l’intelligence comme embodiment : c’est-à-dire une intelligence « incarnée » indissociable d’un corps influencé par et en interaction avec son milieu. Pour alternative au cognitivisme qui borne l’intelligence à une activité mentale combinatoire, on trouvera de nouvelles recherches en cybernétique sur l’énaction (Francisco Varela) et un réinvestissement de certains travaux en biosémiotique (Jakob von Uexküll), sur le vitalisme (Henri Bergson, Raymond Ruyer), ou en psychologie de la forme et phénoménologie de la perception (Maurice Merleau-Ponty).
C’est également toute une nouvelle herméneutique du numérique qui tend à se développer. Cette « herméneutique computationnelle » avec pour précurseurs les travaux de (Mallery et al., 1986) considère que le rapport au monde de l’IA est d’abord un rapport au texte et que le calcul de la machine n’est ni plus ni moins qu’une certaine manière de lire et d’écrire. L’IA et le texte numérique s’interprètent ici comme des supports matériels qui s’inscrivent dans le monde et entretiennent des relations avec des milieux techniques et humains. Cette approche permettant ainsi une réappropriation des travaux de la phénoménologie contemporaine (Edmund Husserl, Martin Heidegger), en philosophie française et philosophie de la technique et de la technologie (Gilbert Simondon, Bernard Stiegler, Bruno Bachimont) ou encore de l’herméneutique traditionnelle et philosophique (Friedrich Schleiermacher, Hans-Georg Gadamer, Paul Ricoeur).
Conclusion
On n’a présenté ici qu’un ensemble limité de problèmes philosophiques liés à l’Ontologie, au langage, et à la représentation des connaissances auxquels les ontologies informatiques se confrontent. Cependant, ceux-ci permettent déjà d’observer qu’en poursuivant et renouvelant des problématiques philosophiques traditionnelles, les ontologies informatiques surmontent dans une certaine mesure les critiques que l’IA a subi dès son origine. Ceci sans nécessairement les résoudre, mais en s’y adaptant et en les renouvelant de manière appliquée.
Les ontologies informatiques permettent ainsi un tour de force qui est de proposer des modélisations de certaines interrogations philosophiques (ici par exemple à propos de la référence, du solipsisme, du réalisme des entités) les faisant ainsi passer du conceptuel à l’opérationnel, et dont l’efficience de ce passage peut dans une certaine mesure servir de critère pour tester la cohérence des théories philosophiques et scientifiques.
Il est ainsi notable que la thèse de la plurivocité de l’Être depuis Aristote se soit répliquée techniquement par la pluralité des ontologies informatiques et des pratiques. Leurs interactions avec l’être humain permettent de faire passer l’Ontologie d’une pensée sur un être monolithique et conceptuel à celle d’une réflexion à propos des êtres eux-mêmes et de leurs connaissances dans leurs contextes socioculturels et techniques. Les ontologies informatiques amènent ainsi à développer une technologie (au sens de « discours sur la technique ») qui rapproche les êtres entre eux par-delà leurs différences (linguistiques, professionnelles, conceptuelles), donnant à la machine le rôle éminemment social de médiateur.
Bibliographie
Arapinis A., « Ontologie formelle (A) », dans Maxime Kristanek (dir.), l’Encyclopédie philosophique, [En ligne], https://encyclo-philo.fr/ontologie-formelle-a, 2018
Aristote, Métaphysique, trad. Jules Tricot, Éditions Les Échos du Maquis (ePub, PDF), v. : 1,0, janvier 2014
Arp R., Barry Smith B., Spear A., Building Ontologies with Basic Formal Ontology, The MIT Press, Cambridge, Massachusetts, 2015
Declerck G., Charlet J., « Pourquoi notre sémantique naïve n’est pas formalisable et pourquoi c’est (presque) sans conséquence sur l’ingénierie ontologique », Intellectica, vol. 61, n° 1, 2014, p. 143-188
Declerck G., Baneyx A., Aimé X., Charlet J., « Les ontologies fondationnelles peuvent-elles débabeliser le Web ? », Revue d’intelligence artificielle, n° 2-3:191-216, 2014, DOI : 10.3166/ria.28.191-216
Descartes R., Discours de la méthode, (1637), Folioplus philosophie, 1991
Dreyfus H., What Computer Can’t Do: A Critique of Artificial Reason, Harper & Row Publisher. New York, 1972
Fodor J., The Language of Thought, Series Editor, Harvard University Press, 1975
Gruber T., “A translation Approach to Portable Ontology Specifications”, Knowledge Acquisition, vol. 5, n° 2, 1993
Mallery J. C., Hurwitz R., Duffy G., “Hermeneutics: From Textual Explication to Computer Understanding”, MIT-AI Laboratory Memo No. 871, May, 1986
Minsky M., “A Framework for Representing Knowledge”, MIT-AI Laboratory Memo No. 306, June, 1974
Monnin A., « L’ingénierie philosophique de Rudolf Carnap. De l’IA au Web sémantique », Les Cahiers Philosophiques, 2015/2 (141)
Monnin A., Félix É., « Essai de comparaison des ontologies informatiques et philosophiques : entre être et artefacts », Rochebrune’09 : Ontologie et dynamique des systèmes complexes, perspectives interdisciplinaires, Jan 2009, Megève, France. pp.14. ffhal-00636120
Nef F., « L’Ontologie au miroir de la Terminologie », Ontology: Theories and applications, Juin 2010, Annecy, France. Institut Porphyre, Savoir et Connaissance, TOTh, Terminology, 2010
Nef F., Schmitt Y. (dir.), Ontologie : Identité, structure et métaontologie, coll. « Textes clés », Vrin, 2017
Platon, Théétète, traduction de Michel Narcy, Garnier Flammarion, 2016
Putnam H., Raison, Vérité et Histoire, Les éditions de Minuit, 1984
Quine W.V.O., “On What There Is”, Review of Metaphysics Harvard University Press, 1948
Rastier F., « Problématiques du signe et du texte », In: Intellectica : Revue de l’Association pour la Recherche Cognitive, n°23, 2. Le sémiotique. pp. 11-52, 1996
Searle J., “Mind, Brains and programs”, The Behavioral and Brain Sciences, Vol. 3, Cambridge University Press, 1980
Sowa J. F., Knowledge representation: Logical, philosophical and computational foundations, Brooks Cole Publishing Co.: Pacific Grove, CA USA. 1999
Spear A., “Ontology for the twenty first century: An introduction with recommendations”, Institute for Formal Ontology and Medical Information Science. Saarbrucken, Germany: Institute for Formal Ontology and Medical Information Science; 2006
Turing A. M., “On Computable Numbers, with an Application to the Entscheidungsproblem”, Proceedings of the London Mathematical Society, Proceeding of London Mathematical Society, Vol. s2-42, Issue 1, 1937, pages 203-265, https://doi.org/10.1112/plms/s2-42.1.230
Turing A. M., “Intelligent Machinery”, National Physical Laboratory, 1948
Turing A. M., “Computing machinery and intelligence”, Mind, 59, 433-460, 1950
Uschold M., Gruninger M., “Ontologies: Principles, Methods and Applications”, Knowledge Engineering Review, vol.11, n°2, 1996
Varzi A. C., Ontologie, Ithaque, 2010
Wittgenstein L., Tractatus logico-philosophicus, (1921), tel Gallimard, 1993
[1] Et pas simplement « Qu’est-ce qui existe ? ». Comme l’indique (Varzi, 2010), cette question semble limiter l’ontologie à une approche physicaliste : « « Qu’est-ce qui existe ? » semble dans le meilleur des cas ne capturer que la seule dimension matérielle de l’ontologie, avec le risque de transformer cette dernière en une théorie générale de l’univers dans lequel il se trouve que nous vivons (sur le même plan donc que la physique, bien qu’ayant une portée plus large). », p.14
[2] F. Nef, Y. Schmitt (dir.), Ontologie : Identité, structure et métaontologie, coll. « Textes clés », Vrin, 2017, p.7-8
[3] On ne présente ici que trois aspects de l’Ontologie : matériel (Aristote), formel (Husserl), et logique (Quine). Pour une investigation ainsi qu’une liste plus exhaustive de l’histoire de cette notion on renvoie le lecteur à Frédéric Nef, « L’Ontologie au miroir de la Terminologie », in Ontology: Theories and applications, Juin 2010, Annecy, France. 2010, Institut Porphyre, Savoir et Connaissance, TOTh, Terminology, 2010, ainsi que Alexandra Arapinis, (2018), « Ontologie formelle (A) », dans Maxime Kristanek (dir.), l’Encyclopédie philosophique, [En ligne], https://encyclo-philo.fr/ontologie-formelle-a
[4] Nos traductions.
[5] Une typologie de l’ensemble de ces ontologies nécessitant un tout autre propos, on renvoie le lecteur intéressé à Alexandre Monnin, Édith Félix. Essai de comparaison des ontologies informatiques et philosophiques : entre être et artefacts. Jan. 2009 ; ainsi que Gunnar Declerck et al., Les ontologies fondationnelles peuvent-elles débabeliser le Web ?, Revue d’intelligence artificielle – n° 2-3/2014