PRÉC. SOMM SUIV.
Gregory Bateson - Vers une Écologie de l'esprit
Épistémologie et écologie

- V.1 - Explication cybernétique [*] -

Pour des raisons méthodologiques, il serait peut—être utile de décrire certaines particularités propres à l’explication de type cybernétique.

L’explication de type causal est, en général, positive. Nous disons, par exemple, que la boule de billard B s’est déplacée dans telle ou telle direction, parce que la boule de billard A l’a heurtée sous tel ou tel angle.

Par contre, l’explication de type cybernétique est toujours négative. Nous examinons d’abord quels sont les événements qui auraient eu le plus de chances de se produire, pour nous demander ensuite pourquoi un grand nombre d’entre eux ne se sont pas réalisés, montrant ainsi que l’événement particulier étudié était l’un des rares à pouvoir se produire effectivement. L’exemple classique de ce type d’explication est la théorie de l’évolution qui repose sur la sélection naturelle. Selon cette théorie, les organismes qui, à la fois du point de vue physiologique et de celui de l’environnement, n’étaient pas « viables » n’ont, vraisemblablement, pas pu vivre assez pour se reproduire. Par conséquent, l’évolution aurait toujours sùivi les voies de la « viabilité ». Comme l’a si bien remarqué Lewis Carroll, cette théorie explique de façon assez satisfaisante pourquoi il n’y a pas, de nos jours, de « grand—papapillons »[a].

En termes cybernétiques, on dit que le cours des événements est soumis à des restrictions, et on suppose que, celles—ci mises à part, les voies du changement n’obéiraient qu’au seul principe de l’égalité des probabilités. En fait, les « restrictions » sur lesquelles se fonde l’explication cybernétique peuvent être considérées, dans tous les cas, comme autant de facteurs qui déterminent l’inégalité des probabilités. Prenons l’exemple d’un singe qui, en tapant au hasard sur une machine à écrire, produirait une prose pleine de sens : nous serions nécessairement amenés à chercher des « restrictions », soit chez le singe, soit dans la machine à écrire. Peut—être le singe ne pouvait—il taper que les touches appropriées, peut—être les tiges à caractères ne pouvaient—elles bouger à moins d’être convenablement frappées ; peut—être, encore, les lettres mal placées ne pouvaient—elles pas « survivre » sur le papier. De toute façon, il faut bien qu’il y ait quelque part un circuit susceptible d’identifier l’erreur et de la supprimer aussitôt.

Idéalement — et c’est bien ce qui se passe dans la plupart des cas —, dans toute séquence ou ensemble de séquences, l’événement qui se produit est uniquement déterminé en termes d’une explication cybernétique. Un grand nombre de « restrictions » différentes peuvent se combiner pour aboutir à cette détermination unique. Dans le cas du puzzle, par exemple, le choix d’une pièce pour combler tel vide est « restreint » par de nombreux facteurs : sa forme doit être adaptée à celle des pièces voisines et, en certains cas, également à celle des frontières du puzzle ; sa couleur doit correspondre à celles des morceaux environnants ; l’orientation de ses côtés doit obéir aux régularités topologiques déterminées par la machine qui a découpé les morceaux de puzzle, etc. Du point de vue de celui qui essaie de résoudre le puzzle, ce sont là des indices, autrement dit des sources d’information qui le guideront dans son choix. Du point de vue de la cybernétique, il s’agit de restrictions.

De même, pour la cybernétique, un mot dans une phrase, une lettre à l’intérieur d’un mot, l’anatomie d’un quelconque élément d’un organisme, le rôle d’une espèce dans un écosystème, ou encore le comportement d’un individu dans sa famille, tout cela est à expliquer (négativement) par une analyse des restrictions.

La forme négative de l’explication cybernétique est en tous points comparable à la forme d’une démonstration logique par reductio ad absurdum. Ce type de démonstration consiste à énumérer une série suffisamment grande de propositions alternatives qui s’excluent mutuellement, du type : [« P » et « non P »] ; la preuve consiste, alors, à démontrer que toutes les possibilités de cet ensemble, sauf une, sont insoutenables ou « absurdes ». Il s’ensuit que l’élément « survivant » de l’ensemble des propositions doit être « soutenable » selon les critères d’un système logique donné. C’est là un type de preuve que les esprits étrangers aux mathématiques trouvent parfois peu convaincant ; et, sans aucun doute, si la théorie de la sélection naturelle paraît parfois invraisemblable aux non—mathématiciens, c’est bien pour des raisons similaires, de quelque nature qu’elles soient.

L’utilisation de la « cartographie » ou de la métaphore rigoureuse est une autre tactique de démonstration mathématique, qui trouve son correspondant dans la construction des explications cybernétiques. Une proposition algébrique, par exemple, peut être reportée sur un système de coordonnées et démontrée, ainsi, par des méthodes géométriques. En cybernétique, la « cartographie » est utilisée comme technique d’explication, chaque fois qu’on a affaire à un « modèle » conceptuel ; plus concrètement, c’est elle qui entre en jeu lorsqu’on utilise un ordinateur pour simuler un processus complexe de communication. Mais ce n’est pas là la seule intervention de la cartographie dans la cybernétique. Les processus formels de la cartographie, de la traduction ou de la transformation sont, en principe, attribués à chaque étape de n’importe quelle séquence de phénomènes que le cybernéticien essaie d’expliquer. Ces cartographies, ou transformations peuvent être très complexes : par exemple, lorsque la sortie (output) d’une machine est considérée comme une transformation élémentaire (transform[b]) de l’entrée (input). Dans d’autres cas, les cartographies peuvent être simples, par exemple, lorsque la rotation d’une tige en un point donné de sa longueur est considérée comme une transformation élémentaire (quoique identique) de sa rotation en un point précédent.

Les relations qui demeurent constantes au cours de ces transformations peuvent être de n’importe quel type.

Le parallélisme entre l’explication cybernétique et les tactiques de démonstration logiques et mathématiques, est d’une extrême importance. En tout autre domaine que la cybernétique, nous recherchons une explication, mais jamais une quelconque simulation d’une démonstration logique. La simulation de la démonstration est quelque chose de nouveau en sciences. Cependant, du point de vue d’une sagesse rétrospective, nous pouvons aussi nous dire que ce type d’explication, qui fait appel à la simulation d’une démonstration logique ou mathématique, était prévisible. En définitive, la matière de la cybernétique n’est pas constituée par des événements et des objets, mais par l’information « véhiculée » par ces objets et événements. De ce point de vue, nous considérons les objets et événements uniquement en tant qu’ils proposent des faits, des propositions, des messages, des perceptions, et ainsi de suite. Cette matière étant de l’ordre de la proposition, il faut s’attendre à ce que l’explication simule la démonstration logique.

Les cybernéticiens se sont donc spécialisés dans des explications qui simulent la reductio ad absurdum et la « cartographie ». Peut-être existe-t—il des champs entiers d’explications attendant encore d’être découverts par un mathématicien qui reconnaisse, dans les aspects informationnels de la nature, des séquences qui simulent d’autres types de démonstration.

Du fait même que sa matière est l’aspect propositionnel ou informationnel des événements et des objets du monde naturel, la cybernétique est obligée d’employer des méthodes différentes de celles des autres sciences. Un exemple : la différenciation entre « carte » et « territoire », que les sémanticiens aimeraient bien voir respectée dans les écrits des hommes de science, doit, en cybernétique, être recherchée dans les phénomènes mêmes qu’étudient ces hommes de science. Il est fort probable que certains organismes communicationnels, ainsi que les ordinateurs mal programmés, confondent la « carte » et le « territoire », et le langage de l’homme de science doit pouvoir rendre compte de ces anomalies. Dans les systèmes de comportement humain, tout particulièrement dans la religion et les rites, et partout où c’est le processus primaire qui domine, le nom est souvent la chose nommée : le pain est le Corps, comme le vin est le Sang.

De même, toute la question de l’induction et de la déduction — ainsi que celle de nos préférences doctrinaires pour l’une ou pour l’autre — revêtira une nouvelle signification, lorsque nous saurons reconnaître les étapes déductives et inductives, non seulement dans nos propres raisonnements, mais aussi dans les relations entre les données elles-mêmes.

En ce sens, la relation entre le contexte et son contenu est particulièrement significative. Un phonème n’existe en tant que tel que par la liaison qu’il entretient avec d’autres phonèmes, avec lesquels il forme un mot : le mot est le contexte du phonème. A son tour, le mot n’existe en tant que tel — n’a une « signification » — qu’à l’intérieur du contexte plus vaste de l’expression, qui, elle—même, n’a de « signification » que dans le cadre d’une relation.

Cette hiérarchie de contextes à l’intérieur de contextes est universelle pour ce qui concerne l’aspect communicationnel (ou « émique » — emic) des phénomènes, ce qui amène l’homme de science à rechercher continuellement des explications dans des ensembles toujours plus grands. Les physiciens ont (peut—être) raison de vouloir rechercher l’explication du macroscopique dans le microscopique. C’est pourtant le contraire qui est vrai en cybernétique : sans contexte, il n’y a pas de communication.

En accord avec le caractère négatif de l’explication cybernétique, l’« information », elle aussi, est quantifiée en termes négatifs. Un événement ou un objet, par exemple, la lettre K à tel endroit du texte d’un message, aurait pu également être tout autre lettre de l’ensemble limité des vingt—six lettres de l’alphabet anglais. La lettre effective K exclut (autrement dit, élimine par restriction) vingt—cinq autres possibilités. Un idéogramrne chinois exclurait, lui, plusieurs milliers de possibilités. Par conséquent, nous pouvons dire qu’un idéogramme chinois transmet plus d’informations qu’une lettre de l’alphabet anglais. La quantité d’informations s’exprime conventionnellement comme le logarithme à base 2 de l’improbabilité de l’événement ou de l’objet effectifs.

La probabilité, étant un rapport entre des quantités de dimensions similaires, est elle-même de dimension zéro. Autrement dit, la quantité explicative centrale, l’information, est de dimension zéro. Les quantités à dimensions réelles (masse, longueur, temps), ainsi que leurs dérivées (force, énergie, etc.), n’ont aucune place dans l’explication cybernétique.

De ce point de vue, il est intéressant de préciser le statut de l’énergie. Dans tout système communicationnel, nous avons, en général, affaire à des séquences qui ressemblent plus à la séquence : stimulus—et—réponse, qu’à la séquence : cause-et-effet. Lorsqu’une boule de billard en heurte une autre, il se produit un transfert d’énergie : le déplacement de la seconde boule est fourni en énergie par l’impact de la première. Par contre, dans les systèmes communicatiænels, l’énergie de la réponse est fournie par le répondant lui—même. Si je donne un coup de pied à un chien, sa réaction immédiate sera fournie en énergie par son métabolisme et non par mon coup. De même, si un neurone en excite un autre, ou si l’impulsion d’un microphone active un circuit, l’événement consécutif puisera son énergie dans ses propres ressources.

Bien sûr, chacune des ces réactions demeure toujours à l’intérieur des limites définies par la loi de la conservation de l’énergie. Le métabolisme du chien pourrait finir par limiter sa réaction, mais, en général dans les systèmes qui nous intéressent ici, les réserves d’énergie sont plus importantes que les demandes. Et, de toute façon, bien avant que ces réserves ne soit épuisées, certaines limites « économiques » seront imposées par le nombre fini des possibilités viables : autrement dit, il existe une économie de la probabilité. Cette économie diffère cependant, de l’économie énergétique ou monétaire en ceci que, la probabilité étant un rapport, elle n’est pas sujette à l’addition ou à la soustraction, mais uniquement à des processus de multiplication, tels que le fractionnement. Il peut arriver, par exemple, que, dans un cas d’urgence le central téléphonique soit « encombré », lorsqu’une grande partie des circuits alternatifs sont occupés. Il y a alors une très faible probabilité d’y faire passer un message.

Aux « restrictions » dues à l’économie limitée des probabilités viennent s’ajouter deux autres catégories de « restrictions » : les « restrictions » liées à la « rétroaction » (feedback) et celles concernant la « redondance ». Ce sont ces deux types de restrictions que nous allons examiner maintenant.

Considérons, tout d’abord, le concept de « rétroaction » (feedback).

Si l’on conçoit les phénomènes de l’univers comme étant associés par des séquences du type cause-et—effet et par le transfert d’énergie, l’image qui en résulte est celle d’ un réseau complexe de chaînes de causalité. Dans certaines régions de cet univers — organismes dans leurs environnements, écosystèmes, thermostats, machines à vapeur autoréglables, sociétés, ordinateurs, etc. —, ces chaînes de causalité constituent des circuits fermés, ce qui signifie que l’interconnexion causale peut être relevée le long du circuit dans un sens, puis dans le sens inverse, quelle que soit la position (arbitrairement) choisie comme point de départ de la description. Dans un tel système, les événements survenant en n’importe quel point du circuit sont censés avoir un certain effet sur toutes les positions du circuit.

Ces systèmes demeurent, cependant, toujours ouverts :

  1. parce que le circuit reçoit son énergie d’une source extérieure et, en même temps, rejette de l’énergie à l’extérieur, généralement sous forme de chaleur ; et
  2. parce que les événements de l’intérieur du circuit peuvent être influencés de l’extérieur et peuvent, à leur tour, influencer des événements extérieurs.

Une partie importante de la théorie cybernétique traite des caractéristiques formelles de ces circuits causaux, ainsi que des conditions de leur stabilité. Je n’envisagerai ici ces systèmes qu’en tant que sources de restrictions.

Considérons une variable, en n’importe quel point du circuit, et supposons qu’elle soit soumise à une modification fortuite de sa valeur, cette modification pouvant être imposée par l’impact de quelque événement extérieur au circuit. Comment cette modification affectera—t-elle plus tard la valeur de cette variable, lorsque la séquence d’effets aura fait le tour du circuit ? Il apparaît clairement que la réponse à cette question dépendra des caractéristiques du circuit, et qu’elle ne sera donc pas fortuite.

Par conséquent, nous pouvons énoncer le principe suivant : un circuit causal donnera généralement une réponse non fortuite à un événement fortuit, en ce point du circuit où s’est produit l’événement fortuit.

C’est là, précisément, la condition générale requise par la création d’une restriction cybernétique, dans n’importe quelle variable, en n’importe quelle position donnée. La restriction particulière, créée à chaque instant, dépendra, bien sûr, des caractéristiques du circuit particulier : celles de son gain global — positif ou négatif —, celles de son temps propre, celles des seuils de son activité, etc. Tous ces facteurs concourent à déterminer les restrictions exercées par le circuit en n’importe laquelle de ses positions.

Pour les besoins d’une explication cybernétique, en observant le fonctionnement d’une machine à un rythme constant (ce qui est peu probable), et cela même en charge variable, nous chercherons certaines restrictions : par exemple, dans un circuit qui sera activé par les modifications du rythme de fonctionnement et qui, une fois activé, agira sur une variable (les réserves de fuel, par exemple), de sorte à diminuer les changements du rythme.

Pour revenir à l’exemple que j’ai déjà donné, si nous voyons un singe taper un texte en prose (ce qui est improbable), nous chercherons un circuit qui soit activé chaque fois que le singe fait une « erreur » et qui, une fois activé, efface la trace de cette erreur, à l’endroit même où elle s’est produite.

La méthode cybernétique de l’explication négative soulève la question suivante : y a-t—il une différence entre « avoir raison » et « ne pas avoir tort » ? Devrions—nous dire, du rat dans un labyrinthe, qu’il a « appris le bon chemin », ou seulement dire qu’il a « appris à éviter les impasses » ?

Subjectivement, je « sens » que je sais comment épeler un certain nombre de mots anglais, et sous doute ne suis-je pas conscient de rejeter comme inappropriée la lettre K, lorsqu’il me faut épeler le mot « many ». Et pourtant, selon le premier niveau de l’explication cybernétique, je serais considéré comme rejetant activement la possibilité K.

Cette question est loin d’être futile, et la réponse est à la fois nuancée et fondamentale : les choix ne se font pas tous au même niveau. Il se peut que j’aie à éviter des erreurs dans mon choix du mot « beaucoup » dans un contexte donné, en rejetant ainsi les possibilités suivantes : « peu », « plusieurs », « nombreux », etc. Cependant, si je peux réaliser ce choix de niveau supérieur sur une base négative, il s’ensuit que le mot « beaucoup » et les autres possibilités citées sont, en quelque sorte, concevables pour moi ; autrement dit, qu’ils existent, dans mes processus nerveux, en tant que modèles distincts et probablement étiquetés ou codifiés. Et s’ils existent, il s’ensuit que après avoir réalisé le choix de niveau supérieur, je ne serai pas nécessairement confronté à plusieurs possibilités, au niveau inférieur : je n’aurai pas nécessairement à exclure, par exemple, la lettre K du mot « beaucoup ». Il sera, alors, correct de dire que je sais positivement comment épeler « beaucoup », et non de dire simplement que je sais comment éviter les fautes en épelant ce mot.

On voit donc que la plaisanterie de Lewis Carroll, à propos de la théorie de la sélection naturelle, n’est pas entièrement convaincante. Si, dans les processus communicationnels et organisationnels de l’évolution biologique, il existe quelque chose de comparable à des niveaux — éléments, modèles et, peut—être, modèles de modèles —, il est alors logiquement possible que le système évolutif fasse quelque chose de comparable à des choix positifs ; et il est possible que ces niveaux et cette structuration (patteming) se trouvent inscrits dans les gènes, parmi les gènes ou quelque part ailleurs.

C’est à son système de circuits que notre singe devrait faire appel pour rechercher les déviations de ce qu’on appelle la « prose » ; et la « prose », elle, se caractérise par un certain modèle ou - comme diraient les spécialistes — par une redondance.

Me voici donc amené à examiner le second type de « restrictions » proposé : celui de la redondance.

L’apparition de la lettre K à tel endroit d’un message anglais en prose n’est pas un événement purement fortuit, en ce sens qu’il y aurait toujours une probabilité égale pour que l’une des vingt—cinq autres lettres de l’alphabet apparaisse à ce même endroit. Mais certaines lettres et combinaisons de lettres sont plus fréquentes que d’autres. Ainsi y a—t—il une sorte de structuration qui détermine, en partie, quelles sont les lettres qui apparaîtront à tel endroit. Si, donc, le destinataire du message a reçu le texte dans son intégralité, à l’exception de cette fameuse lettre K, il sera capable — avec des chances de succès supérieures à celles du hasard — de deviner que la lettre manquante est précisément un K. Cela est si vrai que, pour lui, ce n’est pas la lettre K qui a exclu les vingt—cinq” autres lettres, puisqu’elles étaient déjà partiellement exclues par l’information contenue dans le reste du message. Et c’est précisément cette structuration ou cette prévisibilité des événements particuliers, à l’intérieur d’un ensemble plus vaste d’événements, qui est appelée « redondance ».

Le concept de « redondance » est habituellement déduit, comme je viens de le faire, par une double opération : en considérant, d’abord, le maximum d’informations qui peuvent être transmises par une unité donnée, et en examinant, ensuite, la façon dont on peut décrypter ce tout grâce à la connaissance des modèles environnants, dont l’unité donnée n’est qu’une partie composante. Nous pourrions également aborder le problème en sens inverse : considérer la structuration ou la prévibilité comme l’essence même et la raison d’être[c] de la communication, et qualifier la lettre seule, qui ne serait pas accompagnée d’indications collatérales, de cas particulier.

L’idée que la communication est création de redondance ou de structuration peut s’appliquer à des exemples techniques des plus 'simples. Supposons un observateur qui regarde A envoyer un message à B. Du point de vue de A et de B, le but de l’opération est de créer, sur le bloc—notes de B, une séquence de lettres identique à celle qui existe d’ores et déjà sur le bloc-notes de A. Mais, du point de vue de l’observateur, ceci n’est que création de redondance. En effet, s’il a déjà vu ce qu’il y avait sur le bloc-notes de A, regarder ce qu’il y a maintenant sur celui de B ne lui apportera aucune information nouvelle sur le message lui—même.

Il est évident que la nature de la « signification », du modèle, de la redondance, de l’information, etc., dépend de la perspective où l’on se place. Dans une discussion technique habituelle du message transmis de A à B, on omettra en général l’observateur ; on dira que B a reçu une information de A, information mesurable en fonction du nombre de lettres transmises, et décryptée grâce à certaines redondances dans le texte, qui permettent à B de deviner. Alors que, dans un univers plùs vaste, celui défini par le point de vue de l’observateur, le message n’apparaîtra plus comme une « transmission » d’information, mais plutôt comme une diffusion de redondance. Les activités de A et de B se sont combinées de telle sorte que l’univers de l’observateur est devenu plus prévisible, plus ordonné et plus redondant. Nous pouvons dire que les règles du « jeu » joué par A et B expliquent (sous forme de « restrictions ») ce qui ne serait, autrement, que coïncidence embarrassante et improbable dans l’univers de l’observateur, à savoir la conformité entre ce qui est écrit sur le bloc—notes de A et sur celui de B.

« Deviner » consiste, pour l’essentiel, à être confronté à une coupure ou à un trou dans la séquence d’événements, et à prédire, au-delà de celui—ci, les éléments qui doivent se trouver de l’autre côté de la coupure. La coupure peut être spatiale ou temporelle (ou les deux à lai fois), et la conjecture, prédictive ou rétrospective. De ce fait, un modèle sera défini comme un ensemble d’événements ou d’objets qui permettent, d’une façon ou d’une autre, des conjectures de ce type, lorsqu’on n’est pas en mesure d’examiner l’ensemble du système.

Ce type de structuration est également un phénomène d’une grande généralité, qui dépasse le domaine de la communication entre organismes. La réception, par un seul organisme, d’un matériel de messages n’est pas fondamentalement différente de n’importe quel autre cas de perception. Si je vois, par exemple, la partie supérieure d’un arbre, je peux prédire — avec des chances de succès non hasardeuses — que cet arbre a des racines enfoncées dans le sol : la perception du sommet de l’arbre est redondante avec (contient des « informations » sur) des parties du système que je ne peux pas percevoir, à cause de la coupure que constitue l’opacité du sol.

Si nous disons, maintenant, qu’un message a une « signification » ou bien qu’il est « a propos » de tel référent, nous entendons par là qu’il existe un univers plus vaste, pertinent, formé d’un message plus—référent, et que le message introduit, dans cet univers, la redondance, le modèle ou la prévisibilité.

Si je vous dis : « Il pleut », ce message introduit une redondance dans l’univers : message—plus—gouttes—de-pluie, et vous pourrez, dès lors deviner — avec des chances de succès non hasardeuses — quelque chose de ce que vous veniez en regardant par la fenêtre. L’univers : message—plus—référent, reçoit ainsi une forme ou un modèle, au sens shakespearien du terme, l’univers est informé par le message, et cette « forme »-là ne se trouve ni dans le message ni dans le référent. Elle apparaît comme correspondance entre message et référent.

Dans le langage courant, il semble très simple de localiser l’information : la lettre K, placée dans une rainure donnée, montre que la lettre de cette rainure particulière est un K. Tant que l’information sera de nature aussi directe, il sera facile de la « localiser » : l’information relative à la lettre K se trouvera vraisemblablement dans cette rainure.

Mais le problème n’est plus aussi simple si le texte du message est redondant. Toutefois, si nous avons de la chance et si la redondance est d’un niveau inférieur, nous pourrons toujours désigner les parties du texte qui indiquent (transmettent des informations) que la lettre K doit probablement se trouver à l’endroit de cette rainure particulière.

Pourtant, si l’on nous pose la question : où sont les éléments d’information énonçant que : a) « ce message est en anglais » ; et que b) « en anglais, il est fréquent qu’un K suive un C, sauf lorsque le C se trouve au commencement du mot », nous pourrons répondre uniquement que cette information n’est localisée en aucun endroit du texte, mais qu’elle se présente plutôt comme une induction statistique tirée de l’ensemble du texte (ou peut—être d’un ensemble de textes « similaires »). Après tout, il s’agit là de méta-information, laquelle est d’un ordre fondamentalement différent — autrement dit, d’un type logique différent — de l’information qui nous apprend que « la lettre qui se trouve dans cette rainure est un K ».

Pendant des années, le problème de la localisation de l’information a tenu en échec la théorie de la communication, et particulièrement la neurophysiologie. C’est pourquoi il est intéressant de reconsidérer la question en partant, cette fois, de la redondance, du modèle ou de la forme, comme concepts fondamentaux.

Il saute aux yeux qu’une variable de dimension zéro n’est pas véritablement localisable. L’« information » et la « forme » ressemblent au contraste, à la fréquence, à la symétrie, à la correspondance, à la congruence, à la conformité, et ainsi de suite, en ceci qu’elles sont de dimension zéro et, de ce fait, ne sont pas localisables. Le contraste entre ce papier blanc et ce café noir ne se situe pas quelque part entre le papier et le café ; et, même si l’on rapproche davantage papier et café, le contraste entre l’un et l’autre n’en sera pas non plus localisé ni saisi. Ce contraste ne se situe pas davantage entre ces deux objets et mes yeux. Il ne se place même pas dans ma tête ; sinon, il devrait se trouver également dans la vôtre. Mais vous, lecteurs, n’avez vu ni le papier ni le café dont je parle. J’ai, dans la tête, une image, ou une transformation élémentaire, ou un nom pour ce contraste ; et vous avez une transformation élémentaire de ce que, moi, j’ai dans l’esprit. Cependant, la conformité entre nous n’est pas, elle non plus, localisable. On peut dire, par conséquence, que l’« information » et la « forme » ne sont pas des éléments localisables.

Il est toutefois possible, même si nous ne pouvons pas aller jusqu’au bout, de commencer par dresser une sorte de carte des relations formelles jouant à l’intérieur d’un système contenant une redondance. Considérons un ensemble fini d’objets ou d’événements (une séquence de lettres, ou un arbre), et un observateur déjà informé de toutes les règles de redondance qui sont reconnaissables (autrement dit, qui ont une signification statistique) à l’intérieur de l’ensemble. Il sera, alors, possible de délimiter les régions de l’ensemble à l’intérieur desquelles l’observateur peut deviner avec des chances de succès non hasardeuses. On peut encore progresser, dans cette tentative de localisation, en délimitant des zones dans ces régions par des coupures : en passant par-dessus ces marques, l’observateur informé pourra, à partir de ce qui est d’un côté de la coupure, deviner certains éléments de ce qui se trouve de l’autre côté.

N’oublions pas, cependant, que cette carte de la distribution des modèles est, en principe, incomplète, puisque nous n’avons pas considéré les sources qui ont permis à l’observateur d’avoir une connaissance préliminaire des règles de redondance. Si, maintenant, nous considérons un observateur qui n’ait aucune connaissance préalable, il est évident qu’il pourrait découvrir certaines des règles pertinentes à partir de sa perception d’une partie seulement de l’ensemble dans son entier. Il pourrait utiliser, ensuite, ces premières découvertes pour prévoir certaines règles applicables au reste, règles qui seraient correctes, même si elles ne se trouvaient pas illustrées. ]] pourrait ainsi découvrir qu’en anglais H suit souvent T, même si le reste de l’ensemble ne contient aucun exemple de cette combinaison. Pour ce genre de phénomènes, il faudra adopter un ordre différent de coupures : des métacoupures.

Il est intéressant de remarquer que les métacoupures qui délimitent ce qui est nécessaire à un observateur naïf pour découvrir une règle sont, en principe, déplacées par rapport aux coupures qui seraient marquées sur une carte préparée par un observateur pleinement informé des règles de redondance de ce même ensemble. (En esthétique, ce principe est très important : pour un œil d’artiste, la forme d’un crabe qui aurait une pince plus grosse que l’autre n’est pas simplement asymétrique. Elle offre tout d’abord une règle de symétrie, qu’elle contredit subtilement ensuite, par une combinaison plus complexe de règles).

Si nous supprimons tous les objets et toutes les dimensions réelles de notre système d’explications, il ne nous reste plus qu’à considérer chaque étape de séquence communicationnelle comme une transformation élémentaire de l’étape précédente. Si nous observons le passage d’un influx le long d’un axone, nous considérons les événements en chaque point du parcours comme des transformations élémentaires (quoique identiques et similaires) des événements en n’importe quel point précédent. Ou bien, si nous observons une série de neurones, où chacun exciterait le suivant, nous pouvons alors considérer l’excitation de chaque neurone comme une transformation élémentaire de l’excitation du précédent. Cela signifie que nous avons affaire à des séquences d’événements qui n’irnpliquent pas nécessairement le transfert de la même énergie.

De même, dans un réseau quelconque de neurones, nous pouvons sectionner arbitrairement l’ensemble du réseau, suivant une série de points distincts, pour considérer ensuite les événements de chaque section comme des transformations élémentaires des événements de la section précédente.

Dans le cas de la perception, nous ne dirons pas, par exemple :

« Je vois un arbre », parce que l’arbre n’est pas compris dans notre système d’explication. Tout au plus pouvons-nous voir une image qui est une transformation élémentaire, complexe et systématique de l’arbre. Cette image, bien sûr, reçoit son énergie de mon métabolisme, et la nature de la transformation élémentaire est partiellement déterminée par certains facteurs à l’intérieur de mes circuits nerveux : je fais l’image, sous différentes restrictions, qui sont en partie imposées par mes circuits nerveux, en partie par l’arbre extérieur.

C’est pourquoi une hallucination ou un rêve sont davantage « miens », dans la mesure où il n’est plus question alors de restrictions extérieures irmnédiates.

Tout ce qui n’est ni information, ni redondance, ni forme, ni restriction, c’est du bruit : là se trouve la seule source possible de nouveaux modèles.


[*] Cet article a été publié pour la première fois dans l’American Behavioral Scientist (Sage Publications Inc.), vol. X, avril 1967, p. 29—32.


[a] Lewis Carroll, « De l’autre côté du Miroir », chap. III p. 98 (trad. de Henri Parisot, Paris, 1971, Aubier—Flammarion).
Anglais : bread-and—butîer flies, littéralement « mouches à pain et beurre ». Jeu de mots intraduisible sur butterfly (« papillon ») et bread and butter (« pain au beurre »). (NdT.)
[b] Transform : nous avons traduit ce mot par « transformation élémentaire » ou « unité de transformation » (si elle était mesurable), par analogie avec la théorie mathématique des différentielles, où dx représente la variation élémentaire (en l’occurrence, mesurable et infinitésimale) de la variable x. Du fait de sa non—mesurabilité, la structure interne, les mécanismes, le temps (rythme), la simplicité ou la complexité d’une « transformation élémentaire » (ou, de façon légèrement impropre, d’une « unité de transformation ») seront différents pour chaque cas. Par conséquent, on peut avoir affaire à des « transformations élémentaires » complexes et systématiques (cf. ci—dessous, p. 201). (NdT.)
[c] En français dans le texte. (NdT.)


Gregory Bateson, Vers une écologie de l'esprit.
Traduit de l'anglais par Perial Drisso, Laurencine Lot et Eugène Simion (t. I & II) ;
avec le concours de Christian Cler (t. II)
© Éditions du Seuil, Paris, 1977 (t. I), 1980 (t. II) pour la traduction française,
Tome I : ISBN 978-2-02-025767-1 (ISBN 2-02-0O4700-4, 1ère publication ; ISBN 2-02-012301-0, 2e publication)
Tome II : ISBN 978-2-02-053233-4 (ISBN 2-02-013212-5, lø publication)


Titre original: Steps to an Ecology of Mind
édition originale: ISBN 345-23423-5-195,
© Chandler Publishing Company, New York, 1972