Présentation

Origine de la base DAVIDO

Le Compte général de l'administration de la justice criminelle en France a été publié pour les années 1825 à 1978. Soit au total, compte tenu des interruptions de 1914-1918 et 1939, cent quarante huit volumes. Il y a là de quoi attirer l'attention de tous les promoteurs de l'histoire quantitative ou "sérielle", de méthodologies d'analyse chronologique, de banques de données et de leurs logiciels informatiques associés...

De fait, dès les années 1950, André DAVIDOVITCH s'intéresse à cette source dans le cadre du groupe de sociologie criminelle animé par Henri LEVY-BRUHL. Son premier mémoire à l'Année sociologique sur l'escroquerie utilise des séries statistiques issues du Compte général (DAVIDOVITCH 1955-56). En 1961, son article à la Revue française de sociologie présente et commente des séries reconstituées sur un siècle (DAVIDOVITCH 1961). Enfin en 1964, avec le mémoire présenté avec Raymond BOUDON à l'Année sociologique, la modélisation statistique et l'informatique sont de la partie (DAVIDOVITCH et BOUDON, 1964).

L'ouverture de ce chantier devait se poursuivre par un travail systématique de constitution d'une base de données informatisée à partir du Compte général. A la fin des années 60, André DAVIDOVITCH et l'unité de sociologie criminelle du C.E.S. [1] sont largement absorbés par leurs recherches sur le fonctionnement des parquets dont les résultats ébranlent le discours convenu de la criminologie classique fondée sur la personnalité criminelle. Quelques moyens sont cependant dégagés en 1968 pour commencer l'informatisation des séries statistiques qu'André DAVIDOVITCH traite manuellement depuis près de quinze ans.

Ces moyens sont comptés, le projet avance lentement. Pour les laboratoires de sciences humaines français, l'informatique est encore une ressource rare. De plus, on y accède par l'intermédiaire de spécialistes qui ont toute liberté de privilégier tel ou tel projet, au moins quant à leur investissement intellectuel. Et de 1968 à 1973, l'informatisation des statistiques criminelles n'a apparemment pas la priorité pour eux. Terrain de quelques essais d'analyses factorielles mal venues ou de traceurs graphiques trop coûteux pour l'heure, elle patauge dans les constitutions de fichiers et les vérifications. L'affaire est venue trop tôt, au moins par rapport au développement effectif de l'outil informatique encore trop coûteux et trop lourd, trop éloigné du travail conceptuel des chercheurs. D'autres raisons plus théoriques sont en jeu, nous y reviendrons, mais ces contingences d'ordinateurs suffisent à expliquer "officiellement" l'arrêt des opérations en 1973.

En 1980, André DAVIDOVITCH propose au S.E.P.C. [2] une collaboration pour la reprise du projet. Il s'agit pour lui de poursuivre une voie de recherche qu'il n'a jamais abandonnée. Il s'agit aussi d'éviter la perte de fichiers informatiques qui risquent l'obsolescence alors qu'ils matérialisent une grande quantité de travail. L'ensemble, selon la mesure de l'époque, représente environ 20 000 images-cartes, ce qui est effectivement déjà beaucoup.

Dans un premier temps, une collaboration est mise en place pour assurer la conservation des fichiers et évaluer le travail nécessaire pour les rendre utilisables. Le projet intéresse le S.E.P.C., puis le C.E.S.D.I.P., car il s'inscrit dans la lignée de travaux menés sur les statistiques criminelles ou à partir d'enquêtes quantitatives se substituant aux sources statistiques administratives en voie de délabrement. Il prend encore plus d'intérêt à mesure que devient fondamentale, dans son orientation de recherche. une approche pluridisciplinaire privilégiant largement l'histoire de la production des normes et de la répression des déviances.

Enfin, le mode de développement matériel et intellectuel de l'équipe de recherche crée un contexte favorable à la résolution progressive des difficultés rencontrées : problèmes informatiques, problèmes statistiques, connaissances juridiques, maîtrise de la source statistique, et surtout éclairage théorique apporté par le travail d'autres chercheurs. La permanente confrontation avec les spécialistes intéressés à l'histoire et à la sociologie du système pénal [3] nous a été d'un apport essentiel pour orienter. délimiter et même motiver un travail que l'enlisement guette à tout moment tant la tâche s'avère importante. Avec l'appréhension de connaître à nouveau l'échec de nos prédécesseurs.

Comme il le craignait, André DAVIDOVITCH n'aura pas vu l'aboutissement d'un travail dont il estimait à juste titre avoir la paternité. Il n'aurait pas cependant admis que pour aller plus vite, nous ayions pris la responsabilité de publier nos données sans les garanties scientifiques que nous pensions devoir y apporter.

La statistique, science du chiffre, est aussi beaucoup trop souvent celle de l'à peu près et du raccourci. Dans le domaine pénal elle peut même devenir, comme le montre l'usage public fait il y a quelques années des statistiques policières, la caution scientifique d'un discours partisan peu enclin aux considérations méthodologiques. Il n'était pas question pour nous de publier des milliers de chiffres sans en donner le mode d'emploi obligé.

Le Compte général représente une base virtuelle de plusieurs centaines de milliers de chiffres au niveau national. Avec les données locales, on atteint peut-être le million comme ordre de grandeur. C'est dire que l'informatisation intégrale de cette source statistique, à supposer qu'elle soit réalisable par des voies économiques, est un leurre. Les potentialités, en termes de connaissance de la justice pénale, resteraient tout aussi virtuelles si au lieu de cent cinquante vieux livres nous avions un fichier d'une dizaine de millions de caractères. Il nous a donc fallu sélectionner nos séries et procéder par étapes.

Nous exposerons la progression de nos choix. Disons tout de suite que la première étape et la première restriction ont consisté à ne travailler que sur les séries d'ensemble. Les éclatements par infractions viendront dans un second temps. Les résultats par ressorts judiciaires restent à l'écart entièrement pour le moment. Cette première phase conduit pourtant à la production de plus de deux cents séries, soit environ 20 000 chiffres.

On concevra la lourdeur d'un tel travail. Si la preuve en est nécessaire, on fera allusion un instant à la situation que l'on connaît actuellement. Si le Compte général est, par la force des choses, sous-utilisé dans les recherches du champ pénal, il n'est pas ignoré. Seulement les chiffres publiés par les auteurs qui l'ont consulté n'ont aucun caractère systématique. Chacun a relevé ce dont il avait besoin, ce qui est normal. Mais le plus souvent sans expliciter les choix qui conduisent à retenir telle ou telle série pour un objectif déterminé, ni les variations éventuelles de définitions qui peuvent se produire. On ne peut non plus exclure les erreurs matérielles lorsqu'on constate des divergences entre les auteurs... Et pourtant, ceux qui ont ainsi tenté de produire, ne serait-ce que quelques séries sur une cinquantaine d'années sans trop de considérations méthodologiques, se souviendront du temps qu'ils ont dû passer sur un Compte général rébarbatif et ésotérique.

1.- Sources de la base DAVIDO

1.1.- Les documents

Notre source de données est constituée presqu'uniquement par les volumes du Compte général publiés pour les années 1831 à 1978. On trouvera en annexe 1 la liste de ces volumes avec leur année de parution, leur pagination et le nom de leur signataire officiel.

La seule exception à cette règle d'homogénéité de la source concerne des documents ayant permis ou accompagné la production du Compte général. Il s'agit d'une part d'un document que nous appellerons Archives et d'autres part des documents de base de la collecte statistique que nous citons sous le nom de Cadres.

Les Archives sont constituées de dix-huit cahiers couvrant la période 1955-1969. Ils contiennent sous forme manuscrite des tableaux statistiques résultant de l'exploitation des Cadres statistiques des parquets (voir ci-dessous) mais non publiés dans le Compte général. Il s'agit essentiellement des résultats de l'exploitation des Cadres concernant les tribunaux correctionnels dont l'essentiel est remplacé à partir de 1955 par des chiffres provenant d'une autre exploitation statistique. Ces cahiers sont conservés au C.E.S.D.I.P.. A partir de 1970 les renseignements obtenus de cette facon ont été repris des Cadres statistiques eux-mêmes, conservés (pour les années 1958 à 1982) également au C.E.S.D.I.P., l'ancien S.E.P.C. ayant été chargé de la production statistique et de la publication du Compte général.

1.2.- La production de la statistique pénale

Depuis son apparition et jusqu'en 1904 la production statistique en matière criminelle -comme en matière civile- reste fondée sur un principe identique dit des "Cadres statistiques des parquets". En 1905, une fiche statistique individuelle pour les condamnés correctionnels sera mise en place dans le but d'enrichir les renseignements sur chaque accusé. Ce système disparaît avec la première guerre mondiale et il faut attendre ensuite 1952 pour voir apparaître un nouveau mode de recueil de ce type d'informations basé sur l'exploitation des fiches de casier judiciaire.

1.2.1.- Les cadres statistiques des parquets (1825-1981)

On désigne par ce terme les documents de base qui servent à la collecte des statistiques judiciaires. Le système adopté en 1825 et toujours en usage en 1989 a la vertu de la simplicité. L'administration centrale ordonne aux procureurs généraux par voie de circulaire de renseigner, pour chacune des juridictions de leur ressort, des tableaux statistiques conformes à un exemplaire qui leur est envoyé avec quelques instructions concernant les définitions employées. Ces cadres ou tableaux statistiques sont rassemblés à un premier niveau par le procureur général qui est censé les contrôler. Transmis à la Chancellerie, ils sont utilisés pour confectionner des tableaux statistiques au niveau national, incluant pour certains une ventilation par ressorts géographiques, et publiés annuellement jusqu'en 1978 dans le Compte général.

Ce système, simple pour l'autorité centrale puisqu'il reporte l'essentiel de la tâche sur les juridictions, porte de nos jours, après un glissement métonymique, le nom de "cadres statistiques". En 1826, dans les "Instructions sur les comptes qui doivent être rendus de l'Administration de la Justice criminelle" [4] on parle des "états" du "Compte de l'Administration de la justice criminelle". Le document qui porte aujourd'hui le nom de "cadre statistique", fait bien apparaître les tableaux de comptage comme un compte et un "compte rendu" [5] : de là le titre de la publication finale.

En 1826, ces comptes sont présentés comme l'extension d'un recueil d'information déjà mis en place pour les cours d'assises. Il s'agit de comptes rendus alors trimestriels qui trouvent leur origine dans l'arrêté du 27 brumaire an VI, tel qu'il est mentionné dans la circulaire du 3 pluviôse an IX [6] prescrivant l'envoi d'un état mensuel des jugements des tribunaux criminels. Mais de fait, il s'agit d'un système complètement différent. Les comptes rendus des cours d'assises sont des états nominatifs qui permettent le recueil d'un plus grand nombre de renseignements (en particulier sur les conditions des accusés) et dont le traitement statistique est centralisé.

Ce dernier point est important : la collecte de renseignements cas par cas permet un contrôle et une exploitation détaillée dont les méthodes sont par nature uniformes.

Les "comptes" et "états" donnant les statistiques pour les tribunaux correctionnels, les cours d'appel à partir de 1825, puis en 1831 pour les juridictions d'instruction et les parquets, ne donnent que le résultat d'un comptage local. La circulaire de 1826, pas plus que les suivantes, n'indique de moyen pratique pour effectuer ce comptage. Certaines circulaires [7] indiquent comment trancher des conflits d'interprétation à propos des rubriques à renseigner, jamais comment établir le chiffre demandé.

Cet exercice semble donner lieu à l'accumulation d'un savoir pratique : certaines publications attestent de ce que l'opération est envisagée par certains avec sérieux [8]. Quoi qu'il en soit de la qualité du résultat obtenu, à la fin du XIXème siècle, ce système de production est jugé peu satisfaisant par les spécialistes, au moins autant en raison de l'impossibilité d'enrichissement de la statistique que de son manque de fiabilité. On relève ainsi dans un ouvrage du docteur Jacques BERTILLON, chef des travaux statistiques de la ville de Paris et membre du Conseil Supérieur de la Statistique (1895, p.285), l'appréciation suivante à propos de la statistique judiciaire en France : "L'organisation du service est des plus simples. Le Ministère de la Justice envoie à chaque procureur général, un certain nombre de cadres statistiques à faire remplir par les procureurs de la République. Le procureur général reçoit le travail des procureurs de la République placés sous ses ordres. Il les vérifie sommairement et les envoie tels quels au Ministère de la justice. Aucune instruction détaillée n'est donnée aux procureurs pour leur expliquer comment ils doivent faire le travail qui leur est confié ; chacun s'y prend comme il l'entend, se sert des documents, (feuilles d'audience. dossiers, etc.), qui lui paraissent les plus commodes, et les dépouille comme bon lui semble. Il en résulte qu'à cet égard, chaque parquet a ses traditions. Peut-être y aurait-il lieu de choisir entre tant de méthodes différentes quelle est la meilleure et de la recommander plus spécialement".

Mais c'est surtout en comparaison avec ce qui se fait dans les pays européens que la situation française est jugée dépassée. La longue circulaire du 30 décembre 1905 commence par une énumération des pays qui ont suivi avec bonheur les recommandations des congrès internationaux de statistiques permettant l'amélioration de la statistique criminelle. Au terme de celle-ci, l'auteur constate que "seule, la France a, depuis 1827, rédigé sa statistique criminelle dans la même forme et suivant la même méthode. Cette pratique, en dépit des excellentes traditions qui se sont perpétuées à cet égard, aussi bien dans les parquets qu'à la Chancellerie. ne peut, de l'aveu de tous, que nuire aux progrès de la statistique criminelle française, puisqu'il est reconnu que ses données ne sont plus en rapport avec les besoins modernes".

1.2.2.- La fiche statistique individuelle (1905-1913)

C'est donc officiellement pour étendre aux tribunaux correctionnels les résultats disponibles seulement en matière de poursuite criminelle -il s'agit essentiellement des caractéristiques individuelles des accusés- qu'est mise en place progressivement à partir de 1905 une fiche individuelle.

Dans un premier temps, seul l'objectif est déterminé : les cadres sont modifiés pour obtenir, au niveau des tribunaux correctionnels, d'une part, des comptages par infractions ou par individus (cf. ci-dessous à propos des unités de compte) et, d'autre part, des indications sur la profession des délinquants. Conscient du surcroît de travail imposé par cette demande, l'auteur de la circulaire du 30 décembre 1905 donne un conseil : "Je vais d'ailleurs vous signaler comment j'entends que ce relevé soit fait. Si, dans de très rares parquets, on se borne encore à compulser les procédures au moment d'établir le compte, ce qui exige beaucoup de temps et provoque bien des erreurs, je sais que dans beaucoup d'autres on a sagement établi, en vue de la préparation des statistiques, un système de fiches sur lesquelles sont inscrites, jour par jour, toutes les indications relatives aux affaires et aux prévenus, avec tous les détails qui doivent entrer dans le travail définitif. Je ne saurais trop recommander cette dernière méthode, qui, mieux que toute autre, permettra à vos substituts d'établir la situation exacte de chaque prévenu, de constater tous les doubles emplois, d'opérer les soustractions nécessaires, de dénombrer enfin les individus différents (souligné dans le texte) ayant été l'objet d'un ou de plusieurs jugements. Ceci fait, il ne restera plus au rédacteur du compte qu'à classer chaque prévenu dans l'une ou l'autre des rubriques désignées, au titre de l'infraction la plus grave relevée dans le jugement unique, ou dans l'un des jugements qui lui sont applicables."

En dépit de la référence faite aux systèmes étrangers, il n'est donc pas question d'un système centralisé des fiches individuelles : "Malgré les avantages incontestables que présente ce dernier système, il ne saurait être question, pour le moment, de l'adopter en France. J'entends, du reste, ne pas priver mon Administration du concours expérimenté qu'apportent les magistrats à la préparation des statistiques, convaincu que leur participation à ce travail donne à l'authenticité des renseignements autant de garantie que toute autre méthode."

Est-ce la réponse à BERTILLON et aux critiques savantes venues de l'étranger ? La Chancellerie n'a malgré tout qu'une confiance limitée dans le sérieux de ces magistrats : la circulaire met en place le système des "cadres bis". Le procureur général fait collecter, pour toutes les juridictions de la cour d'appel, les cadres statistiques remplis. Puis il "sera chargé de vérifier ces documents, d'en récapituler le contenu sur des états spéciaux... et de transmettre le tout à la Chancellerie. Cette décentralisation des travaux statistiques aura le double avantage de faciliter la surveillance que vous devez exercer sur les tribunaux de votre ressort, et de vous permettre de me faire des observations générales ou particulières que ne manquera pas de vous suggérer l'examen des matières faisant l'objet de chacun de ces cadres."

La circulaire de 1906 fait état d'un résultat plutôt satisfaisant de cette réforme, insistant sur le travail de contrôle entrepris à la Chancellerie. Le tableau concernant les "conditions personnelles des prévenus" est présenté comme étant sans changement. Ce n'est que pour mesurer "la part qui revient à l'alcoolisme dans le mouvement des crimes et délits" que la Chancellerie impose l'utilisation d'une fiche individuelle destinée à recueillir le résultat de l'enquête prescrite au parquet pour découvrir les faits "provoqués par l'alcoolisme".

La circulaire de 1907, reprenant la question brièvement, se borne à rappeler que "les éléments de cette statistique ont dû être recueillis à l'aide du système de fiches individuelles prescrit par la circulaire du 20 décembre 1906 et inauguré le 1er janvier 1907."

La circulaire de 1908 franchit le dernier pas : son titre porte "Statistique. Généralisation du système des fiches individuelles. Envoi des comptes rendus trimestriels d'assises". Les fiches individuelles, dont le modèle est maintenant fourni, devront être utilisées en cas de poursuite pour toutes les affaires, à l'exclusion des délits "qui présentent... un caractère simplement contraventionnel. Tels sont notamment la plupart des délits en matière de réglementation du travail". La généralisation de la fiche ne correspond pas à une modification importante des cadres. Cela avait déjà été fait en 1905. L'objectif clairement affirmé à la fin de la circulaire est "de faire reposer la statistique sur des bases sûres". Désormais, en réponse à toutes les critiques, "la sincérité des états statistiques ne sera plus contestable, car elle pourra être aisément contrôlée". Le moyen de contrôle envisagé se limite donc toujours au relais des procureurs généraux sur qui ne pèse que la menace "de faire venir à la Chancellerie les fiches qui pourront m'être nécessaires pour élucider tel ou tel point de la statistique".

De ces éventuels contrôles, nulle trace dans les circulaires des années suivantes qui maintiennent ce système sans relever de difficultés particulières d'application.

Ce n'est qu'avec les instructions de la fin de 1913 (circulaire du 1er décembre 1913) que l'on repère une volonté de parfaire l'ensemble : si l'examen des conditions individuelles est restreint aux seuls condamnés, la limitation aux délits communs est levée. Il est alors demandé de comptabiliser l'ensemble des condamnés correctionnels quelle que soit l'infraction sanctionnée.

En outre, le lien doit être fait entre infraction, condition personnelle du condamné et récidive. Ce dernier effort tournera court. Le système de la fiche individuelle est abandonné avec la rupture imposée par la guerre : à la reprise des travaux statistiques, on revient au système antérieur et au multicomptage des individus.

On peut noter cependant qu'entre-temps ce système de fiche individuelle avait été également prescrit pour tous les mineurs de 18 ans impliqués dans une procédure (circulaire du 28 décembre 1911) pour être également supprimé pendant la guerre. Ces abandons, initialement qualifiés de provisoires. durent jusqu'après la seconde guerre.

1.2.3.- Les fiches de casier judiciaire

Ce n'est qu'au début des années 1950 que l'on voit reparaître l'idée du recueil de renseignements statistiques au niveau individuel. Le Compte général de 1953 publie (dans un volume regroupant les années 1952 à 1955) le résultat des poursuites correctionnelles à la fois selon le système des Cadres des parquets et selon l'exploitation mécanographique des duplicata des fiches de casier judiciaire.

Il semble qu'en fait ce nouveau mode de production résulte d'une lente gestation. Son expérimentation est lancée à la fin de 1949. Une circulaire du Garde des Sceaux du 26 septembre débute ainsi : "Mon attention a été appelée, à plusieurs reprises, sur les inconvénients qui résultent des conditions dans lesquelles sont recueillis, chaque année, par les Parquets, les renseignements statistiques destinés à l'établissement du Compte général de l'Administration de la justice. Ce document ne peut être publié qu'avec un retard considérable et sans garantie suffisante d'exactitude. J'envisage, en conséquence, de réorganiser progressivement les services de la statistique, en faisant établir celle-ci selon des procédés mécanographiques".

Cette annonce, qui ne fait aucune référence à l'ancienne fiche individuelle, est une rupture : l'exploitation centralisée des renseignements individuels par des moyens modernes permettra "au vu des résultats de cette tentative ...d'envisager dans l'avenir la suppression complète des statistiques annuelles".

En fait, dès 1945, le casier judiciaire devient une source d'alimentation pour divers organismes de traitement des informations judiciaires. L'I.N.S.E.E. [9] se voit ainsi confier en 1946 la gestion des incapacités électorales résultant d'une condamnation. Ceci implique la normalisation des documents pré-imprimés utilisés, de leur dactylographie et de leur collecte. C'est le but d'une circulaire technique datée du 15 décembre 1946.

Tout ceci prépare le terrain pour la nouvelle méthode que l'on baptisera "statistique mécanographique" par opposition à "statistique des parquets". Il suffira d'ajouter à la liasse un duplicata supplémentaire rendu anonyme de la fiche de casier judiciaire et de lui faire suivre le même chemin que l'exemplaire destiné au fichier des incapacités électorales, c'est-à-dire l'envoi à la Direction régionale de l'I.N.S.E.E. dont dépend le tribunal. L'I.N.S.E.E. restitue en fin d'exploitation des tableaux donnant la répartition des condamnations prononcées selon les critères extraits des fiches (infraction, sanction, sexe, âge, profession et nationalité des condamnés) de façon beaucoup plus détaillée que la statistique traditionnelle.

C'est en 1952 que débute la collecte (décret du 16 novembre 1951), mais l'administration ne précipite pas les choses. On attend les résultats de l'exploitation mécanographique avant de supprimer les cadres manuels. Finalement cette suppression, limitée en fait au tableau croisant le résultat des poursuites avec les infractions et aux tableaux donnant le sexe et l'âge des condamnés, ne sera décidée que pour 1955, après une comparaison des deux systèmes sur trois années. Cette comparaison a vraisemblablement donné satisfaction aux statisticiens de l'époque et a permis en tous cas de préciser les instructions de collecte, de chiffrement et d'exploitation pour éviter les erreurs rencontrées lors des contrôles. Sur ce plan l'opération semble avoir bénéficié de la garantie technique apportée par l'I.N.S.E.E..

Néanmoins, comme on le verra lors de la présentation des séries concernées par ce changement de mode de production, la continuité statistique n'est pas garantie. La différence essentielle vient du mode de traitement des jugements par défaut. Ceux-ci peuvent faire l'objet d'une opposition de la part du condamné, et donc être suivis d'un nouveau jugement de la même juridiction, dans un délai très variable. On ne peut dès lors fixer une règle évitant les doubles comptes tout en donnant des résultats statistiques dans un temps acceptable. C'est d'ailleurs sur ce point que l'exploitation devenue ensuite informatique des duplicata de fiches de casier judiciaire échouera finalement à la fin des années 1970. La croissance importante du nombre des jugements par défaut et de leur délai de traitement par les greffes conduit encore aujourd'hui à des retards de collecte de l'ordre de deux ans. Ce handicap concerne d'ailleurs aussi le casier judiciaire lui-même dont on peut penser qu'il donne une image assez infidèle d'une partie des condamnations prononcées.

On verra d'ailleurs plus loin (paragraphe 2.3) que pour des raisons de fiabilité et en raison de ruptures de séries trop importantes, nous n'avons pas pu utiliser cette source statistique après le transfert de l'exploitation de l'I.N.S.E.E. au ministère de la Justice en 1979.

1.3.- Les unités de compte

La définition des unités de compte est de nos jours un obstacle sérieux à la rénovation du système statistique en matière pénale, aussi bien en matière judiciaire (AUBUSSON 1987) qu'au niveau policier (AUBUSSON 1988).

L'appareil conceptuel mis en place en 1825 semble avoir stabilisé dans un premier temps les définitions utilisées pour le comptage : on emploie comme unités simultanément l'affaire et la personne.

La notion d'affaire a une apparence aussi naturelle pour les praticiens que la personne. L'affaire, c'est l'unité de traitement : le dossier de la procédure écrite la matérialise assez facilement. L'inconvénient de cette unité de compte est que d'une affaire à l'autre, le contenu peut varier à bien des points de vue.

Une affaire peut concerner plusieurs personnes (complicité). peut viser plusieurs infractions (identiques répétées ou différentes), peut donner lieu à chaque étape de la procédure à des décisions multiples (plusieurs décisions d'orientation au parquet ou à l'instruction, plusieurs arrêts ou jugements en fin de parcours). Chacun de ces constituants (personne, infraction, décision) peut fournir une unité de compte concurrente de l'affaire. Tant que l'affaire reste une unité concrète de gestion, elle est un point de passage obligé de la statistique. Néanmoins, on s'accorde à penser aujourd'hui qu'un net progrès dans l'uniformisation entre les juridictions, voire entre les types de contentieux, doit être obtenu pour que l'affaire reste une unité statistiquement pertinente.

Ceci n'empêche qu'il soit aussi nécessaire de combiner l'affaire avec d'autres unités de compte.

La personne était évidemment imposée dès le début de la statistique comme unité à côté de l'affaire puisque l'auteur d'une infraction est le support élémentaire d'un bon nombre de décisions. On relèvera d'ailleurs que pendant longtemps (jusqu'en 1932) la statistique pénale a utilisé conjointement les deux unités de compte -affaire et personne- sur les mêmes objets, avec quelquefois l'intention explicite de comparer les résultats obtenus avec l'une ou l'autre.

Ici, il convient de préciser que l'unité personne, qu'il s'agisse d'inculpés, d'accusés, de prévenus, d'acquittés ou de condamnés, est en fait un croisement de la décision et de l'individu. Un même individu impliqué au cours de l'année dans plusieurs procédures différentes sera compté plusieurs fois.

Sans entrer dans le détail des choses -ce qui sera fait lors de l'analyse des séries- on peut relever qu'il n'est pas possible de rendre compte de l'ensemble du fonctionnement de la justice pénale avec une seule des deux unités de compte. La description de l'activité du parquet et des juges d'instruction n'est possible qu'en comptant des affaires dont certaines ne visent personne (auteur inconnu), tandis que les sanctions finales et les mesures provisoires supposent un comptage par personne-décision. Jusqu'en

1932, le comptage en personne ne commence qu'à l'instruction et, entre 1933 et 1978, il n'est utilisé que pour le résultat du jugement ou la détention préventive.

A partir de la fin du XIXème siècle, les spécialistes de la statistique criminelle précisent la critique des unités de compte adoptées par le système français.

D'un côté le comptage en affaire ne correspond pas à l'ambition que l'on conserve de faire de la statistique criminelle une mesure de la criminalité : il faudrait pour cela compter des faits et donc au minimum des infractions [10]. De l'autre côté, la volonté de mettre en rapport la population des criminels ou des délinquants poursuivis avec la population totale au regard du sexe, de l'âge, etc. conduit à regretter le comptage multiple de certains individus au cours d'une période donnée.

Les comparaisons internationales qui sont évoquées dans les circulaires statistiques et dans les Rapports du Compte général entre 1905 et 1907 (circulaire du 30 décembre 1905, Compte général pour 1905 p. V et s.) conduisent ainsi à un enrichissement momentané des unités de compte : on cherche à recenser les infractions poursuivies et la population concernée pendant une période donnée. C'est la fiche individuelle dont on a parlé plus haut qui doit fournir la base de ces comptages sur plusieurs unités, mais de fait la statistique reste, même pendant cette période, essentiellement organisée autour des notions d'affaires et de personne-décision. D'ailleurs, comme on l'a dit, la guerre puis l'effondrement du système de statistique judiciaire viendront mettre fin à cette tentative.

Pour terminer, on relèvera que des unités de compte décrivant mieux l'activité des magistrats et auxiliaires de justice -au sens de travail fourni- ne sont pas recherchées, au moins dans la statistique criminelle. La statistique civile est nettement plus orientée dans ce sens et il est même curieux de remarquer que quelques comptages en terme de jugements figurent, à certaines périodes, pour les juridictions pénales dans les tableaux du Compte civil. D'ailleurs, au cours des années 1970, à côté des cadres des parquets, les juridictions pénales fournissaient encore à la direction des Services judiciaires de la Chancellerie, des états statistiques destinés à évaluer leur activité. Les deux systèmes de collecte de renseignements n'ont été fondus en un seul qu'en 1984.

2.- Construction de la base de données

2.1.- Le choix des séries

Comme nous l'avons exposé, un point sensible de l'organisation de notre travail était la sélection des données retenues pour cette première étape de la construction de la base DAVIDO.

Notre démarche commençant par la reprise d'un travail ancien, la première orientation fut de rechercher si tout ce qui nous semblait utile de relever l'était dans les fichiers hérités de l'Unité de Recherche de Sociologie Criminelle du C.E.S..

Nous avons conservé comme début de nos séries l'année 1831, date de consolidation des statistiques criminelles quant à leur contenu : c'est en effet cette année qu'on voit apparaître pour la première fois dans le Compte général les tableaux concernant le parquet (renseignant notamment sur l'origine des affaires, la première orientation qui leur est donnée, les classements sans suite), ainsi que les tableaux concernant l'activité des juridictions d'instruction - soit 36 séries supplémentaires pour ce qui concerne notre base de données. Par ailleurs d'autres tableaux sont enrichis cette même année de nouveaux renseignements - en matière de détention provisoire, de récidive correctionnelle, d'exécution des peines d'emprisonnement correctionnel ou d'activité des chambres d'accusation - soit 23 séries suplémentaires.

En conclusion : sur les 225 séries de la base, plus de la moitié, sont renseignées en 1831 (soit 127, dont 68 sont antérieures à 1831 et 59 apparaissent cette année -sur ces 59 séries, 36 correspondent à de nouveaux tableaux).

D'autres renseignement, ne seront publiés que plus tard. C'est le cas des effectifs des agents de la police judiciaire (1842) ou des modes de jugements correctionnels (1856).

Il apparaissait en revanche que des choix restrictifs avaient alors été faits en fonction des objectifs théoriques retenus par André DAVIDOVITCH. Dans le cadre d'une analyse de l'évolution du traitement de la criminalité, sous-tendue par l'idée que les normes sociales sont sujettes à une perpétuelle ré-évaluation se traduisant par des attitudes évoluant différemment selon le type d'illégalismes réprimés, l'accent était mis sur la nature de l'infraction. Selon cette vision, une série statistique n'a d'utilité que si elle peut être ventilée par types d'infractions.

Pratiquement un tel choix n'est pas tenable sur l'ensemble de la période. En effet, après 1932, seules les séries concernant le jugement sont ventilées par types d'infractions, si bien qu'en grande partie les hypothèses faites (notamment sur le rôle du parquet dans l'ajustement des normes légales aux normes effectivement dominantes) deviennent invérifiables et qu'à s'en tenir au principe initial la base de données se réduirait à peu de choses.

Au C.E.S., les opérations avaient donc été menées sur deux fichiers distincts, l'un couvrant toute la période utile (1831-1968 à l'époque) pour les séries intégralement disponibles par types d'infractions, l'autre sur la période 1831-1932 pour les séries dont la ventilation par infractions n'est disponible que sur cet intervalle. D'où i1 résultait pour commencer que les séries qui ne sont pas ventilées par infractions après 1932 n'étaient pas relevées au delà [11], et pour finir, qu'aucune série non ventilée par infractions n'avait été retenue.

Nous avons donc dû reprendre les opérations de relevé dès lors que notre objectif prioritaire était la description et la compréhension du fonctionnement de la justice pénale.

La première étape fut de compléter la base de données par toutes les séries qui sont disponibles de facon globale sur l'ensemble de la période. Cela couvre les séries concernant l'orientation des affaires au parquet, puis à l'instruction et les séries relatives à la détention préventive.

Ensuite, et comme le travail d'interprétation était déjà commencé, il est apparu qu'un bon nombre de séries, disponibles jusqu'en 1932 seulement et non ventilées par infractions. étaient indispensables à l'interprétation des flux au sein de la justice pénale. Autrement dit : habitués pour le temps présent à ne disposer que de quelques éléments statistiques très globaux sur les modes de poursuites et leurs résultats, nous pensions que ce petit stock toujours disponible après 1932 constituait l'essentiel. L'analyse des résultats prouvait le contraire pour la période 1831-1932. Dans un second temps, nous avons donc relevé de nouvelles séries pour cette première période de la statistique criminelle. Finalement les séries reprises des anciens fichiers fournis par André DAVIDOVITCH au C.E.S.D.I.P. ne représentent que le quart de la base DAVIDO à ce jour.

Mais nous n'avons pas recherché l'exhaustivité du relevé pour autant. Un bon nombre de séries pourront être ajoutées ensuite à la base DAVIDO, toujours au niveau global de l'ensemble des infractions pour la période 1831-1932. Nous nous sommes arrêtés pour l'instant à un ensemble suffisant pour fournir un premier cadre d'interprétation des flux judiciaires depuis l'entrée au parquet jusqu'à la mise à exécution des peines d'emprisonnement ferme. Il ne permettra pas de répondre à toutes les questions que cette description engendrera car certains croisements manqueront : par exemple on ne connaît pas le résultat du jugement correctionnel selon le mode de poursuite (après instruction, en flagrant délit, ou sur citation directe) alors que d'autres croisements en indiquent la pertinence.

Nous avons cependant le sentiment que nos choix respectent la construction statistique du Compte général telle qu'elle se présente à sa meilleure période. Les cohérences observables entre les tableaux et l'architecture globale indiquent en filigrane un souci de description compréhensive des statisticiens du milieu du XIXème siècle face à la justice pénale. En l'absence d'une présentation méthodologique due aux auteurs eux-mêmes [12], seul l'exercice prolongé d'un questionnement des séries permet d'en retrouver les grandes orientations.

Un certain nombre de secteurs ont donc été provisoirement délaissés.

Les caractéristiques des personnes jugées d'abord : ce pan de la statistique criminelle sera repris avec les séries détaillées par types d'infractions, puisque c'est dans les tableaux donnés avec ce détail que l'on trouve les renseignements individuels.

Les tableaux qui à partir de 1905 donnent des indications spécifiques aux mineurs ne sont pas repris dans la base DAVIDO. D'une part un certain nombre d'éléments ont été publiés sous la direction de LEVADE (1972) dans la rétrospective sur "la délinquance des jeunes en France. 1825-1968". D'autre part, à partir de 1952, la publication des statistiques relatives à la justice des mineurs est séparée du Compte général : notre limitation à cette publication ou à ses sources pour nos relevés interdit donc une prolongation sous une nouvelle forme de ce premier travail de sérialisation propre aux mineurs délinquants.

Les tableaux destinés à l'étude de la récidive occupent une bonne place dans le Compte général jusqu'en 1913. La qualité des données et leur hétérogénéité comme on le verra dans la section consacrée à ce sujet, nous ont conduits à nous limiter aux deux principales séries d'ensemble.

Enfin, sans parler d'une bonne quantité de chiffres présentés par la table des matières du Compte général sous la rubrique "renseignements divers", nous avons aussi laissé de côté deux sujets qui appelaient l'attention des producteurs de statistiques au XIXème siècle: l'exercice des voies de recours (appel, cassation) et les durées des procédures.

En dehors de l'exclusion des séries propres aux mineurs, nous n'avons donc eu aucune motivation de principe pour exclure des séries non relevées dans la base DAVIDO à ce jour. Finalement, nous avons relevé l'ensemble des données accessibles dont l'analyse faisait progressivement sentir le besoin. On ne pourra donc juger de la cohérence du choix des séries retenues qu'avec l'interprétation des résultats. On trouvera sans doute alors que nous avons été guidés en bonne partie par des raisons théoriques, comme ce fut le cas pour nos prédécesseurs du C.E.S.. On pourra aussi estimer que l'absence de séries par infractions limite l'intérêt de cette base de données à son stade actuel.

A quoi nous pouvons répondre sur un plan méthodologique.

L'analyse des résultats et l'examen détaillé des séries que nous avons relevées, de leur cohérence et de leurs définitions respectives, nous ont permis en bonne partie de restituer l'appareil conceptuel non présenté par le Compte général lui-même mais qu'il contient pourtant implicitement. Dans ce sens, nous pouvons dire que nos choix de séries épuisent largement la question. Ou du moins, qu'à partir des seuls éléments publiés, on ne peut guère en dire plus. et en tout cas, pas en relevant et examinant des séries supplémentaires.

Quant au report de la constitution des séries par infractions, il parait évident que la définition précise des séries au niveau global est un préalable à cette tâche, pourtant elle-même indispensable à la compréhension même de certains résultats d'ensemble. Nous n'avons d'ailleurs pas échappé complètement à cette nécessité puisque nous avons dû relever un éclatement de certaines séries correctionnelles entre délits communs et délits spéciaux, tant le traitement de ces derniers était particulier au XIXème siècle. Mais il n'était guère envisageable de traiter de front les questions de méthode liées à la définition des séries et celles, tout aussi nombreuses, relevant de l'évolution des incriminations et de la nomenclature que le Compte général utilise pour les décrire.

2.2.- La construction des séries

Donner une suite de chiffres relevés dans le Compte général sous un intitulé commun à toute la période de relevé, c'est affirmer la possibilité de les considérer comme une série statistique. C'est donc faire l'hypothèse que ces chiffres proviennent d'une définition stable, concernent un champ statistique fixe et sont obtenus selon des règles de production fixes. Autant dire que sur un siècle et demi, en matière judiciaire aucune série statistique ne peut être déduite de la suite des chiffres relevés.

Abandonnons alors les grands principes de la statistique pour indiquer dans quel sens ce que nous proposons comme suite de chiffres peut être considéré comme une série statistique.

Nous avons avoué en savoir très peu sur les conditions pratiques de production de la statistique criminelle. Nous ne connaissons que très rarement les modifications intervenues à ce niveau. Nous n'avons jamais pris en compte ce critère pour distinguer des séries différentes. Pour chaque série ou chaque groupe de séries concernés par des changements connus, on a indiqué les risques de rupture d'homogénéité qui en découlent.

De même le champ géographique décrit par les séries est légèrement variable entre 1831 et 1981. Cet aspect est abordé plus loin de facon générale. Dans la mesure où il concerne à l'identique l'ensemble des séries, rien n'en résulte pour la définition d'une série particulière.

Reste alors la définition juridique même conduisant à la publication d'un chiffre ou d'une suite de chiffres. Une solution consisterait à ne retenir comme constituant une série statistique qu'une suite de chiffres répondant strictement à une même définition juridique. Cela ne garantit rien quant à l'homogénéité temporelle des pratiques couvertes par cette définition légale, mais cela fournit une méthode possible. A ceci près que le Compte général n'opère pas toujours ainsi et met à l'évidence bout à bout des chiffres, même en cas de modification législative : par exemple, lorsque la majorité pénale change, l'organisation des colonnes du tableau donnant le résultat des poursuites correctionnelles n'est pas modifiée et emploie à l'identique le terme de "mineurs" qui ne couvre plus les mêmes cas. Nous avons donc suivi le Compte général dans sa sérialisation "sauvage" passant outre les modifications juridiques.

Dès lors, à un premier niveau, on peut considérer comme une série sur une certaine période soit une suite de relevés correspondant à une définition inchangée, soit ce qui est présenté par le Compte général comme une série : intitulé fixe ou pratiquement fixe malgré une modification du régime juridique, ou regroupement de cas de contenu variable mais occupant manifestement la même place dans une nomenclature. Cette dernière situation vise au premier chef la rubrique "autre" des nomenclatures utilisées par le Compte général. Là encore les modications de contenu repérables dans la série ainsi constituée sont détaillées au cas par cas ou par groupe de séries.

Pour le reste nous avons essayé de nous tenir au plus près de la publication et les séries présentées ici ne recourent qu'exceptionnellement à des calculs faits à partir des relevés ou à la mise bout à bout de relevés identifiés comme hétérogènes dans leur définition juridique.

L'exception comporte deux cas de figure. Tout d'abord celui des séries concernant la mise en liberté provisoire. On verra que les fréquentes modifications juridiques dans ce domaine sont accompagnées de nomenclatures statistiques mouvantes et, tout en restant malgré tout encore très près des séries de base, nous avons dû opérer un premier travail de reconstruction pour éviter de sombrer dans une multitude de séries définies sur très courte période. L'autre cas vient en général de certaines définitions éphémères adoptées dans les Cadres du parquet : par exemple

quelques séries sont éclatées en plusieurs postes pendant quelques années avant d'être réunies en un seul sur une plus longue période. Nous avons estimé, qu'à moins d'être indispensable à la précision des définitions juridiques, une série devait avoir une certaine "longueur" pour être pertinente et que le détail apporté par la publication pour quelques années seulement n'avait guère d'utilité à présent. Mais là encore, toutes ces informations et toutes ces décisions sont consignées dans la description des séries de facon à ce que l'utilisateur en retrouve la trace et puisse en se référant au Compte général retrouver les détails omis et en tout cas la provenance de nos chiffres.

De tout cela, on retiendra que nous avons pris le parti de publier ici, et de rendre accessible sous forme informatique, des séries à un niveau de détail assez grand. Viendra ensuite, au moment de l'analyse des résultats, la présentation de séries reconstruites ou calculées qui seront évidemment ajoutées à la base DAVIDO, mais cette fois avec un statut différent. La reconstruction des séries repose alors largement sur le travail d'interprétation lui-même : c'est bien souvent pour pouvoir dire quelque chose sur une longue période ou pour synthétiser des résultats en fonction d'un certain questionnement que l'on arrive à la construction d'une série historique sur longue période. Pour ce premier niveau de la base DAVIDO, nous en sommes restés finalement à des considérations très proches de l'état de la source statistique.

2.3.- La fiabilité des séries

Il est difficile de donner des indications précises quant à la fiabilité des séries statistiques construites à partir du Compte général dans la mesure où l'on ne sait rien sur les méthodes employées pour remplir les Cadres statistiques dans les juridictions.

La seule indication précise et directe dont on dispose est de nature purement interne à la source : les règles de cohérence imposées entre les divers chiffres fournis sont plus ou moins respectées selon les périodes. Encore ces écarts ne permettent-ils que de détecter des erreurs certaines. Là où il doit y avoir une relation arithmétique entre plusieurs variables, l'inadéquation des valeurs données par le Compte général permet de conclure qu'au moins une de ces valeurs est erronée. Inversement, on ne peut déduire de la cohérence observée que les valeurs sont justes. Elles peuvent être alors simplement redressées pour faire disparaître les incohérences. Ou bien de façon intermédiaire, les relations entre les renseignements demandés peuvent être utilisées pour estimer certains d'entre eux (technique à laquelle nous recourons d'ailleurs pour estimer les valeurs manquantes ou trop manifestement aberrantes).

Reste alors l'hypothèse plus ou moins plausible que l'aptitude à produire des chiffres fiables et à fournir des chiffres cohérents vont de pair.

Cela n'est certainement pas vrai pour la période actuelle. Depuis l'apparition de la statistique "mécanographique" des condamnations, les règles de cohérence à respecter sont suffisamment simples pour ne rien indiquer quant à l'exactitude des chiffres. On pourrait même adopter l'hypothèse inverse selon laquelle en l'absence de méthode de comptage précise et praticable en continu plutôt qu'une fois par an, la cohérence est le signe même de l'estimation plus ou moins fondée. Prenons un exemple: actuellement la statistique d'orientation des affaires au parquet dans les bureaux d'ordre gérés manuellement n'a pas de support de comptage adapté. Son origine est alors au mieux un dépouillement du registre annuel des plaintes et procès-verbaux. Mais les chiffres fournis entrent dans une équation de flux/stock. Cela suppose donc qu'on dépouille non seulement le registre de l'année qui ne comprend que les affaires entrées entre le 1er janvier et le 31 décembre, mais aussi le registre de l'année ou des années précédentes en vérifiant la date de décision afin d'introduire dans la statistique annuelle l'ensemble des affaires orientées dans l'année quelle que soit la date d'arrivée. Les délais de traitement des affaires ne sont plus tels -même au parquet- que l'on puiss, avec le léger recul pris pour l'établissement de la statistique (1 ou 2 mois après la fin de l'année), tenir les conséquences du non respect de cette règle de comptage pour négligeable. La cohérence sera alors sans doute le plus souvent obtenue par une estimation ne laissant pas de trace.

Mais pour d'autres cohérences plus complexes, imposant en particulier l'égalité de la sommation par lignes ou par colonnes dans les marges d'un tableau croisé, on peut observer de facon plus sûre la dégradation de la fiabilité des séries. Il en était ainsi au début des années 1970 d'un tableau croisant la durée de la détention provisoire et son mode d'achèvement. Cette cohérence est d'autant plus délicate que les éléments de l'une des marges du tableau entrent dans d'autres contraintes de cohérence.

L'estimation reste virtuellement possible, mais on observait de telles déviations dans les résultats fournis par les juridictions qu'on est amené à penser -et c'est là que notre première hypothèse retrouve un sens- que pour des agents peu formés aux techniques de redressement de tableaux croisés, la solution la plus simple pour obtenir ce genre de cohérence consiste à effectuer des comptages justes.

Si l'on se reporte à la période antérieure à 1932 on peut, de façon très globale, indiquer les grandes lignes d'une évolution. Jusque vers 1860, l'affinement de l'outil avec l'enrichissement des classifications et l'établissement progressif d'un maillage serré de cohérences va sans doute de pair avec une amélioration de la fiabilité des statistiques. La complexification apparente ne serait pas un obstacle à la fiabilité mais au contraire la base d'un contrôle qui s'accentue grâce à des consignes plus précises. Le tout sur le fond d'une croissance maitrisable des volumes traités.

Alors que pendant les années 1860-1890 l'outil n'est modifié que pour tenir compte des changements législatifs, la fin du XIXème siècle voit arriver les premiers signes de faiblesse. On commence à noter certaines exceptions aux règles de cohérence et les tableaux publiés par juridictions deviennent moins nombreux. Un certain nombre de séries qu'on relevait auparavant dans des tableaux croisés n'apparaissent plus qu'en note de bas de page. Les moyens mêmes de vérifications basés sur les cohérences diminuent donc pour le lecteur d'aujourd'hui. Tout cela se passe alors que certaines séries sont en augmentation rapide, certains ordres de grandeur devenant sans doute plus difficilement maitrisables (les classements sans suite par exemple).

L'épisode de la fiche individuelle pour l'établissement des séries correctionnelles (1905-1913), au delà de ses justifications par des besoins nouveaux de connaissance sur les caractéristiques des condamnés, traduit aussi la volonté de moderniser un système de recueil de l'information que déjà on considère comme vétuste et donc -même si on ne l'écrit pas- peu fiable.

Après la rupture due à la première guerre, la dégradation s'accentue. Non pas que les renseignements disparaissent ou deviennent incohérents : c'est plutôt la partie "Rapport" qui manifeste clairement un désinvestissement de l'autorité centrale des questions statistiques. Retard croissant dans la publication, diminution du nombre de pages, commentaire de plus en plus répétitif... Quant aux chiffres, ils proviennent à nouveau tous des cadres statistiques dont les rubriques finiront par ne plus suivre correctement l'évolution législative (voir les séries sur la mise en liberté provisoire). Finalement, quand les économies budgétaires viennent justifier une diminution considérable de la publication à partir du volume de 1933 publié en 1936, c'est un ensemble certainement moins fiable dans lequel on opère une sélection qui ne préserve pas toujours l'essentiel comme le prétend l'auteur du Rapport (page XI).

Dès lors, et jusqu'en 1956, la statistique paraît un peu cahotique. Aux coupures de séries s'ajoutent des variations importantes que l'on peut attribuer aussi bien à des perturbations de l'appareil pénal qu'à de grandes incertitudes dans l'établissement des statistiques. Le temps mis pour les publier -jusqu'à 6 ans de retard- laisse imaginer qu'en ces jours le contrôle de la qualité des statistiques ne devait pas avoir une grande priorité. Si les retards de publication diminuent un peu ensuite, et si les principales cohérences sont respectées, on ne saurait en déduire un accroissement de fiabilité. Pour l'instruction, on peut considérer que les chiffres restent à un niveau permettant aux méthodes traditionnelles d'aboutir encore à des résultats significatifs. Au contraire, le mouvement des affaires traitées par les parquets est tel que les chiffres perdent certainement toute précision. Dès les années 1960, le phénomène est encore aggravé par le déferlement du contentieux en matière de chèques pour lequel aucune règle de comptage précise n'est formulée lors de l'envoi des cadres statistiques.

Le seul domaine où les choses changent est celui des condamnations. La mise en place d'un nouveau système de production statistique -l'exploitation des duplicata de fiches de casier judiciaire- et sa réalisation par l'I.N.S.E.E. assurent certainement une meilleure fiabilité aux chiffres fournis par le Compte général, même si la modification du champ statistique crée une rupture. Là encore il convient de distinguer au moins deux périodes.

Après la mise en place du système en 1952-53 -accompagnée d'ailleurs jusqu'en 1954 d'une double exploitation, cadres manuels et statistique mécanographique- et jusqu'en 1971, la collecte statistique est suivie très régulièrement par les Directions Régionales de l'I.N.S.E.E.. De ces contrôles portant sur la qualité et l'exhaustivité de la collecte, il ressort qu'à l'exception des contraventions de 5ème classe pour lesquelles les tribunaux de police ont sans doute omis de transmettre une part significative des duplicata statistiques, on peut considérer que cette source statistique offre les mêmes garanties qu'en moyenne pour les autres statistiques produites à l'I.N.S.E.E..

L'informatisation de cette application en 1972 a eu des conséquences fâcheuses sur la collecte. Les juridictions ont mis très longtemps à trouver le bon destinataire et bien des fiches ont dû circuler en plusieurs endroits avant d'arriver à bon port. Pour les dernières années d'exploitation à l'I.N.S.E.E. -de 1976 à 1978- un toilettage des instructions de collecte, de codage et de contrôle d'exploitation a sans doute permis un redressement de la situation. Il est difficile à évaluer car entre 1965 et 1976, les amnisties présidentielles (1966, 1969, 1974) ne laissent pas beaucoup d'années utiles. De plus, on ne peut donner de suite à ces séries, ni au contrôle de leur qualité. puisque les chiffres produits à partir de 1979 par la Division de la statistique du ministère de la Justice, l'ont été sans souci de procéder à une prolongation des séries antérieurement produites par l'I.N.S.E.E.. Le même phénomène étant en train de se reproduire avec le passage à un nouveau mode d'exploitation en sous-produit du casier judiciaire informatisé, qui à ce jour n'a pas encore donné de résultats définitifs et complets pour les années postérieures à 1983, il faudra attendre de disposer de chiffres pour les années 1984-87 (1988 et 1989 étant en partie perturbées par une amnistie) avant de tenter une reconstruction des séries de condamnations pour la période 1976-1987 et d'avancer quelque jugement que ce soit sur la qualité de ces séries.

Finalement, en dehors d'une amélioration partielle et momentanée pour les statistiques de condamnation, on doit reconnaître -quoi qu'il en soit des causes de cet état de fait- que depuis plus d'un demi siècle, la statistique judiciaire pénale a du mal à se maintenir au niveau de la fiabilité minimale : celui qui permet d'accorder quelque signification aux ordres de grandeurs et aux mouvements les plus importants. Mais comme on a tenté de le montrer, on ne peut en déduire qu'il en a toujours été ainsi. La fiabilité "minimale" a été atteinte après une évolution à la baisse, visible à partir de la première guerre mondiale. La brusque coupure de 1933 est à ce titre comme la reconnaissance officielle du caractère secondaire et négligeable de la statistique pénale pour les praticiens de cette époque. Etat d'esprit qui est à l'opposé de celui que manifeste le Compte général un siècle plus tôt durant une période (1830-1880) pour laquelle il y a tout lieu de supposer que la statistique pénale n'avait rien à envier en fiabilité aux autres sources de la "statistique morale".

2.4.- La vérification des séries

Au second degré l'utilisateur pourra se poser des questions sur la conformité aux sources des chiffres que nous publions dans la base de données DAVIDO. Eviter les erreurs sur un tel ensemble de chiffres ne va pas de soi.

Pour commencer, nous bénéficions de ce que l'ordinateur, en règle générale, ne se trompe pas. L'édition présentée ici étant la reproduction d'un listing d'ordinateur, nous évitons le casse-tête des erreurs d'impression.

Ensuite, sur un bon nombre de séries, nous avons procédé à des vérifications visuelles. Elles sont fastidieuses et leur performance n'est pas absolue.

Nos outils ultimes de vérification ont été les contrôles de cohérence : rares sont les séries qui n'obéissent pas à une cohérence simple comme le total égale la somme des parties, et bien d'autres entrent dans des égalités plus complexes.

De tous ces contrôles, il est résulté soit la rectification d'une erreur imputable à nos manipulations, soit le constat que "l'erreur" existe dans le Compte général lui-même. Dans ce dernier cas, nous avons parfois retenu dans la base DAVIDO une valeur différente de celle qu'on avait primitivement relevée. Ces décisions sont toutes mentionnées dans la description des séries correspondantes. La plupart peuvent être interprétées comme la rectification d'une erreur d'impression; pour d'autres, il s'agit seulement de s'assurer d'une façon commode -mais souvent sans autre justification- de la permanence des contraintes de cohérence. Pour les dernières, il s'agit purement et simplement d'une estimation destinée à éviter les valeurs aberrantes trop gênantes pour la construction de graphiques et de séries calculées.

En définitive, l'utilisateur peut considérer -avec un risque que nous jugeons très faible- que la base est fiable par rapport à sa source et qu'elle comporte seulement des redressements qu'il lui est possible de supprimer en reprenant la valeur imprimée dans le Compte général. Néanmoins, le lecteur qui pourrait faire état auprès des auteurs d'une erreur matérielle passée inapercue d'eux, serait évidemment l'objet de toute leur reconnaissance.

2.5.- La base informatisée

Les tableaux que nous publions dans ce volume donnent l'image d'une base de données informatisée.

De ce que nous avons exposé sur la construction des séries, il résulte que l'on peut parler d'un premier niveau de la base DAVIDO pour lequel les séries sont disponibles année par année à leur niveau élémentaire de définition (pas de séries reconstruites ou calculées).

Dans le langage des logiciels utilisés (SAS, DBASE, FRAMEWORK), les séries, auxquelles s'ajoutent l'année de la statistique, sont les variables ou les colonnes d'un tableau. Pour chaque année, les valeurs relevées dans le Compte général forment les enregistrements de la base ou les lignes du tableau.

La taille du fichier dépend évidemment du logiciel utilisé. En format "délimité" ou en tableau, SAS il occupe environ 200 kilocaractères.

2.6.- La mise à jour de la base DAVIDO

Les chiffres contenus dans la base DAVIDO sont pour l'essentiel issus du Compte général. En dehors de quelques éléments manquants repris d'archives, seuls les chiffres provenant des Cadres des parquets pour les années 1979 à 1981 n'ont pas fait l'objet d'une publication détaillée. Ils figuraient néanmoins pour l'essentiel dans le Rapport du Compte général de 1978 réalisé par deux des auteurs du présent volume.

La publication intégrale et régulière des séries statistiques pénales n'a pas été poursuivie par la Division de la statistique du ministère de la Justice.

Nous n'avons pour l'instant pas cherché à résoudre les problèmes que posent en conséquence le prolongement des séries de la base DAVIDO. Ils sont d'ailleurs assez différents selon que les séries proviennent des Cadres du parquet ou de l'exploitation des condamnations inscrites au casier judiciaire. Pour les secondes, on a déjà indiqué comment deux ruptures de mode de production et un très grand retard d'exploitation imposaient de différer une reconstitution de séries qui s'annonce très ardue (voir ci-dessus, paragraphe 2.3). Pour les Cadres du parquet. outre d'éventuels retraitements des documents pour les années 1982 et 1983 dont l'exploitation a pu rester trop succincte pour nos besoins, on devra régler des questions de ruptures de séries liées soit à des modifications législatives importantes et nombreuses entre 1981 et 1986 soit à un remaniement conséquent du document de base en 1984.

Quelle que soit la source, il n'est d'ailleurs pas évident que la prolongation des séries soit pertinente au niveau détaillé de la base DAVIDO. On devra très probablement se contenter de propositions de prolongation au niveau de séries ad hoc construites ou calculées.

3.- Présentation des séries

3.1.- L'organisation des informations

Chaque série suppose la maîtrise d'une quantité importante d'informations. Nous avons déjà présenté celles qui concernent la source et le mode de production des statistiques criminelles. Nous présenterons encore ici un certain nombre d'observations qui valent pour toutes les séries. Ensuite l'examen des séries proprement dites commencera. Il sera mené selon un plan qui reflète en grande partie le déroulement de la procédure pénale et sa présentation dans le Compte général. Pour chaque regroupement de séries dans une partie de ce plan, certaines observations communes sont données dans un paragraphe intitulé "généralités".

De cette façon, allant du général au particulier, le lecteur peut prendre connaissance de l'ensemble des considérations entourant l'établissement d'une série. Le paragraphe concernant en propre une série ne contient donc pas toutes ses caractéristiques.

On y trouve systématiquement :

  • dans le titre du paragraphe, le nom donné à la série, son code dans la base informatique, les années de début et de fin. Le nom de la série, limité à huit caractères par les logiciels utilisés, tente de rappeler le contenu de la série. Il commence toujours par un A pour les comptages en affaires. par un P pour les comptages en personnes et par un N pour les séries donnant des effectifs d'agents. L'astérisque à la suite des années de début et de fin indique que des années autres que celles d'interruption de la publication (1914-1918 et 1939) sont manquantes à l'intérieur de la période considérée.
  • le titre développé de la série suffit souvent à en indiquer la définition. Il est reconstruit à partir des indications données par le tableau dont provient la série. Ses principales variations sont indiquées.
  • la description de la série ne donne que les valeurs manquantes qui lui sont propres. Les valeurs manquantes propres à un groupe de séries ou à toutes les séries (interruption de publication du Compte général) ne sont pas reprises à chaque série. Ces valeurs manquantes (absence de renseignement dans le Compte général) sont figurées dans la base de données par un point.
  • les commentaires propres à une série donnent en particulier les valeurs aberrantes et les corrections apportées ainsi que les estimations que l'on a pu tenter pour combler des valeurs manquantes.

On trouvera en annexe deux listes récapitulatives des séries classées l'une selon les tableaux de chiffres dont le découpage correspond au plan d'exposition, l'autre par ordre alphabétique.

3.2.- Généralités concernant l'ensemble des séries

3.2.1.- Le territoire national et le territoire couvert par la statistique

Les séries de la base DAVIDO ne concernent que la métropole. Cependant, au cours de la période 1831-1981, le territoire national s'est modifié, en particulier à cause des querres. De plus, pour diverses raisons les statistiques n'ont pas toujours été publiées de manière exhaustive. Le tableau qui suit présente les variations intervenues tant sur le territoire de la France métropolitaine ("champ géographique") que sur celui couvert par les statistiques publiées ("champ statistique").

Période Champ géographique Champ statistique
Avant 1860 Les départements de Savoie, Haute-Savoie et une partie des Alpes-Maritimes (le Comté de Nice) sont exclus. Le champ "statistique" est identique au "champ géographique".
De 1860 à 1869 Le territoire métropolitain correspond au territoire actuel, divisé en 90 départements. En 1860, le "champ statistique" ne correspond pas au territoire géographique : il manque encore les statistiques de la Savoie, de la Haute-Savoie et du Comté de Nice. A partir de 1861, les deux coïncident.
De 1870 à 1913 [13] Sont exclus les arrondissements de Colmar, Saverne, Strasbourg, Schelestadt, Wissembourg, Belfort et Mulhouse (du ressort de Colmar), ceux de Metz et Thionville (du ressort de Metz), ceux de Sarrebourg et Vic (du ressort de Nancy) - soit l'Alsace et la Lorraine. [13] Les arrondissements ne faisant pas partie du territoire national sont exclus également du "champ statistique". De plus, en 1870 et les cinq premiers mois de 1871, les statistiques du département de la Seine sont exclues en raison de l'incendie du palais de justice de Paris. En 1870, est aussi exclue la statistique du tribunal de Remiremont en raison également de l'incendie du palais de justice [14].
De 1914 à 1918 Sont exclus les départements suivants : Aisne, Marne, Ardennes, Meurthe-et-Moselle, Nord, Oise, Pas-de-Calais, Bas-Rhin, Haut-Rhin, Somme, Vosges. La publication du Compte général est interrompue pour cette période et les statistiques fournies par les juridications n'ont fait l'objet que d'une publication très partielle dans le Rapport du Compte général de 1919.
De 1919 à 1938 Le territoire métropolitain correspond au territoire actuel, divisé en 90 départements. De 1919 à 1924, la cour d'appel de Colmar ne figure toujours pas dans la statistique ; elle n'est réintroduite qu'à partir de 1925.
De 1939 à 1942 Sont exclus les départements du Bas-Rhin, du Haut-Rhin et de la Moselle (cour d'appel de Colmar). En 1939, le Compte général n'a pas été publié. En 1940 et 1941, la statistique de la cours d'appel de Colmar ne figure pas. En 1942, les statistiques des cours d'appel de Colmar et de Bastia ne figurent pas.
En 1943 et 1944 Sont exclus les départements du Bas-Rhin, du Haut-Rhin et de la Moselle (cour d'appel de Calmar), ainsi que celui de la Corse. Le "champ statistique" correspond au territoire national, sauf en 1943 où il manque le tribunal de Rouen.
En 1945 Les départements du Bas-Rhin, du Haut-Rhin et de la Moselle sont exclus (cour d'appel de Colmar). Le "champ statistique" correspond au territoire national.
À partir de 1946 : Le territoire métropolitain correspond au territoire actuel. divisé en 90 puis 95 départements. Le "champ statistique" correspond au territoire national.

3.2.2.- Années manquantes, années perturbées

La publication du Compte général a été interrompue entre 1914 et 1918 une première fois, puis en 1939 en raison de la guerre. Ce sont donc autant de valeurs manquantes pour toutes les séries de la base DAVIDO.

Les années 1870 et 1871 sont également des années où les perturbations politiques et sociales ont des conséquences sur le plan de la production statistique. Celle-ci parvient néanmoins jusqu'à son terme et il n'y a pas de valeurs manquantes en général pour 1870 et 1871. Il est cependant clair qu'au moins 1870 est une année où la statistique est peu représentative. Sont cumulés les effets de la désorganisation de certaines parties du système pénal (police et gendarmerie notamment), de la perte d'une partie du territoire national et de la destruction des archives indiciaires dans deux ressorts dont Paris (voir ci-dessus). L'année suivante reste marquée par les mêmes causes dans une moindre mesure. Il se trouve que cet accident des séries fait suite à trois années assez typées, 1867 et 1868 avec une forte hausse et 1869 avec l'amorce d'une forte baisse. Pour chacune de ces trois années, le Rapport du Compte général évoque des explications de circonstance : exposition universelle à Paris en 1867,crise économique en 1867 et 1868, augmentation des effectifs de police judiciaire à Paris, puis amnistie en 1869. Cette oscillation significative est donc suivie de variations en 1870 et 1871 qui ne le sont pas sur le même plan et peuvent donner l'illusion d'un cycle très marqué entre 1866 et 1872. On retiendra de préférence une attitude plus prudente consistant à faire abstraction de 1870 dans l'interprétation de l'évolution des séries.

Pour la période plus récente, les séries provenant des fiches de casier judiciaire comprennent des valeurs subissant plus ou moins fortement l'effet de l'amnistie légale suivant traditionnellement l'élection présidentielle depuis le début de la Vème République. La solution adoptée quant au traitement statistique des condamnations amnistiées a pu évoluer. Il est en tout cas certain que depuis l'amnistie de 1969, elles ne sont pas comptabilisées. Avec le décalage entre la date de l'infraction et la date de la condamnation et selon les dates d'effet retenues par la loi, l'effet d'une amnistie peut ainsi se faire sentir sur une ou deux années. On trouvera donc pour 1969 et 1974 des valeurs sousestimant largement les décisions rendues en matière correctionnelle et pour 1970 et 1975 des valeurs encore relativement faibles, surtout pour les condamnations à des peines d'amende.

Après ces remarques générales, nous en venons donc à l'examen des séries.

[1]Centre d'Etudes Sociologiques.
[2]Service d'Etudes Pénales et Criminologiques intégré en 1983 au Centre de Recherches Sociologiques sur le Droit et les Institutions Pénales (C.E.S.D.I.P.).
[3]Séminaire d'histoire pénale de 1983 à 1985 animé par Michèle PERROT et Philippe ROBERT, séminaire interdisciplinaire sur l'économie pénale dans le cadre du G.E.R.N. (Groupe Européen de Recherche sur les Normativités) ensuite, colloques organisés par l'I.A.H.C.C.J. (International Association for the History of Crime and Criminal Justice).
[4]Circulaire du 5 janvier 1826, ANYBB/30/1156.
[5]La circulaire de 1826 précise même pour lever l'ambiguïté qui pourrait naître de ce double sens : "au reste, vous voudrez bien faire remarquer à vos substituts que toutes ces colonnes, exceptées la première et la dernière, ne doivent contenir que des chiffres"
[6]AN/BB/30/1156.
[7]On peut retrouver quelques circulaires éparses aux Archives Nationales, le recueil officiel de circulaires publié rétrospectivement par la Chancellerie entre 1879 et 1883 pour les années 1790 à 1875 ayant éliminé les circulaires relatives aux statistiques. De 1876 à 1909, on trouve assez régulièrement ce type de circulaire au recueil officiel annuel. Mise à part la circulaire de 1826, aucune n'a pu à ce jour être retrouvée accompagnée d'un exemplaire du cadre ou du compte correspondant, si bien que pour l'essentiel, ces circulaires se référant à la ligne n° tant colonne n° tant de l'état n, sans en répéter le contenu, sont de peu d'intérêt.
[8]On trouve les références de ces opuscules dans LEVADE (1972).
[9]Institut National de la Statistique et des Etudes Economiques.
[10]On n'observe pas alors que l'unité de compte relève encore d'un certain arbitraire, la notion juridique d'infraction ne fournissant pas de facon précise un objet dénombrable. En particulier, on ne remarque pas que le dénombrement des infractions risque de dépendre de la nomenclature utilisée. Soit, pour prendre un exemple moderne, la description des infractions en matière de drogue. Avec une table comportant les rubriques "usage de stupéfiant" et "trafic de stupéfiants", celui qu'il est convenu d'appeler l'usager-revendeur peut être compté deux fois. Tandis qu'avec une table comprenant en plus une rubrique "usage et revente", il ne sera compté qu'une fois.
[11]Du moins dans les fichiers informatiques, car par ailleurs André DAVIDOVITCH avait fait un ample usage de certaines de ces séries, surtout concernant le parquet.
[12]Les Rapports sont signés par le Garde des Sceaux, et l'analyse qu'ils fournissent de la statistique pénale n'aborde les questions de méthode que sur les points jugés dignes par le rédacteur d'être soulevés, le plus souvent pour expliquer de brusques variations dans l'une ou l'autre série. Sur les auteurs du Compte général autour de 1880, voir la réédition de ce volume présentée par H. PERROT et PH. ROBERT (1989).
[13](1, 2) Source : Comparaison des tableaux des Comptes généraux de 1869 et 1870 ainsi que pages V et VI du Compte général de 1870.
[14]Source : Page V du Compte général de 1819 et page VII du Compte général de 1871.

Sources de la base DAVIDO
Construction de la base de données
Présentation des séries

Table des matières

?
Séries par ordre des tableaux
Séries par ordre alphabétique