Accueil

PhiloLogic©

Manuel d'utilisation pour Balzac. La Comédie humaine. Edition critique en ligne.


Table des matières


1. Introduction

PhiloLogic est le fruit d'une collaboration entre le groupe ARTFL et la bibliothèque numérique de l'Université de Chicago. Ce moteur de recherche en texte intégral permet l'interrogation de bases multimédia (textes, images, sons) et interprète des langages aussi élaborés que le SGML ou le Code Beta. Conçu pour la recherche universitaire, il est particulièrement adapté à l'interrogation de bases spécialisées en littérature, religion, philosophie et histoire.

PhiloLogic permet la consultation de documents ou de parties de documents via des tables de matières. Il permet aussi la constitution de corpus sur un thème de recherche.
Plusieurs recherches sont possibles parmi lesquelles la recherche d'un mot, d'une expression ou des recherches de proximité. La liste des résultats s'affiche selon le format choisi par l'internaute. Des recherches avancées sont également possibles par l'utilisation des opérateurs booléens ET, OU.


2. Faire une recherche

PhiloLogic permet la sélection et la lecture de documents en ligne. Il permet également la définition d'un corpus de recherche. Si la recherche est lancée sans qu'aucun critère de recherche n'ait été sélectionné, l'ensemble des documents présents dans la base s'affiche sous forme de liste (classement de l'édition dite Furne pour Balzac. La Comédie humaine. Edition critique en ligne). Si un ou plusieurs critères de recherche sont sélectionnés, seuls les résultats pertinents s'affichent.

Les différents types de recherche sont les suivants :
Recherche par champ (Titre, Scène, Étude, Volume)
Recherche en texte intégral

2.1 Recherche par champ

Si l'on saisit intégralement le titre d'un roman dans le champ Titre, celui-ci doit correspondre à la forme préalablement saisie dans la base, si ce n'est la casse (majuscules et minuscules), non prise en compte. Il faut respecter les espaces et la ponctuation.

Exemple : Z. MARCAS avec un point après le Z (si ce dernier n'est pas saisi, la recherche n'aboutira pas)

Néanmoins, il est possible et souhaitable de ne saisir qu'un terme significatif du titre.

Exemples : BIROTTEAU pour Histoire de la grandeur et de la décadence de César Birotteau ; DEPARTEMENT pour La Muse du département

Les troncatures (.*) peuvent être utilisées.

Exemple : COUSI.* pour Le Cousin Pons et La Cousine Bette

Certains romans ont été regroupés par Balzac sous un même titre (voir Protocole). La saisie de ce titre permet l'affichage des romans correspondants.

Exemple : LES PARISIENS EN PROVINCE donnent accès aux deux romans suivants : L'Illustre Gaudissart et La Muse du département.

Les Scènes sont des subdivisions de La Comédie humaine établies par Balzac (voir le Protocole). Par défaut, toutes les scènes sont sélectionnées. Il est possible de n'en retenir qu'un type, via la liste déroulante.
Les romans inachevés (Le Député d'Arcis et Les Petits Bourgeois) sont également accessibles depuis la liste déroulante.

Les Études sont des divisions de La Comédie humaine établies par Balzac (voir le Protocole). Par défaut, toutes les études sont sélectionnées. Il est possible de n'en retenir qu'un type, via la liste déroulante.
Les romans inachevés (Le Député d'Arcis et Les Petits Bourgeois) sont également accessibles depuis la liste déroulante.

Par défaut, tous les volumes sont sélectionnés. Il est possible de n'en retenir qu'un seul, via la liste déroulante.
Par commodité, les romans inachevés (Le Député d'Arcis et Les Petits Bourgeois) ont été rattachés au volume 18.

Il n'est pas nécessaire de remplir simultanément les champs Titre, Scènes, Études et Volume (ou deux ou trois de ces champs), dans la mesure où le logiciel affiche automatiquement tous les romans appartenant à un type de Scènes, à un type d'Études ou à un Volume. Si toutefois vous souhaitez saisir plusieurs champs simultanément, assurez-vous que vous respectez bien l'architecture de La Comédie humaine (voir le Protocole).

 

2.2 Recherche en texte intégral

On peut rechercher un mot, une expression (exs : histoire sociale, femme comme il faut...) ou des mots liés par des opérateurs booléens. Il faut tenir compte des espaces. La casse (majuscules et minuscules) n'est pas prise en compte.

 

2.3 Affichage des résultats

Les résultats s'affichent sous forme de références bibliographiques succinctes.

Exemple : résultat de la recherche Titre = MEDECIN

Pour consulter le roman, il suffit de cliquer sur le titre (LE MEDECIN…). Pour consulter la notice, il faut cliquer sur l'intitulé correspondant (Notice).

En cliquant sur le titre du roman, la table des matières de ce dernier s'affiche.

Exemple :

En cliquant sur le titre du roman (LE MEDECIN…), on lance le chargement du roman dans son intégralité. En cliquant sur une partie, seule celle-ci s'affiche. Des liens en haut et en bas de page permettent de naviguer d'une partie à une autre ou de revenir à la table des matières du roman.

 

Les illustrations de l'édition dite Furne ont été numérisées en mode image. Elles ont été insérées dans le texte sous forme de lien.

Exemple :

LE BAL DE SCEAUX

[Monsieur de Fontaine]

A HENRI DE BALZAC,
            Son frère
                        HONORE.

Le comte de Fontaine, chef de l'une des plus anciennes familles […]

En cliquant sur [Monsieur de Fontaine], l'illustration correspondante s'ouvre dans une nouvelle fenêtre.

 

Si un roman comprend plusieurs parties rédigées à plusieurs années d'intervalle (et publiées, pour la plupart, séparément), ces dernières apparaissent sous la forme suivante :

Exemple : résultat de la recherche Titre = ILLUSIONS

Cet affichage concerne les cinq romans suivants : Béatrix, Illusions perdues, Splendeurs et misères des courtisanes, L'Envers de l'histoire contemporaine et Sur Catherine de Médicis.

 


3. Saisie des critères de recherche

3.1 Accents, caractères spéciaux, symboles, signes de ponctuation et propriétés du texte

Certains postes informatiques et certains navigateurs reconnaissent les accents. Dans ce cas, vous pouvez saisir vos critères de recherche simplement.

Exemple 1 : Titre = Splendeurs et misères

Pour d'autres, les accents bloqueront la recherche (absence systématique de résultats). Dans ce cas, vous pouvez saisir le caractère accentué ou le titre lui-même en majuscules.

Exemple 2 : Titre = SPLENDEURS ET MISERES

 

Les tirets et les symboles (+, -, =, 1°, %, &, /, etc.) ne doivent pas être saisis.
Le « oe » et le « æ » doivent être saisis respectivement « oe » et « ae ».
Les italiques, caractères gras, soulignement et exposants ne sont pas pris en compte.

 

3.2 Troncatures et caractères de substitution

Les troncatures et caractères de substitution permettent de rechercher un mot et ses différentes formes (un nom commun au singulier ou au pluriel, un verbe conjugué ou non, un mot dont l'orthographe a varié, etc.).

Les différents opérateurs qui peuvent être utilisés sont les suivants :

 

3.3 Opérateurs booléens

Opérateur OU : pour rechercher un mot ou un autre, séparément
Exemple : HISTOIRE OU MOEURS recherche les occurrences du mot « histoire » et celles du mot « moeurs »

Opérateur ET : pour rechercher deux mots, conjointement
Exemple : CHAPEAU ET PAILLE recherche les occurrences conjointes de chapeau et paille (ou de paille et chapeau)
Attention, ce type de recherche n'est possible que si vous sélectionnez le mode de recherche B.

Les opérateurs ET et OU peuvent être combinés.

Exemple 1 : CHAPEAU ET PAILLE OU SOIE recherche les occurrences de chapeau et paille ou de chapeau et soie (ou paille et chapeau et soie et chapeau).
Attention, ce type de recherche n'est possible que si vous sélectionnez le mode de recherche B.

Par contre, il n'est pas possible de faire une seule et même recherche avec deux opérateurs ET.
Exemple 2 : CHAPEAU ET PAILLE OU GANT ET JAUNE

Il n'est pas non plus possible de faire une seule et même recherche comprenant deux expressions liées par un opérateur OU ou par un opérateur ET :
Exemple 3 : VISAGE PALE OU TEINT OLIVATRE

Exemple 4 : VISAGE PALE ET VIEILLE FEMME

 


4. Sélectionner un mode de recherche

Plusieurs modes de recherche sont proposés. La sélection de l'un désactive automatiquement le précédent.

4.1 Rechercher un mot ou une expression (mode A)

C'est l'option par défaut. Elle doit être activée dans les cas suivants :

Les troncatures et caractères de substitution peuvent être utilisés.

Exemple 1 : Titre = AVANT PROPOS
Recherche en texte intégral = ESPECES SOCIALES

Exemple 2 : Titre = BAL (pour Le Bal de Sceaux)
Recherche en texte intégral = DIPLOMAT.* OU LING.*

 

4.2 Recherche de proximité (mode B)

Il s'agit de rechercher des mots situés dans la même phrase, dans le même paragraphe, ou dans la même phrase et séparés par un nombre de mots que vous déterminez vous-même (moins de / exactement … mots).

Cette option doit être activée dans les cas suivants :

Les troncatures et caractères de substitution peuvent être utilisés.

Exemple 1 : Études = Études de moeurs
Recherche en texte intégral = HISTOIRE ET MOEURS

Exemple 2 : Titre = [aucune saisie]
Recherche en texte intégral = ANALYSE ET SOCIETE

Exemple 3 : Titre = [aucune saisie]
Recherche en texte intégral = CHAPEAU ET PAILLE OU SOIE

 


5. Sélectionner un mode d'affichage des résultats

Les résultats d'une recherche en texte intégral s'affiche roman par roman, suivant le classement de l'édition dite Furne, à l'exception des modes d'affichage C, D et E (affichage par nombre d'occurrences, par fréquence d'apparition des occurrences et affichage par proximité).
Il est possible de passer du mode d'affichage A (format paragraphe, 300 caractères) au mode d'affichage B (format KWIC, une ligne), en cours de recherche.
Remarque : les recherches qui excèdent 10 000 réponses ne seront pas prises en compte par PhiloLogic.

 

5.1 Format paragraphe ou concordance (300 caractères)

C'est le format d'affichage par défaut.
Sur la liste des résultats figurent les 25 premières occurrences, le nombre total d'occurrences trouvées (en haut ou en bas de page) et des liens vers les résultats suivants. Le(s) terme(s) ou l'(les) expression(s) recherché(es) apparaissent en caractères rouges et en gras.

Exemple :

Il s'agit du cinquième résultat d'une recherche en texte intégral du nom commun « mousseline » dans La Comédie humaine.

Il est possible de consulter la page ou le chapitre où se trouve l'occurrence (liens à droite du titre). Le(s) mot(s) recherché(s) resteront en surbrillance. Il est également possible de consulter le roman.

Le format paragraphe comprend 300 caractères par défaut. Ce chiffre est automatiquement revu à la hausse si l'affichage d'un résultat le nécessite.

 

5.2 Format KWIC (une ligne)

Sur la liste des résultats figurent les 25 premières occurrences, le nombre total d'occurrences trouvées (en haut ou en bas de page) et des liens vers les résultats suivants. Le(s) terme(s) ou expression(s) recherché(es) apparaissent en caractères gras.

Exemple :

Il s'agit de la 21e réponse à la recherche du mot « maison » dans La Comédie humaine. Le titre du roman est donné en abrégé en début de ligne (chat pelote). La référence à la page est donnée en second lieu (p. 52 dans notre exemple). Un clic sur cette référence permet d'afficher la page entière.

Il est possible d'afficher tous les résultats sur une seule page. Attention cependant, le chargement d'un nombre important de résultats peut prendre quelques instants. Un message indique alors que le chargement est en cours.

Remarque : il n'est pas opportun d'utiliser le format KWIC si l'on effectue une recherche de mots situés dans un même paragraphe (mode de recherche B) dans la mesure où les mots peuvent être distants de plusieurs lignes.

 

5.3 Nombre d'occurrences (ordre décroissant)

Ce mode permet de rechercher le nombre d'occurrences d'un mot, de plusieurs mots ou d'une expression, roman par roman. Le classement des résultats se fait par ordre décroissant : le premier roman de la liste est celui qui contient le plus grand nombre d'occurrences.

Exemple :

La recherche en texte intégral du mot « malheur.* » dans La Comédie humaine  aboutit à la recherche et au calcul du nombre d'occurrences de 7 mots (malheur, malheure, malheureuse, …).

La Physiologie du mariage comprend 91 occurrences de « malheur.* » que l'on peut visualiser en cliquant sur l'intitulé [Occurrences], à droite du titre.

 

5.4 Fréquence d'apparition des occurrences (ordre décroissant)

Ce mode permet de rechercher la fréquence d'utilisation d'un mot, de plusieurs mots ou d'une expression, roman par roman. Le classement des résultats se fait par ordre décroissant de fréquence : le premier roman de la liste est celui qui contient la plus grande fréquence d'occurrences.

Exemple :

La recherche du mot « heureu.* » dans La Comédie humaine aboutit à la recherche de quatre mots (heureuse, heureusement, heureuses et heureux). Ces mots apparaissent plus fréquemment dans les Petites misères de la vie conjugale (taux de 13,81) que dans les autres romans. On dénombre 76 occurrences qu'il est possible de visualiser en cliquant sur l'intitulé [Occurrences], à droite du titre.

 

5. 5 Recherche de proximité

Il s'agit d'afficher les mots présents avant et après le mot recherché et séparés de ce dernier par un intervalle de mots que vous déterminez vous-même.
Attention, cette recherche nécessite que vous ne saisissiez qu'un mot et un seul dans le champ Recherche en texte intégral, sans troncature ni caractères de substitution

Exemple :

La recherche consiste à chercher les mots présents avant et après « amour » dans La Comédie humaine et séparés de ce dernier par un intervalle de 5 mots.

Les résultats apparaissent sous la forme d'un tableau (seuls les trois premiers résultats ont été retenus dans cet exemple). On constate que l'adjectif « propre » est souvent employé à proximité du mot « amour » (273 à droite et 4 fois à gauche, 277 fois en tout). C'est le mot le plus employé pour l'intervalle choisi (5 mots).

Des mots vides sont retranchés par défaut (il s'agit d'articles, de conjonctions, de prépositions…). Il est possible d'en tenir compte en cochant l'option « désactiver le filtre » du formulaire de recherche.

 

Aide PhiloLogic : traduction et adaptation, Claire Scamaroni. Version 1. 12 octobre 2004