Groupe annuaires et adresses

Les annuaires et les répertoires anciens constituent une source riche d’information sur un moment précis de la géographie des villes historiques, mettant en rapport la distribution de l’espace avec des données socio-économiques ou professionnelles. L’un des plus célèbres parmi eux, l’Annuaire-Almanach du commerce Didot-Bottin est désormais accessible sur Gallica. Mais il existe d’autres annuaires socioprofessionnels ou mondains (comme Tout-Paris, Paris-mondain) qui restent enfouis dans les collections des bibliothèques sans avoir été jusqu’ici exploités dans leur intégralité. Le consortium Paris Time Machine s’intéresse à ce type de sources et souhaite particulièrement rendre accessible et interrogeable l’Annuaire des propriétaires et des propriétés de Paris et du département de la Seine, une publication annuelle active entre 1894 et 1937.

Annuaire des propriétaires et des propriétés de 1909
Fig. 1. Page de titre de l’Annuaire des propriétaires et des propriétés et listes alphabétiques de l’année 1909

 

Cet annuaire recense toutes les adresses parisiennes et leurs propriétaires, et se compose de deux grandes sections (voir figure 1). La première partie de l’ouvrage comprend une liste alphabétique de tous les propriétaires de Paris et , regroupe par propriétaire l’ensemble des propriétés de Paris. La seconde partie comporte la liste des rues de toutes les propriétés de Paris avec le nom et l’adresse personnelle du propriétaire. Cette liste précise si le domicile du propriétaire se trouve à Paris, en province ou à l’étranger. D’après l’étude de cette dernière section, nous avons observé six cas de figure possibles pour chaque adresse : 1) domicile du propriétaire, 2) propriété(s) appartenant à une personne (les titres de noblesse et certaines professions libérales sont indiqués), 3) propriété(s) gérée(s) par des tiers, 4) propriété(s) de la ville de Paris ou de l’État (immeubles, bâtiments industriels), 5) siège(s) d’une société privée ou d’un service public, et 6) d’autres entrées  d’immeubles.

Les propriétés sont listées par rues. Les chiffres à gauche indiquent le numéro de l’immeuble, suivis par le nom du propriétaire et son adresse.
Fig. 2. Les propriétés sont listées par rues. Les chiffres à gauche indiquent le numéro de l’immeuble, suivis par le nom du propriétaire et son adresse.

 

La masse  de données à récupérer (environ 40 000 propriétaires par volume) impose de travailler avec un système d’extraction d’information capable de structurer les ressources numérisées à l’aide d’un modèle d’apprentissage automatique. Conçu à l’origine pour les corpus  dictionnairiques, GROBID-Dictionaries peut être adapté aux documents de type s annuaires : les répertoires d’adresses peuvent être perçus comme une ressource encyclopédique où les localisations sont autant d’entrée de dictionnaires décrites comme des concepts uniques. Une fois les données des Annuaires structurées en XML/TEI, nous procéderons au géocodage des adresses historiques. Cette opération, tel que l’explique Cura et al 2018, consiste à transformer des informations spatiales indirectes (les adresses) en des localisations directes (coordonnées) qui peuvent être placées sur une carte, permettant leurs analyses spatiales. Grâce à ces technologies, il sera possible de procéder à une distribution géographique des propriétaires et de leurs propriétés, de caractériser des quartiers en fonction du nombre de propriétaires ou de leur catégorie socio-économique, enfin d’étudier l’évolution de l’accès à la propriété au fil du temps. Nos travaux vont dans le même sens et sont complémentaires à ceux proposés par Di Leonardo et al. 2019.

Les données et les codes sources produits dans le cadre de ce travail seront mis à disposition de manière ouverte.

Membres de l’équipe

Gabriela Elgarrista (Plateforme Géomatique EHESS, ENC)

Carmen Brando (Plateforme Géomatique EHESS)

Mohamed Khemakhem (Inria-ALMAnaCH)

Laurent Romary (Inria-ALMAnaCH)

Frédérique Mélanie-Becquet (LATTICE)

Jean-Luc Pinol (ENS Lyon)

Références bibliographiques

Cura, R. , Dumenieu, B., Abadie, N., Costes, B., Perret, J., Gribaudi, M. (2018). Historical collaborative geocoding. ISPRS International Journal of Geo-Informationhttps://arxiv.org/abs/1703.07138

Di Lenardo, I., Barman, R., Descombes, A., Kaplan F. (2019). Repopulating Paris: massive extraction of 4 Million addresses from city directories between 1839 and 1922, Digital Humanities conference DH2019, Utrecht, Pays-Bas, https://dev.clariah.nl/files/dh2019/boa/0878.html

Khemakhem, M., Brando, C., Romary, L., Mélanie-Becquet, F., Pinol, J.-L. (2018). Fueling Time Machine: Information Extraction from Retro-Digitised Address Directories. JADH2018 “Leveraging Open Data”, Sep 2018, Tokyo, Japan. https://hal.archives-ouvertes.fr/hal-01814189

Pinol, J.-L. (2009). Les atouts des systèmes d’information géographique – (SIG) pour « faire de l’histoire » (urbaine). Histoire urbaine, 26(3), 139-158. doi:10.3917/rhu.026.0139.

 

Remonter le temps