Auto-héberger avec Paperclip : Gestion documentaire sur son propre VPS
Pour quiconque travaille avec des documents sensibles — contrats, factures, dossiers médicaux, documents de recherche — les confier à un SaaS cloud est un acte de foi que vous préférerez peut-être éviter. Paperclip est un système de gestion documentaire auto-hébergé qui vous donne un contrôle total sur chaque octet de votre bibliothèque documentaire.
Cet article explique ce que Paperclip fait bien, à qui il s’adresse, comment le déployer sur un VPS et comment l’intégrer dans un workflow auto-hébergé plus large.
Ce qui distingue Paperclip
La plupart des gestionnaires de fichiers auto-hébergés (Nextcloud, Seafile) sont des solutions de stockage cloud polyvalentes. Paperclip est conçu spécifiquement pour la gestion documentaire : l’ingestion, l’OCR, les métadonnées et la récupération sont au cœur de son fonctionnement, pas la synchronisation ou le partage de fichiers.
Différences clés :
- OCR à l’ingestion : chaque PDF ou image importé est automatiquement traité par OCR et devient cherchable.
- Design métadonnées-first : titre, date, correspondant, type de document, tags — tous des champs structurés, pas seulement des noms de fichiers.
- Import en masse : déposez des centaines de fichiers dans un dossier surveillé, Paperclip les traite automatiquement.
- Règles de rétention : définissez des politiques d’archivage ou de suppression automatique par type de document.
À qui s’adresse Paperclip ?
- Freelances et indépendants : organisez factures, contrats et documents fiscaux avec OCR automatique et tags.
- Petites équipes : dépôt documentaire partagé avec contrôle d’accès et recherche plein texte.
- Passionnés de homelab : remplacez une hiérarchie de dossiers sur NAS/VPS par une base de données documentaire cherchable et taguée.
- Utilisateurs soucieux de leur vie privée : aucun fournisseur cloud n’a accès à vos documents.
Prérequis VPS
| Spec | Minimum | Recommandé |
|---|---|---|
| vCPU | 1 | 2 |
| RAM | 1 Go | 2–4 Go |
| Stockage | 20 Go | 50 Go+ |
| OS | Ubuntu 22.04 / Debian 12 | Ubuntu 22.04 LTS |
| Base de données | SQLite | PostgreSQL (multi-utilisateurs) |
Fournisseurs recommandés :
- Hetzner Cloud — 4,15 €/mois, 2 vCPU, 4 Go de RAM — meilleur choix global pour les utilisateurs EU
- Contabo VPS — 5,99 €/mois, 4 vCPU, 8 Go de RAM, 200 Go de stockage — meilleur pour les grandes archives
Guide de configuration complet
1. Installer Docker
curl -fsSL https://get.docker.com | sh
systemctl enable --now docker
2. Déployer Paperclip avec Docker Compose
Créez /opt/paperclip/docker-compose.yml :
version: "3.8"
services:
paperclip:
image: paperclip/paperclip:latest
container_name: paperclip
restart: unless-stopped
ports:
- "8080:8080"
volumes:
- paperclip_data:/data
- /mnt/documents:/watch # dossier surveillé optionnel
environment:
- PAPERCLIP_SECRET_KEY=votre_cle_aleatoire_ici
- PAPERCLIP_OCR_ENABLED=true
- PAPERCLIP_OCR_LANGUAGE=fra # pour les documents en français
volumes:
paperclip_data:
Démarrer la stack :
cd /opt/paperclip && docker compose up -d
3. Exposer via HTTPS
Avec Caddy pour le TLS automatique :
apt install caddy -y
/etc/caddy/Caddyfile :
docs.votredomaine.fr {
reverse_proxy localhost:8080
}
systemctl reload caddy
4. Configurer les types de documents
Dans l’interface web de Paperclip, définissez des types de documents (ex. : « Facture », « Contrat », « Reçu ») et assignez des règles de stockage. La récupération sera bien plus rapide qu’en se basant uniquement sur les noms de fichiers.
5. Configurer un dossier surveillé
Montez un dossier local de votre VPS sur le volume /watch. Tout fichier déposé y est automatiquement ingéré, traité par OCR et ajouté à la bibliothèque — idéal pour les imports en masse ou les workflows automatisés.
Intégrations et extensions
Workflow zéro papier : combinez Paperclip avec une application de numérisation (Scanbot, Adobe Scan) qui envoie directement vers la boîte de réception Paperclip par email ou upload — pipeline entièrement automatisé du papier au numérique cherchable.
Sauvegarde sur S3 : utilisez rclone pour synchroniser votre volume de données Paperclip vers Backblaze B2 ou un bucket compatible S3 :
rclone sync /var/lib/docker/volumes/paperclip_data/_data remote:paperclip-backup
Nginx Proxy Manager : si vous utilisez déjà NPM sur votre VPS, pointez simplement un proxy host vers paperclip:8080 et activez Let’s Encrypt depuis l’interface graphique.
Authentik / Authelia : ajoutez du SSO devant Paperclip avec un fournisseur d’identité pour les installations multi-utilisateurs.
Conseils de maintenance
- Mises à jour régulières :
docker compose pull && docker compose up -d - Surveiller l’espace disque : la sortie OCR et les vignettes grossissent avec le temps — configurez des alertes
df -h - Sauvegarder le volume de données avant toute mise à jour
- Tuning PostgreSQL : pour les grandes bibliothèques, augmentez
work_memetmax_connectionsdanspostgresql.conf
Résumé
Paperclip est l’un des gestionnaires documentaires auto-hébergés les mieux maintenus disponibles. Pour un déploiement VPS, Hetzner Cloud couvre la majorité des utilisateurs à 4,15 €/mois. Si vous avez besoin de stockage sérieux pour une grande archive documentaire, Contabo propose 200 Go NVMe à 5,99 €/mois.
Voir aussi : Comparatif VPS complet sur selfhostvps.com