Paperclipを使ったセルフホスティング:自分のVPSでドキュメント管理
契約書や請求書、医療記録、研究資料などの機密性の高いドキュメントを扱う方にとって、クラウドのSaaSに任せるのは信頼の問題があります。Paperclipは、自分でホストできるドキュメント管理システムで、あなたのドキュメントライブラリのすべてのデータを所有できます。
この記事では、Paperclipの得意な点、対象となるユーザー、VPSへの展開方法、そしてより広範なセルフホストワークフローへの統合方法について解説します。
Paperclipの特徴的なポイント
ほとんどのセルフホスティングファイルマネージャ(Nextcloud、Seafileなど)は汎用的なクラウドストレージシステムです。Paperclipはドキュメント管理に特化しており、取り込み、OCR(光学式文字認識)、メタデータ、検索に重点を置いています。同期やファイル共有は二の次です。
主な差別化ポイント:
- 取り込み時のOCR:アップロードされたPDFや画像は自動的にOCR処理され、スキャンしたドキュメントも検索可能に。
- メタデータ優先設計:タイトル、日付、相手先、ドキュメント種別、タグなど、ファイル名だけでなく構造化されたフィールドを重視。
- バルクインポート:監視フォルダに何百ものファイルをドロップすると、自動的に処理される。
- 保持ルール:ドキュメント種別ごとに自動削除やアーカイブのルール設定が可能。
誰に向いているか
- フリーランサーや契約者:請求書や契約書、税務書類を自動OCRとタグ付けで整理。
- 小規模チーム:アクセス制御付きの共有ドキュメントリポジトリと全文検索が可能。
- ホムラボ(ホームラボ)ユーザー:NASやVPS上のフォルダ階層の代わりに、検索可能なタグ付けされたドキュメントデータベースを構築。
- プライバシー重視派:クラウドベンダーがあなたのドキュメントにアクセスできません。
VPSの要件
Paperclipは軽量で、エントリーレベルのVPSでも十分運用可能です。
| スペック | 最低限 | 推奨 |
|---|---|---|
| vCPU | 1 | 2 |
| RAM | 1GB | 2〜4GB |
| ストレージ | 20GB | 50GB以上 |
| OS | Ubuntu 22.04 / Debian 12 | Ubuntu 22.04 LTS |
| データベース | SQLite | PostgreSQL(マルチユーザー向け) |
推奨プロバイダー:
- Hetzner Cloud - €4.15/月、2 vCPU、4GB RAM - EUユーザーに最適
- Contabo VPS - €5.99/月、4 vCPU、8GB RAM、200GBストレージ - 大規模アーカイブに最適
完全セットアップガイド
1. Dockerをインストール
curl -fsSL https://get.docker.com | sh
systemctl enable --now docker
2. Docker Composeを使ってPaperclipを展開
/opt/paperclip/docker-compose.ymlを作成:
version: "3.8"
services:
paperclip:
image: paperclip/paperclip:latest
container_name: paperclip
restart: unless-stopped
ports:
- "8080:8080"
volumes:
- paperclip_data:/data
- /mnt/documents:/watch # オプションの監視フォルダ
environment:
- PAPERCLIP_SECRET_KEY=ここにランダムなシークレットを入力
- PAPERCLIP_OCR_ENABLED=true
- PAPERCLIP_OCR_LANGUAGE=eng # 他の言語に変更可能
volumes:
paperclip_data:
スタックを起動:
cd /opt/paperclip && docker compose up -d
3. HTTPS経由で公開
自動TLSのCaddyを使用:
apt install caddy -y
/etc/caddy/Caddyfile:
docs.yourdomain.com {
reverse_proxy localhost:8080
}
systemctl reload caddy
4. ドキュメントタイプの設定
Web UIから、「請求書」「契約書」「領収書」などのドキュメントタイプを定義し、保管ルールを設定します。これにより、ファイル名だけに頼るより高速に検索・取得が可能です。
5. 監視フォルダの設定
VPS上のローカルフォルダを/watchのマウントポイントに指定します。ここにファイルを置くと自動的に取り込み・OCR処理・ライブラリへの追加が行われ、バルクインポートや自動化ワークフローに便利です。
連携と拡張機能
Paperless風のワークフロー:ScanbotやAdobe Scanなどのスキャナーアプリと連携させて、スキャンした資料をメールや直接Paperclipのインボックスにアップロードし、自動的に検索可能なデジタル化を実現。
S3へのバックアップ:rcloneを使って、PaperclipのデータボリュームをBackblaze B2や他のS3互換バケットにミラーリング可能:
rclone sync /var/lib/docker/volumes/paperclip_data/_data remote:paperclip-backup
Nginx Proxy Manager:既にVPS上でNPMを運用している場合、プロキシホストをpaperclip:8080に設定し、GUIからLet’s Encryptの有効化も容易。
Authentik / Authelia:複数ユーザー体制のインストール時にIDプロバイダーを利用したSSO認証を追加。
メンテナンステクニック
- 定期的な更新:
docker compose pull && docker compose up -d - ディスク使用量の監視:OCR出力やサムネイルが増加するため、
df -hアラートを設定 - データボリュームのバックアップ:アップグレード前に必ず行う
- PostgreSQLのチューニング:大規模ライブラリには
work_memやmax_connectionsの調整がおすすめ(postgresql.conf)
まとめ
Paperclipは、非常に良くメンテナンスされたセルフホスト型のドキュメントマネージャーの一つです。VPSへの展開なら、Hetzner Cloudは月額€4.15でほとんどのユーザーに最適です。 大容量のアーカイブが必要な場合は、Contaboの200GB NVMeが月€5.99で利用可能です。
Dockerのシンプルさ、OCRの標準搭載、メタデータ優先の整理方法が、クラウドのドキュメントサービスの強力な代替となり得ます。