
Bases de données vectorielles : Le comparatif sans langue de bois
Découvrez le vrai coût des bases de données vectorielles. Pinecone, Weaviate, Qdrant, pgvector : lequel choisir en 2026 ? Mes conseils de dev senior.
10 min de lecture
On va pas se mentir, le monde des bases de données vectorielles, c'est un peu la jungle. Tout le monde en parle, surtout avec l'essor des LLMs et des applications RAG. Mais quand il s'agit de choisir la bonne, celle qui ne va pas te ruiner ou te faire chier avec des coûts cachés, c'est une autre histoire. J'ai passé des heures à décortiquer les offres, à lire les petits caractères, et surtout, à voir ce qui se passe réellement en production. Oublie le marketing, voici ce que tu dois savoir.
Le piège des plans "gratuits" et des minimums mensuels
Le premier truc qui me fait hurler, c'est cette tendance à proposer des plans "gratuits" qui sont en fait des leurres. Ou pire, des minimums mensuels qui te collent une facture même si tu utilises à peine le service.
En octobre 2025, Pinecone a mis en place un minimum de 50 $/mois sur ses plans payants Standard. Pour certains, ça représente une augmentation de 100% à 525% de leur facture, alors qu'ils dépensaient avant genre 8 $/mois. C'est juste pas possible pour une startup qui teste ou une application à faible trafic. Pareil pour Weaviate avec son minimum de 25 $/mois.
Voici ce qui se passe réellement quand tu commences petit
Imagine, tu développes un prototype RAG pour un client. Tu utilises Pinecone, tu es content, ça marche. Tu payes peut-être 10-15 $ le premier mois. Puis, tu passes en production, mais le trafic est encore faible, disons 10 000 requêtes par jour. Tu t'attends à payer un peu plus, genre 20-30 $. Sauf que voilà, avec le minimum de 50 $, tu payes déjà ça, même si ton utilisation réelle est bien en dessous. Et si tu dépasses ce seuil, attention, car les coûts de requête peuvent exploser.
Les coûts cachés qui vont te faire déchanter
Ce n'est pas juste le prix affiché pour le stockage ou les requêtes. Il y a tout un tas de trucs qui peuvent doubler ta facture sans que tu t'y attendtes.
- Embeddings et reranking : La plupart des services ne les incluent pas dans leurs tarifs de base. Si tu utilises une API externe pour ça, ça s'ajoute. Si tu les gères toi-même, il faut prévoir la puissance de calcul.
- Sauvegardes et réindexation : Quand tu scales, tu veux des sauvegardes. Weaviate, par exemple, facture les sauvegardes à 0,0264 $/GiB. Ça peut vite grimper. La réindexation, c'est pareil, ça bouffe des ressources et donc de l'argent.
- Coûts de requête qui grimpent avec la taille : C'est un point crucial que beaucoup ignorent. La même requête qui coûte X quand tu as 10 Go de données peut coûter 10X quand tu arrives à 100 Go. C'est pas une blague, c'est ce que j'ai vu. Les fournisseurs ont tendance à baser leurs coûts de requête sur la taille de l'index, pas juste sur le nombre de requêtes.
Les acteurs principaux : ce qu'il faut savoir
On va regarder les plus connus, sans fioritures.
Pinecone
C'est le chouchou de beaucoup, surtout pour son côté "tout managé". Tu uploades tes données, tu fais tes requêtes, c'est simple. Mais le prix...
- Prix : Minimum 50 $/mois (plan Standard). Ensuite, c'est 0,30 $/Go/mois pour le stockage. Les coûts de requête augmentent avec la taille des données.
- Avantages : Facile à utiliser, scaling géré.
- Inconvénients : Minimum mensuel élevé, coût des requêtes imprévisible et qui explose avec la croissance, manque de transparence sur les coûts réels.
Weaviate
Une autre option populaire, avec un cœur open-source.
- Prix : Minimum 25 $/mois. Stockage à 0,255 $/GiB (plan Starter), coûts par dimension vectorielle.
- Avantages : Cœur open-source, coûts de stockage plus bas que Pinecone.
- Inconvénients : Minimum mensuel, coûts de sauvegarde et de réindexation qui peuvent surprendre.
Qdrant
Celui-ci, je le trouve de plus en plus intéressant, surtout pour les budgets serrés.
- Prix : Pas de minimum mensuel. Environ 9 $ pour 50 000 vecteurs (estimation). Coût de stockage : 0,28 $/Go/mois. Requêtes basées sur des crédits.
- Avantages : Pas de minimum mensuel, excellent prix d'entrée (9 $ pour 50k vecteurs), bonne prévisibilité des coûts pour les petites et moyennes échelles.
- Inconvénients : La gestion des crédits pour les requêtes peut être un peu complexe au début.
pgvector
Là, on parle de PostgreSQL. Si tu utilises déjà PostgreSQL, c'est une extension.
- Prix : Gratuit (open-source). Tu paies juste ton infrastructure.
- Avantages : 75% moins cher que Pinecone à grande échelle (60-100 millions de requêtes/mois), latence P95 la plus rapide, prévisibilité des coûts totale, portabilité des données via SQL.
- Inconvénients : Tu dois gérer toi-même l'infrastructure.
Comparatif rapide des tarifs (estimation 2026)
| Outil | Plan Gratuit | Plan d'entrée (min) | Stockage par Go/mois | Coût par 1M dimensions vectorielles | Notes |
|---|---|---|---|---|---|
| Pinecone | Non | 50 $/mois | 0,30 $ | Non spécifié | Coûts de requête évolutifs |
| Weaviate | Oui | 25 $/mois | 0,095 $ (plan Pro) | 0,0139 $ (plan Pro) | Coûts de sauvegarde/réindexation à surveiller |
| Qdrant | Oui (OSS) | ~9 $ (50k vecteurs) | 0,28 $ | Non spécifié | Pas de minimum mensuel, système de crédits pour requêtes |
| pgvector | Oui (OSS) | Coûts infra seuls | Coûts infra seuls | Coûts infra seuls | Gestion d'infrastructure requise, latence la plus rapide |
| Milvus | Oui (OSS) | ~309 $ (20M vect.) | Non spécifié | Non spécifié | Orienté haute performance à grande échelle |
| Chroma | Oui (OSS) | ~281 $ (20M vect.) | Non spécifié | Non spécifié | Léger, pour projets plus petits |
Note : Les prix sont des estimations basées sur les données disponibles en avril 2026 et peuvent varier.
Les vrais problèmes que tu vas rencontrer
J'ai vu des développeurs se plaindre de choses bien précises.
- Les factures qui explosent sans raison apparente : C'est le cas de Pinecone avec son minimum de 50 $ qui a surpris plus d'un utilisateur qui dépensait moins avant.
- Les coûts cachés qui doublent la facture : Les embeddings, le reranking, les sauvegardes... ça s'ajoute vite. On m'a rapporté des cas où la facture doublait à cause de ces éléments non prévus.
- La scalabilité des coûts de requête : Le fait qu'une même requête coûte 10 fois plus cher quand ton index passe de 10 Go à 100 Go, c'est un point noir majeur pour la prévisibilité.
Les pièges à éviter absolument
Ceux qui ne sont pas sur les plaquettes marketing.
- Le coût des dimensions vectorielles : Plus tu as de dimensions dans tes vecteurs (ce qui est souvent nécessaire pour une bonne précision), plus tes factures de stockage vont grimper exponentiellement. Ce n'est pas toujours clair dans les tarifs.
- Le point de bascule pour l'auto-hébergement : Beaucoup pensent que le cloud est toujours plus simple. Mais dès que tu arrives à 60-100 millions de requêtes par mois, pgvector devient 75% moins cher que les solutions managées comme Pinecone. Gérer ton propre serveur PostgreSQL avec pgvector devient alors une évidence financière.
Verdict : Qui choisir et pourquoi ?
Pas d'entre-deux ici.
Et pour les autres ?
- Pinecone : Si tu as un budget très confortable, que tu veux le moins de gestion possible, et que tu es prêt à accepter une facture potentiellement très élevée et imprévisible. Pour moi, c'est un choix risqué en 2026.
- Weaviate : Une alternative intéressante à Pinecone si tu veux un cœur open-source, mais attention au minimum mensuel et aux coûts cachés.


