Als het om object storage gaat, dan is het door Amazon geïntroduceerde Simple Storage Service of kort S3 de defacto standaard. Tegenwoordig zijn er naast Amazon nog tientallen aanbieders actief die object storage aanbieden dat op dezelfde manier werkt.

Hoe wijdverbreid het gebruik van het door Amazon geïntroduceerde protocol van S3 is, blijkt wel uit het feit dat het zelfs door Google Cloud wordt ondersteund. Er is dus keuze genoeg als het gaat om object storage. In dit artikel zoom ik evenwel in op een drietal grote aanbieders die zich volledig hebben gespecialiseerd in het zijn van een concurrent van Amazon S3.

Backblaze, Storj en Wasabi focussen zich maar op één ding, en dat is de data van hun klanten opslaan. Een andere interessante overeenkomst is dat alle drie de partijen op hun websites allemaal een vergelijking maken tussen de prijzen van hun diensten, en die van Amazon, Google en Microsoft. Die prijzen zijn zo’n 80% lager.

De schaal van dit soort partijen wordt ook duidelijk bij de vraag hoeveel data de klant wil opslaan. Daarbij wordt niet gevraagd naar hoeveel gigabytes, maar hoeveel tientallen of zelfs honderden terabyte de klant wil opslaan. Backblaze communiceert op het moment van schrijven 3,093,361,410,821,330,000 bytes te hebben opgeslagen. Of te wel ruim 3 exabyte.

Drie grote partijen, met een propositie die aanzienlijk goedkoper is dan Amazon S3. Dat klinkt goed, maar dat roept de vraag op of er geen addertjes onder het zitten. Helaas blijken die er bij al deze aanbieders te zijn.

Storj: Data is versleuteld, maar geen zicht op waar die wordt opgeslagen
Storj slaat data namelijk niet op in eigen datacenters, maar huurt opslagcapaciteit in bij een ieder die dat wil leveren. Het bedrijf maakt gebruik van encryptie en erasure coding om data van klanten decentraal op te slaan.

Dankzij erasure coding worden objecten in blokken opgeknipt, waarbij er maar een bepaald aantal blokken nodig zijn om het object weer te herstellen. Dat is vergelijkbaar met hoe bijvoorbeeld filesharing met Bittorrent werkt. Daarmee kan het bedrijf een zeer hoge mate van redundantie bereiken, zonder dat er meerdere kopie van (alle) data noodzakelijk is.

De partijen waar de data is opgeslagen, heeft er feitelijk geen toegang toe, doordat er gebruik wordt gemaakt van encryptie. Dat neemt echter niet weg dat het niet bekend is waar de data fysiek zal worden opgeslagen en wie er toegang heeft tot de opgeslagen data. Dat voelt – ook juridisch gezien – toch unheimisch.

Wasabi: Minimale opslagtermijn is 90 dagen
Bij hyperscalers is het addertje onder het gras, de kosten voor dataverkeer. Er is bij Wasabi ook iets aan de hand. Wie eenmaal opgeslagen data binnen 30 dagen weer verwijdert, worden toch de volle 90 dagen in rekening gebracht. Elke dag 1 TB aan backups opslaan en die de volgende dag weer verwijderen, zorgt er dus voor dat die 1 TB opslag nog 89 na verwijdering in rekening wordt gebracht.

Daarbij merkt Wasabi op dat deze werkwijze overeenkomt met het beleid van bepaalde diensten van Amazon en andere hyperscalers. Om precies te zijn komt dat beleid overeen met “S3 Glacier Instant Retrieval”. Dat is zogeheten koude storage, maar wel heel snel beschikbaar: For long-lived archive data accessed once a quarter with instant retrieval in milliseconds”.

Wasabi schrijft daar zelf over: “If you delete the 100 TB of storage in less than 23 days, Wasabi will be more expensive than AWS S3. However, if you store the 100 TB of data for more than 23 days, Wasabi will be less expensive than AWS S3. After the first year, AWS S3 is ~4x more expensive than Wasabi (and that is before you include the extra charges that AWS applies for egress and API requests).”

Backblaze: De kosten voor API-calls staan letterlijk in kleine lettertjes

Bij Backblaze zijn ze heel trots op een aantal principes, die nadrukkelijk worden benoemd: “Straightforward: Always-hot storage free of complicated pricing tiers, Honest: No delete penalties spun as “minimum storage duration.”, Flexible: Consumption or Capacity based for how you budget.”. Dat klinkt goed. Daar valt goed zaken mee te doen.

Helaas is er aanzienlijk minder aandacht voor het totale kostenplaatje. Dit is echt niet mals. De kosten voor opslag worden duidelijk genoemd en uitgaand dataverkeer in beginsel gratis is, wordt duidelijk benoemd. Bij dat laatste wordt met een sterretje bij het gratis dataverkeer wordt op een heldere manier naar de kleine lettertjes verwezen.

Dat is allemaal keurig. Alleen wat staat er plompverloren, helemaal achteraan bij diezelfde kleine lettertjes: “*Up to 3x of average monthly data stored, then $0.01/GB for additional egress. This chart features published rates for the U.S. West region. Backblaze competitors’ rates can vary by region, amount stored, and other factors. View API call rate details here.”. Kosten die afhankelijk van het type call per 1.000 of 10.000 requests $0,004 kosten, ook nog eens op hetzelfde niveau zijn als bij Amazon S3 in kleine lettertjes wegmoffelen. Dat beantwoord niet bepaald aan de definitie van straightforward en honest.