Il costo globale dell’IT è determinato non solo dal costo della capacità, ma anche dal grado di efficienza nell’utilizzo di tale capacità. È quindi necessario valutare l’impatto che l’aggregazione della domanda avrà sui costi delle risorse effettivamente utilizzate (CPU, rete e archiviazione). In un data center non virtualizzato, ogni applicazione o carico di lavoro viene in genere eseguito in un server fisico dedicato. Ciò significa che il numero dei server è direttamente proporzionale al numero dei carichi di lavoro. In questo modello, l’utilizzo dei server è sempre stato estremamente basso, intorno al 5% - 10%. La virtualizzazione consente l’esecuzione di più applicazioni in un unico server fisico all’interno della relativa istanza del sistema operativo, pertanto il vantaggio principale della virtualizzazione sta nel fatto che è necessario un numero minore di server per gestire lo stesso numero di carichi di lavoro . Ma quali effetti ha questa situazione sulle economie di scala? Se tutti i carichi di lavoro avessero un’attività costante, ciò implicherebbe una semplice compressione delle unità senza influenzare le economie di scala. In realtà, tuttavia, i carichi di lavoro variano significativamente con il tempo e spesso richiedono grandi quantità di risorse in una determinata situazione e quasi nessuna a distanza di poco tempo. Si aprono quindi opportunità per miglioramenti in termini di utilizzo tramite l’aggregazione e la diversificazione della domanda. Analizzando le diverse fonti di variabilità del livello di utilizzo e considerando le possibilità di diversificazione dell’ambiente cloud per una conseguente riduzione dei costi è possibile individuare cinque fonti di variabilità e valutare come possono essere ridotte.
Casualità. I modelli di accesso degli utenti finali contengono un certo grado di casualità. Per esempio, gli utenti controllano la posta elettronica in momenti diversi. Per rispettare i contratti di servizio, i buffer di capacità devono essere progettati tenendo conto di una certa probabilità che molte persone eseguano attività specifiche contemporaneamente. Se i server sono raggruppati in pool, la variabilità può essere ridotta.
Modelli orari. Nel comportamento degli utenti sono presenti cicli ricorrenti quotidiani: i servizi per i consumatori tendono a raggiungere i picchi alla sera, mentre i servizi per i luoghi di lavoro registrano picchi durante la giornata lavorativa. La capacità deve essere progettata tenendo conto di tali picchi giornalieri e dei momenti in cui il servizio registrerà uno scarso utilizzo. Questa variabilità può essere bilanciata eseguendo lo stesso carico di lavoro per più fusi orari sugli stessi server oppure eseguendo carichi di lavoro con modelli orari complementari (per esempio i servizi per i consumatori e i servizi per le aziende) sugli stessi server.
Variabilità specifiche del settore. Alcune variabilità dipendono dalle dinamiche di settore. Tipicamente, i rivenditori registrano picchi durante i periodi di maggiori acquisti, mentre le società contabili USA registrano un picco prima del 15 aprile, scadenza di presentazione della dichiarazione dei redditi. Esistono diversi tipi di variabilità di settore: alcune sono ricorrenti e prevedibili (per esempio il periodo della dichiarazione dei redditi o i Giochi Olimpici), mentre altre sono imprevedibili (per esempio le notizie del giorno). Il risultato comune è che è necessario garantire la capacità per il periodo di picco previsto, più un margine di errore. Gran parte di questa capacità non servirà per il resto del tempo. La diversificazione offre importanti vantaggi per ridurre le variabilità di settore.
Variabilità di utilizzo delle risorse. Le risorse di elaborazione, archiviazione e di input/output (I/O) vengono in genere acquistate insieme: un server contiene una certa quantità di potenza di elaborazione (CPU), archiviazione e I/O (per esempio i servizi di rete o l’accesso al disco). Alcuni carichi di lavoro come quelli delle ricerche utilizzano molta CPU ma relativamente poco spazio di archiviazione o I/O, mentre altri come la posta elettronica tendono a utilizzare molto spazio di archiviazione ma poca CPU. Sebbene sia possibile controllare la 16 capacità acquistando server ottimizzati per fornire CPU o spazio di archiviazione, in questo modo si risolve solo in parte il problema, in quanto la flessibilità risulta ridotta e la soluzione potrebbe non essere economica dal punto di vista della capacità. Questa variabilità comporterà la presenza di risorse inutilizzate, a meno che non si applichi la diversificazione dei carichi di lavoro eseguendo carichi di lavoro con profili di risorse complementari.
Modelli di crescita incerti. La difficoltà nel prevedere quali risorse informatiche saranno necessarie in futuro e l’elevato tempo di risposta necessario per portare la capacità online sono altri motivi di scarso utilizzo. Tutte le pubbliche amministrazioni devono ottenere l’approvazione per gli investimenti IT con largo anticipo rispetto alla conoscenza diretta della richiesta di infrastrutture. Le amministrazioni più grandi devono affrontare questo problema pianificando i propri acquisti con circa dodici mesi di anticipo. Diversificando l’attività con carichi di lavoro di vari clienti, i provider di servizi cloud possono ridurre queste incertezze, in quanto la richiesta superiore alle aspettative di alcuni carichi di lavoro verrà annullata da una domanda inferiore al previsto per altri.