Cosa è un Distributed File System (DFS)?

Un file system distribuito (in inglese Distributed File System, o DFS) è un meccanismo di archiviazione e gestione dei dati che consente agli utenti o alle applicazioni di accedere a file di dati – per esempio PDF, documenti di testo, immagini, file video, file audio e così via – da uno storage condiviso su uno o più server collegati in rete. Condividendo e archiviando i dati su un cluster di server, il DFS consente a un gran numero di utenti di condividere risorse di storage e file di dati su numerose macchine.

I motivi per cui un'azienda può scegliere di utilizzare un DFS sono principalmente due:

archiviare i dati in modo permanente su supporti di storage secondari;
condividere in modo semplice, efficiente e sicuro le informazioni tra utenti e applicazioni.

Un DFS è quindi un sottosistema del sistema operativo del computer che gestisce, organizza, archivia, protegge, recupera e condivide i file di dati. Le applicazioni o gli utenti possono archiviare i file di dati o accedervi nel sistema, proprio come accadrebbe con un file in locale. Inoltre, gli utenti possono visualizzare dai loro computer o smartphone tutte le cartelle condivise del DFS come un unico percorso che si dirama in una struttura ad albero includendo i file archiviati su più server.

Un DFS è caratterizzato da due componenti fondamentali:

Posizionamento trasparente: gli utenti visualizzano un singolo namespace per tutti i file di dati, indipendentemente dal computer che utilizzano per accedere ai file o archiviarli. Gli utenti non sono in grado di determinare la posizione in cui il file era stato archiviato inizialmente e possono spostare i file all'interno delle cartelle, se necessario, senza dover modificare il nome del percorso;
Ridondanza: attraverso una funzione di replica dei file, il DFS diffonde copie di un file tra i nodi del cluster. Questo significa che i dati rimangono altamente disponibili anche in caso di guasto di un server.

Gartner® Magic Quadrant™ 2022 per file system distribuiti e object storage

17 novembre 2022

Come funzionano i file system distribuiti

Con un DFS, le workstation e i server sono collegati in rete per creare un file system parallelo con un cluster di nodi di storage. Il sistema è raggruppato in un unico namespace e pool di storage, e permette un accesso rapido ai dati tramite più host o server contemporaneamente.

I dati possono risiedere su una varietà di dispositivi o sistemi di storage – dagli hard disk (HDD) alle unità a stato solido (SSD) fino al cloud pubblico. Indipendentemente da dove sono archiviati i dati, il DFS può essere configurato come namespace autonomo (o indipendente) con un solo server host, oppure come namespace basato su dominio con più server host.

Quando un utente clicca sul nome di un file per accedere ai dati corrispondenti, a seconda di dove si trova l'utente il DFS controlla diversi server, quindi serve la prima copia disponibile del file nel gruppo di server appropriato. In questo modo è possibile evitare la congestione dei server dovuta all'eccesso di richieste quando molti utenti accedono ai file, e si mantengono i dati disponibili anche in caso di malfunzionamento o guasto dei server.

Tramite la funzione di replica dei file del DFS, tutte le modifiche apportate a un file vengono copiate su tutte le istanze di quel file presenti sui nodi del server.

Caratteristiche dei DFS

Esistono molte soluzioni DFS progettate per aiutare le aziende a gestire, organizzare e accedere ai file di dati. La maggior parte di esse include le seguenti funzionalità:

Accesso trasparente: gli utenti accedono ai file come se fossero archiviati localmente sulle loro workstation;
Posizionamento trasparente: non occorre che le macchine host sappiano dove si trovano effettivamente i file, perché è il DFS a gestirli;
Blocco dei file: il sistema blocca i file in uso nelle varie postazioni per evitare che due utenti diversi modifichino contemporaneamente lo stesso file;
Crittografia dei dati in transito: il DFS protegge i dati crittografandoli durante lo spostamento attraverso il sistema;
Supporto per più protocolli: gli host possono accedere ai file utilizzando una serie di protocolli – tra cui Server Message Block (SMB), Network File System (NFS) e Portable Operating System Interface (POSIX), solo per citarne alcuni.

Vantaggi dei DFS

Il primo vantaggio di un file system distribuito è che consente agli utenti di accedere agli stessi dati da più luoghi diversi. Inoltre, rende la condivisione delle informazioni tra le varie aree geografiche semplice ed estremamente efficiente. Un DFS è infine in grado di eliminare completamente la necessità di copiare i file da un sito a un altro o di spostare delle cartelle – attività che richiedono tempo ed energie che potrebbero essere meglio spese altrove.

Altri vantaggi e benefici includono:

Resilienza dei dati: poiché i file sono archiviati in più di una posizione, un guasto al server non si traduce in un'emergenza;
Efficienza della rete: i carichi di lavoro intensivi non rallentano il sistema, perché il DFS può prelevare i dati dal primo nodo successivo disponibile;
Accesso alle informazioni più recenti: le modifiche apportate alle cartelle o ai file condivisi sono visibili e disponibili immediatamente a tutti coloro che utilizzano il DFS;
Scalabilità semplificata: per ampliare il sistema è sufficiente aggiungere altri nodi; Alta affidabilità: dato che i file sono replicati tra gli host, la perdita di dati non è una preoccupazione pressante.

Nutanix si aggiudica due premi Customers' Choice di Gartner® Peer Insights™ nelle categorie HCI e Distributed File and Object

Key Play:HCI
Solution Type:Unified Communications

19 maggio 2022

Qual è la differenza tra il DFS e l'object storage?

Analogamente al DFS, anche l'object storage archivia le informazioni su molti nodi di un cluster per un accesso rapido, resiliente ed efficiente ai dati. Entrambi eliminano i potenziali “single point of failure”, ma non sono la stessa cosa.

DFS e object storage differiscono sotto vari punti di vista, fra cui:

Struttura: invece di archiviare i file di dati in una struttura gerarchica come il DFS, l'object storage è costituito da bucket semplici di oggetti;
API: come detto in precedenza, il DFS supporta i protocolli tradizionali dei file system e funziona pertanto con quasi tutte le applicazioni. L'object storage richiede l'API REST (Representational State Transfer API), progettata per l'uso sul web perché si basa su richieste HTTP per accedere ai dati e utilizzarli. Esistono due specifiche disponibili per l'accesso delle applicazioni all'object storage: la specifica S3 sviluppata da Amazon, e Openshift Swift Api sviluppata da RedHat;
Metodo di modifica: il DFS consente agli utenti di apportare modifiche, o “scritture”, in qualsiasi punto di qualsiasi file di dati. Per apportare una modifica nell'object storage, l'oggetto va invece sostituito del tutto.

Esempi di file system distribuiti e use case

Quando si tratta di trovare una soluzione DFS, le opzioni disponibili sono numerose – dai software open source gratuiti, come Ceph e Hadoop DFS, alle opzioni di accesso remoto come AWS S3 e Microsoft Azure, fino alle soluzioni proprietarie come Nutanix Files e Nutanix Objects.

Le caratteristiche del DFS lo rendono ideale per una serie di use case, soprattutto perché è particolarmente adatto a carichi di lavoro che richiedono letture e scritture estese e casuali, o in generale per attività che implicano grandi quantità di dati quali ad esempio simulazioni complesse al computer, calcoli ad alte prestazioni, elaborazione dei log e apprendimento automatico.

Risorse correlate

Nutanix Files aiuta le organizzazioni a ottimizzare le prestazioni dello storage di file e le operazioni IT

9 febbraio 2023

Storage con Files

Scopri in che modo Files Storage crea un'unica piattaforma per tutte le esigenze delle tue applicazioni.

Products:Nutanix Unified Storage
Use Cases:Unified Storage

6 maggio 2022

Trasforma lo storage

Semplifica il complesso mondo dello storage di file con l'HCI e cogli tutti i vantaggi della distribuzione e del provisioning in stile cloud.

9 febbraio 2023

Soluzioni e prodotti correlati

Nutanix Files Storage

Gestione semplice, scalabile, intelligente e basata sul cloud per i tuoi file.

Prodotti:Nutanix Unified Storage

10 settembre 2024

Nutanix Objects Storage

Storage di oggetti sul cloud – semplice, sicuro e scalabile.

Prodotti:Nutanix Unified Storage

22 agosto 2024

Storage unificato

Gestisci e condividi i dati non strutturati e liberati dei silos di storage e delle loro limitazioni in fatto di visibilità e accesso.

Metadati:Casi d'uso
Nutanix:Soluzioni

19 dicembre 2022

Iniziamo!

Programma una demo personalizzata con un consulente e scopri come Nutanix Enterprise Cloud può trasformare la tua azienda.