Diseño e implementación de un sistema de almacenamiento masivo "LOW COST" de alto rendimiento y escalabilidad para entornos HPC
Design and implementation of a high performance, scalability and massive storage system "LOW COST" for HPC enviroments
Author
Varela Haya, AlejandroDate
2012-07-09Director/es
Derechos
Atribución-NoComercial-SinDerivadas 3.0 España
Palabras clave
AFS
CPD
Clúster
HPC
Sistema de ficheros
Raid
Virtualización
Abstract:
RESUMEN: Una
de
las
principales
finalidades
de
este
proyecto
es
aportar
una
solución
al
actual
sistema
de
almacenamiento
del
clúster
HPC
calderón,
el
cual
se
encuentra
ubicado
en
la
Facultad
de
Ciencias
(CPD
3
Mares)
y
esta
administrado
por
el
grupo
de
Arquitectura
y
Tecnología
de
Computadores(ATC)
del
departamento
de
Electrónica
y
Computadores
de
la
Universidad
de
Cantabria.
Este
clúster
de
cálculo
de
alto
rendimiento
consiste
fundamentalmente
en
un
conjunto
de
unos
100
computadores
trabajando
de
forma
coordinada
en
la
resolución
de
problemas
científicos.
Para
ello,
el
sistema
dispone
de
mas
de
800
procesadores,
1.5
TB
de
memoria
RAM
y
redes
de
altas
prestaciones
myrinet
e
infiniband.
Su
sistema
de
almacenamiento
global
actualmente
en
producción
consiste
en
un
sistema
distribuido
usando
como
tecnología
de
distribución
de
ficheros
AFS,
la
cual
tiene
importantes
problemas
de
escalabilidad
en
cuanto
a
rendimiento.
Este
sistema
tiene
centralizado
en
3
servidores
y
dos
bandejas
de
discos
toda
la
gestión
y
el
almacenamiento
físico
(discos
hardware).
Estos
3
servidores
gestionan
todo
el
sistema
distribuido.
Uno
de
ellos
se
encarga
de
almacenar
los
metadatos
del
sistema
de
ficheros
y
lo
otros
dos
restantes
se
encargar
de
almacenar
y
gestionar
los
datos
de
usuarios
y
aplicaciones.
El
sistema
de
ficheros
distribuido
AFS,
junto
con
su
“backend”,
no
han
sido
capaces
de
escalar
apropiadamente
en
rendimiento
con
el
rápido
crecimiento
de
los
elementos
de
cómputo
del
clúster.
Por
tanto,
en
este
proyecto
propondremos
el
diseño
de
un
nuevo
“backend”
que
ofrecerá
la
posibilidad
de
descentralizar
el
sistema
de
ficheros
y
mejorar
con
ello
el
rendimiento
del
sistema
de
ficheros
distribuido
que
se
encargue
de
gestionar
los
datos
como
“frontend”
hacia
sus
clientes.
Nuestra
solución
radica
en
una
distribución
de
la
gestión
y
el
almacenamiento
a
través
de
al
menos
un
servidor
por
cada
rack
del
clúster.
Esencialmente,
consiste
en
el
diseño
y
desarrollo
del
“backend”
del
sistema
de
almacenamiento
sobre
el
que
construiremos
dos
servidores
virtuales,
utilizando
tecnología
de
virtualización
XEN.
Cada
uno
de
ellos
llevará
a
cabo
un
“rol”
de
almacenamiento
diferente;
Uno
implementará
un
sistema
de
ficheros
distribuido(LUSTRE
se
perfila
como
la
opción
mas
interesante)
y
el
otro
un
sistema
de
aprovisionamiento
de
maquinas
virtuales.
Este
proyecto
se
centrará
en
el
diseño
e
implementación
del
“backend”
de
almacenamiento
y
en
una
primera
aproximación
en
el
desarrollo
de
la
red
de
almacenamiento
del
sistema
de
aprovisionamiento
de
máquinas
virtuales.
A
pesar
de
que
nuestro
sistema
se
encuadra
en
un
entorno
HPC,
una
premisa
importante
que
se
ha
impuesto
es
la
utilización
de
hardware
de
bajo
coste,
en
comparación
con
el
hardware
normalmente
utilizado
en
estos
sistema
de
almacenamiento
(SAN).
Nuestro
sistema
deberá
cumplir
con
las
premisas
de
alto
rendimiento
y
bajo
coste.
Además,
para
continuar
con
esta
filosofía
del
bajo
coste,
una
de
las
líneas
futuras
que
serán
propuestas
en
este
proyecto
sobre
el
aprovisionamiento
de
maquinas
virtuales,
será
la
Alejandro
Varela
Haya
4
virtualización
completa
de
los
nodos
de
computación
del
clúster
HPC,
que
ayudará
a
reducir
el
consumo
energético
global
del
clúster
y
del
CPD.
ABSTRACT: One
of
the
main
purposes
of
this
Project
is
to
give
a
solution
to
the
current
storage
system
for
our
HPC
cluster
calderon,
which
is
located
in
the
Facultad
de
Ciencias
(CPD
3Mares)
and
this
CPD
is
administrated
by
the
group
“Architecture
and
Computer
Technology”
(Department
of
Electronics
and
Computers
at
University
of
Cantabria).
This
HPC
cluster
is
formed
by
a
set
of
about
100
computer
working
in
coordination
for
the
purpose
of
resolving
scientific
problems.
This
system
has
more
than
800
processors,
1.5TB
of
RAM
memory
and
high
performance
network
myrinet
e
infiniband.
Its
global
storage
system,
nowadays
in
production,
is
a
distributed
system
using
AFS
like
file
system
distribution,
which
has
important
scalability
issues
in
terms
of
performance.
This
system
has
centralized
all
the
storage
(hardware
drives)
and
a
management
in
3
servers
and
2
disk
trays.
These
3
servers
manage
all
the
distributed
system.
One
of
them
is
responsible
of
store
the
metadata
of
the
file
system
and
the
other
2
are
responsible
for
storing
and
managing
the
users
and
applications
data.
This
distributed
file
system
AFS,
together
with
its
backend,
have
not
been
able
to
scale
properly
in
terms
of
performance
with
the
quick
growth
of
the
computing
items
of
the
cluster.
Therefore,
in
this
project
we
will
propose
the
design
of
a
new
backend
which
it
offer
the
possibility
of
decentralize
the
file
system
and
with
it
improve
the
performance
of
the
distributed
file
system.
This
system
will
be
responsible
of
manage
the
data
like
frontend
to
its
clients.
Our
solution
lies
in
the
distribution
of
the
management
and
the
storage
through
at
least
on
sever
per
rack.
Essentially,
this
solution
is
the
design
and
development
of
the
backend
of
the
storage
system.
In
this
system
we
will
build
two
virtual
server,
using
XEN
like
virtualization
technology.
Each
one
of
them
takes
out
a
role
of
the
different
storage;
one
implements
a
distributed
file
system
(LUSTRE
is
the
most
interest
option)
and
the
other
system
is
the
provisioning
of
virtual
machine.
This
project
will
focus
in
the
design
and
implementation
of
the
storage
backend
and
in
a
first
approximation
of
the
development
of
the
storage
network
of
the
provisioning
of
virtual
machines.
In
spite
of
our
system
is
in
a
HPC
environment,
an
important
premise
that
this
project
imposes
is
the
utilization
of
low
cost
hardware,
compared
with
the
hardware
usually
used
in
this
kind
of
storage
system
(SAN).
Our
system
must
satisfy
with
the
premises
of
high
performance
and
low
cost.
Furthermore,
to
continue
with
this
philosophy
of
low
cost,
one
of
the
future
lines
which
will
be
propose
in
this
project
about
provisioning
of
virtual
machines,
will
be
the
full
virtualization
of
computer
nodes
of
the
HPC
cluster,
what
will
help
to
reduce
the
global
energetic
consume
of
the
cluster
and
CPD.