Ingenieros en Meta , la empresa matriz de Facebook, han revelado cómo han podido ofrecer memoria gratuita utilizando una solución de software llamada Descarga de memoria transparente (TMO).
Ahora es parte del Linux kernel y, en pocas palabras, descarga automáticamente los datos a otros niveles de almacenamiento (por ejemplo, el expansor de memoria CX de Samsung) que son menos costosos y más eficientes energéticamente que la memoria.
Los ahorros son significativos; TMO se ha estado ejecutando en millones de Facebook servidores durante más de un año, ahorrando hasta casi un tercio de la memoria por servidor. Si bien es probable que sea insignificante en docenas o incluso cientos de servidores, Facebook La inmensa escala de 's presenta un desafío único.
Análisis: el gigantesco apetito de Facebook por RAM
La red social más grande del mundo tiene casi tres mil millones de usuarios activos mensuales y millones de servidores repartidos en 21 ubicaciones en todo el mundo. Si cada servidor tuviera 128 GB de RAM en promedio, eso equivaldría a 256 millones de GB (o 256 PB) de RAM que, a un costo promedio de $ 4 por GB (DDR4 ECC RAM), equivale a aproximadamente $ 1 mil millones en memoria. Eso es asumiendo que Facebook tiene al menos dos millones de servidores (el blog de Facebook citó "millones de servidores" ya en julio de 2018), y es probable que el número real sea mucho mayor.
Las cifras presentadas por el equipo que trabajó en TMO mostraron que el costo de la memoria representa un tercio de la lista de materiales del servidor de Meta, con RAM comprimida y SSD que representan menos del 11 %. Lo que es más preocupante, la carga del costo de la memoria RAM (como porcentaje de la infraestructura total) se ha más que duplicado desde que Facebook lanzó su primera generación de servidores (actualmente está en la cuarta).
La adopción de TMO tiene algunos inconvenientes; más notablemente, una degradación en el rendimiento. Pero las ganancias en términos de ahorro de energía y memoria superan con creces las desventajas y las iteraciones futuras combinadas con mejoras de hardware (p. SSD o unidades CXL) ofrecerán una mayor mitigación.