Skip to main content

La memoria HBM

Ya tenemos entre nosotros la memoria destinada a sustituir a GDDR5 que tanto ha dado ya en el mundo de los procesadores gráficos. La AMD R9 Fury X se ha convertido en el primer producto en salir al mercado haciendo uso de esta nueva tecnología:

 

AMD Fiji
AMD Fiji

HBM es un estándar de memoria que promete grandes anchos de banda mediante el uso de bus mucho más anchos, aumentar la eficiencia debido a la no necesidad de tener a la memoria funcionando a frecuencias tan altas y permite apilar los chips DRAM unos encima de otros para ahorrar espacio y poder también aprovechar mejor el bus mucho más ancho.

Durante mucho tiempo, la forma que se ha tenido de aumentar el ancho de banda proporcionado por la memoria ha sido la de aumentar la frecuencia de funcionamiento todo lo posible. En las tarjetas gráficas actuales hemos llegado a ver memorias GDDR5 funcionando a 7ghz para intentar alcanzar altas transferencias sin tener que tocar demasiado el ancho del bus. Los diseños que se venían utilizando hasta ahora se complicaban demasiado si disparabas ese ancho del bus a la hora de diseñar la controladora de memoria y los enrutados de las líneas de datos por el PCB.

En el año 2011 en AMD ya dieron una serie de explicaciones sobre lo que nos podríamos encontrar si queríamos avanzar más allá de los límites de la memoria GDDR5 actual:

AMD techincal forum exhibition 2011
AMD techincal forum exhibition 2011

En resumidas cuentas, se podría haber seguido estirando el planteamiento que nos ha llevado hasta GDDR5 pero los consumos se habrían disparado y la eficiencia habría brillado por su ausencia. Uno de los problemas clave que se planteó fue que gran parte del gasto energético de la GDDR5 se debía a esas altísimas frecuencias de reloj a las que funcionaba con las complejidades que ello supone de distribución y mantenimiento.

Quedó claro por tanto, que para continuar aumentando el ancho de banda no había que seguir subiendo la frecuencia. Lo mejor era incluso bajarla para deshacerse de las complejidades inherentes a las altas frecuencias y meter un ancho del bus mucho, mucho mayor. Esto último también tiene sus peculiaridades de diseño y fabricación que ha habido que solventar, como iremos viendo. Este cambio nos lleva por ejemplo de una nvidia 980ti con una memoria GDDR5 a 7ghz y un bus de 384 bits a una AMD fury X con memoria HBM a 1000mhz pero con bus de 4096 bits. Datos bastante dispares pero que permiten dar el salto de 336GB/s a 512GB/s mejorando el consumo y la eficiencia de la memoria.

El bus de 4096 bits plantea ciertos retos de diseño. Para los estánadres que se veían hasta ahora, es un bus absurdamente ancho que habría sido una locura de enrutar por un PCB normal. De hecho los 384 o 512 bits que se veían en las tarjetas gráficas de gama alta actuales ya planteaban ciertos desafíos. La solución a la que se ha llegado es usar lo que se llama un interposer de silicio. El interposer es como un inicio de procesador, en el que se han imprimido las interconexiones de metal pero que no tiene ninguna lógica metida. Esas interconexiones servirán para conectar los chips de memoria con el procesador ya que ambos irán montados sobre el interposer. En este caso al llevar el interposer solo las interconexiones y no tener lógica, no hace falta que esté fabricado en un proceso tan moderno como el propio procesador gráfico, y así los costes se contienen un poco. En el caso de la AMD R9 Fury X se especula con que se ha usado un interposer de poco más de 1000 milímetros cuadrados a 65nm fabricado en UMC que contrasta con el proceso de 28nm de GlobalFoundries TSMC del procesador gráfico.

AMD interposer
AMD interposer

Pero hay otro problema. Las fábricas de semiconductores lo suelen tener complicado para hacer productos derivados de silicio demasiado grandes y esos 1000 milímetros cuadrados se pasan bastante de los habituales 600~650 que suele haber de tope, así que poner todos los chips de memoria uno al lado de otro no era una opción. De aquí surgió la necesidad de apilar los chips de memoria y así ahorrar espacio, haciendo que el interposer pueda ser más pequeño y fácil de fabricar. En el caso de la AMD R9 Fury X estamos hablando de la primera versión de HBM la cual está limitada a 4 chips de 256MB por pila y 4 pilas en total. Se deduce por tanto que la primera versión de HBM está limitada a 4GB. Cada pila necesita que por su interior circule un bus de 1024 bits para conectar los 4 chips de 256 bits cada uno. A ese bus que circula por el interior se le conoce como TSV o Through-Silicon Vias:

through-silicon vias
through-silicon via

El diseño del TSV ha sido un mayor limitante que el diseño del interposer a la hora de hablar de la capacidad máxima de memoria de la primera versión de HBM. Se espera que con HBM2 que veremos hacia finales de 2016 este problema esté resuelto. Un derivado de apilar cosas encima de otras que suele preocupar es la forma de disipar calor de esa estructura. En el caso del HBM los huecos que quedan entre unos chips DRAM y otros se ha aprovechado para meter un sistema que hace circular el calor hacia arriba y de hecho, los propios chips de memoria se pueden usar como superficie extra para disipar el calor del procesador. Al tener esa superficie extra, el disipador trabaja mejor ya que es más fácil sacar la misma cantidad de calor de una superficie mayor que de una más pequeña.

Otra ventaja del HBM es que al incluir los chips DRAM en un espacio tan pequeño al lado del procesador, el diseño del PCB se simplifica y también se puede hacer más pequeño:

Tamaño AMD 290X y AMD R9 Fury X
Tamaño AMD 290X y AMD R9 Fury X

El HBM también tiene algún otro aspecto negativo que no he comentado, y es que actualmente su coste es mayor que GDDR5 ya que no hablamos de PCB+ DRAM sino de PCB+interposer+DRAM apilada y sin contar con la economía de escala de la actualmente omnipresente GDDR5. Los chips DRAM para HBM actualmente solo los fabrica Hynix. Al final todo esto te da un mayor coste de materiales, aunque AMD no ha querido soltar cifras al respecto.

En un futuro se espera que el HBM esté presente en procesadores de propósito más general y a decir verdad parece una tecnología diseñada especialmente para las APU de AMD. Ya iremos viendo cómo evoluciona.

4 thoughts on “La memoria HBM

  1. Sería fantastico ver el rendimiento real comparado a la DDR5 en juegos, y saber si en verdad estamos ante algo mejor, ó si solo es mismo pan con otra mermelada mas cara.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.