[세상돌아가는 이야기.. ]/[ICT-Animal9]

[‘엘리베이터 단 반도체’ HBM] [데이터 확확 지나가는.. ] ....

뚝섬 2024. 3. 21. 06:07

[‘엘리베이터 단 반도체’ HBM]

[데이터 확확 지나가는 ‘넓은 고속도로’가 HBM] 

[AI가 우리 반도체에 준 절호의 기회] 

 

 

 

‘엘리베이터 단 반도체’ HBM

 

1854년 뉴욕 산업박람회에서 미국의 엔지니어 엘리샤 오티스가 박람회장에 설치한 대형 엘리베이터에 발을 디뎠다. 그는 자신이 타고 올라간 엘리베이터에 연결된 케이블을 끊게 했다. 그가 개발한 엘리베이터는 줄이 끊어져도 추락하지 않는다는 걸 보여주기 위해서였다. 고대 그리스에서 도르래를 이용한 형태로 첫선을 보였지만 안전성 우려에 2000년 넘게 물건 나르는 용도에 머물렀던 엘리베이터가 오티스의 시연을 계기로 사람이 탈 수 있는 기구로 도약했다.

 

▶챗GPT 같은 생성형 AI(인공지능) 시대가 열리면서 수요가 급증한 HBM(고대역폭 메모리)은 ‘엘리베이터가 설치된 아파트’로 비유된다. 아파트는 수직으로 쌓아올린 D램 칩을 뜻하고, 엘리베이터는 켜켜이 쌓은 D램 내부를 관통하는 전극으로 위아래를 연결한 데이터 전송 통로를 말한다. 기존에는 금속 배선으로 D램을 복잡하게 연결했는데, 수직으로 통하는 길을 만들어 데이터 처리 속도를 혁신적으로 끌어올렸다. 데이터 통로의 폭을 넓혔다는 의미로 ‘도로의 차선’을 대폭 늘린 것에 빗대기도 한다.

 

HBM은 2013년 SK하이닉스가 세계 최초로 개발에 성공하면서 구현됐지만, 상당 기간 주목받지 못했다. 기존 방식의 그래픽 장치용 D램(GDDR)보다 3배 이상 비싸 외면받았다. 경쟁 기업들이 HBM 개발을 접는 속에서도 SK하이닉스는 투자를 이어가 수율(합격품 비율)을 높였고, 지난해엔 D램을 12층으로 쌓아올린 ‘12단 적층 HBM3′를 최초로 내놓았다. 지난해부터 생성형 AI 열풍으로 수요가 폭발적으로 늘면서 엔비디아에 납품하는 등 투자의 결실을 맺고 있다.

 

초기 판단 미스로 HBM 개발이 뒤늦었던 삼성전자는 그동안 엔비디아의 성능 테스트를 통과하지 못해 고전해왔다. 하지만 젠슨 황 엔비디아 CEO가 19일 기자 간담회에서 “삼성 HBM 제품을 (사용하기 위해) 검증하는 단계”라고 밝히며 일약 주목받게 됐다. 이 발언으로 올 상반기 중 5세대 HBM을 양산할 삼성전자에 대한 기대가 커지면서 삼성전자 주가가 급등했다.

 

▶원래 HBM 개발에 처음 나선 곳은 미국 AMD였지만 이 회사는 SK하이닉스에 손을 내밀어 세계 최초 생산을 돕고도 AI 시대에 주도권을 잡지 못했다. 약간의 방심에도 주도권이 휙휙 넘어갈 만큼 살벌한 경쟁이 벌어지는 전쟁터다. 젠슨 황은 “앞으로 삼성전자와 SK하이닉스가 엄청난 성장 사이클을 맞이하게 될 것”이라고 했다. 그의 말대로 두 회사가 AI 시대를 주도하는 엔비디아라는 ‘거인의 어깨’에 올라타길 기대한다.

 

-곽수근 논설위원·테크부 차장, 조선일보(24-03-21)-

_____________

 

 

데이터 확확 지나가는 ‘넓은 고속도로’가 HBM

 

곧 5세대 HBM 양산, 6세대는 2026년 양산 예상

 

‘인공지능(AI)의 심장’이라는 고대역폭 메모리(HBM)를 둘러싼 경쟁이 불붙고 있다. 최근 법원에선 SK하이닉스에서 HBM 설계를 담당하다 금지 규정을 어긴 채 미국 경쟁 업체인 마이크론으로 이직한 전직 연구원을 상대로 낸 전직 금지 가처분을 인용했다. 기술을 뺏으려는 자와 지키려는 자, 반도체 업계에선 지금 HBM을 두고 생존을 건 한판 승부가 벌어진다. 도대체 HBM이 뭐길래, 이를 둘러싸고 격전이 펼쳐질까.

 

HBM(High Bandwidth Memory)은 영어 단어 뜻 그대로 넓은 대역폭(帶域幅)을 지닌 메모리를 말한다. 대역폭 순간적으로 보낼 있는 데이터 양이 얼마나 되는지를 뜻한다. 고속도로의 차선이 넓을수록 더 많은 차들이 빨리 지나갈 수 있는 것처럼 대역폭이 넓을수록 데이터 전송 속도나 처리량이 늘어나는 이치다. 인공지능 수퍼컴퓨터 등이 AI를 구현하려면 방대한 양의 데이터를 더하고, 빼고, 나누고, 곱하면서 학습을 한 뒤 스스로 추론하고, 이를 재빨리 처리해야 한다. 이 과정에서 HBM 데이터를 가장 빠르게 처리하는 필수품으로 자리하게 됐다.

 

최근 AI 모델과 서비스 개발에 기업 간 또는 국가 간 경쟁이 치열한데, 이 경쟁의 승패는 ‘컴퓨팅 능력(Computing Power)’에 달렸다. 많은 정보를 얼마나 빠르게 계산하고 처리해낼 수 있느냐에 달렸다는 얘기다. 그런데 이 컴퓨팅 능력은 ‘GPU(그래픽 처리 장치)’ ‘HBM’ 그리고 이들을 어떻게 묶고 쌓는지를 뜻하는패키징 의해 결정된다. 그중에서도 HBM이 더욱 중요해지고 있다. 생성형 AI 계산 과정에선 GPU보다 HBM 바쁘게 돌아가기 때문이다.

GPU 쉽게 말해 수만 개의 작은 계산기(Computing Core)동시 계산’(병렬 처리) 하는 것이다. 그러면 계산 시간이 확 준다. 그런데 이런 폭발적인 양의 데이터를 빠르게 처리하려면 넓은 고속도로에 정보를 확확 지나다니게 해야 하는데, 그 역할을 HBM이 한다. GPU 아무리 좋아도 HBM 없으면 성능을 발휘하지 못한다는 얘기다. ‘앙꼬 빠진 찐빵’으로 비유하자면, 찐빵의 ‘앙꼬’가 바로 HBM이다.

 

이처럼 생성형 AI 시대의 핵심으로 통하는 HBM의 역사는 10여 년 전으로 거슬러 올라간다. 당시 그래픽카드용 GPU 설계하던 엔비디아와 AMD 제안으로 SK하이닉스는 이들과 HBM 공동 개발하기 시작했다. 2013년 SK하이닉스는 세계 처음으로 HBM을 개발했고, 이 HBM이 2020년쯤 생성형 AI 시대가 도래하자 그 꽃을 피운 것이다.

 

SK하이닉스는 HBM 성능과 용량을 계속 향상시켜 올해 상반기 8 또는 12단의 HBM3E 양산할 계획이다. HBM은 ‘아파트’ 같은 구조라서 ‘단층집’인 D램을 여러 겹 켜켜이 쌓아 놓은 형태<그림>다. 층과 층 사이는 ‘엘리베이터’처럼 서로를 연결하는 TSV(실리콘 관통전극)까지 뚫어 저장 용량을 늘린다. HBM은 성능 개선에 따라 1세대(HBM)에서 2세대(HBM2), 3세대(HBM2E)를 거쳐 4세대(HBM3), 5세대(HBM3E)로 진화했다. HBM3 다음에 붙는 알파벳 ‘E’는 HBM3에서 일부 성능을 개선해 확장(Extended)한 버전이란 의미다. 업계에서는 2026 6세대인 HBM4 양산 시대가 열릴 것으로 예상한다. 메모리 업계 3강(SK하이닉스·삼성전자·마이크론)의 ‘반도체 삼국지’ 경쟁도 격화하고 있다. SK하이닉스와 삼성전자가 양분해 온 HBM 시장에 미국의 마이크론도 본격 참전하는 모양새다.

 

그렇다면 각 기업들이 2026년 양산을 목표로 하는 6세대 HBM4는 어떤 모습일까. 기존 HBM은 여러 개 D램을 쌓은 뒤, 곳곳에 1024개의 구멍을 뚫어 정보 출입 통로를 만들었다. 그런데 HBM4 통로 숫자가 2배로 늘어난 2048개가 된다. 연결선 하나당 데이터 전송 속도는 더욱 빨라진다. 결과, 대역폭이 이전 세대인 HBM3E보다 이상 증가한다. 쌓아 올리는 단층집(D램) 층수도 12층에서 16층까지 늘어나 저장 데이터 용량도 늘어난다.

 

10년 이상 더 먼 미래의 HBM은 어떤 모습일까. 먼저 GPU와 HBM을 지금처럼 수평으로 배치하는 게 아니라, 수직으로 쌓아 ‘주상 복합 건물’ 구조(3D 패키징)처럼 만들 것으로 예상한다. 또 주상 복합에서 ‘백화점·상가 부분’(GPU)과 ‘아파트 부분’(HBM) 사이 경계도 모호해질 것이다. 마치 아파트 중간 층에 카페나 피트니스 센터를 넣는 것처럼, GPU 있던 일부 계산 기능이 HBM으로 올라갈 있다. 이렇게 되면 GPU HBM 경계가 무너지는 시대가 도래한다. 미래엔 오히려 HBM이 GPU에 계산 명령을 하는 지휘자가 될 수도 있다. 이렇게 되면 데이터 저장을 하던 메모리 반도체는 데이터 처리의 변방이 아니라 중심이 된다. 우리나라가 HBM을 절대 사수해야 하는 이유다.

 

-김정호 KAIST 전기·전자공학과 교수, 조선일보(24-03-15)-

______________

 

 

AI가 우리 반도체에 준 절호의 기회 

 

한국 반도체… '메모리'는 세계 최강, '시스템'은 글로벌 기업에 뒤져
인공지능 반도체는 메모리 중심으로 시스템을 통합
 

 

4차 산업혁명의 특징을 '초지능' '초연결'로 표현하기도 한다. 그 핵심적인 기술을 ABC로 상징적으로 설명하기도 하는데, A는 '인공지능'을 표현하는 AI, B는 '빅데이터', C는 '클라우드 컴퓨팅'을 상징한다. 다르게 설명하면 인공지능이 빅데이터로 학습해서 인간의 두뇌보다 더 효율적이고 경제적이며 정확하게 판단하고 예측하게 되고, 결국 인간의 지능을 컴퓨터가 대체하는 세상으로 설명할 수 있다. 그런데 여기에서 빅데이터를 저장하고, 인공지능으로 학습하고 판단하는 데 가장 핵심적인 부품이 바로 '프로세서'와 '메모리'로 대표되는 반도체이다. 반도체가 없으면 인공지능도 없고 4차 산업혁명도 없다.

◇시스템 반도체 산업, 인공지능 반도체로 승부하라

최근 정부는 메모리 반도체에 비해 상대적으로 취약한 '시스템 반도체(프로세서 포함)' 분야의 경쟁력을 높이기 위한 지원 정책을 발표했고, 이에 더해 삼성전자는 시스템 반도체 글로벌 1위를 달성하기 위해 2030년까지 133조원의 투자 계획을 선언했다. 하지만 대부분의 시스템 반도체 시장은 이미 기존의 글로벌 기업들이 장악하고 있다. 프로세서 분야만 하더라도 인텔, 퀄컴, 엔비디아, AMD, ARM의 벽을 넘기는 어렵다. 판을 뒤엎기는 쉽지 않다.

다만 스마트폰과 자율주행 자동차에 무수히 들어갈 이미지 센서 분야가 유망하다. 공정도 메모리와 같이 3차원 구조를 갖는 장점이 있다. 그리고 앞으로 반도체 공정 서비스인 파운드리 사업에서 대만 TSMC의 점유율을 파고들어 대등한 경쟁을 할 수도 있다. 그 결과로 관련 재료와 장비 산업이 동반 성장하는 효과를 얻을 수 있다.

 

하지만 시스템 반도체 시장의 판도를 흔드는, 좀 더 원천적이면서 혁신적인 육성 방안이 필요하다. 지금 4차 산업혁명 시대를 맞아 인공지능이 그 새로운 패러다임을 제공한다. '인공지능 반도체'가 바로 그 절호의 기회이다. 인공지능 반도체프로세서와 메모리 반도체가 한 몸으로 합쳐진 반도체이다. 골드만삭스 보고서에 따르면 인공지능 반도체 시장은 연평균 40%씩 성장, 2025년에는 493억달러 규모가 될 것으로 예측된다.

우리에게 다행인 것은 인공지능에는 프로세서보다 메모리 기술이 필수적일 뿐만 아니라, 중심이라는 것이다. 빅데이터를 많이 저장하고 처리해야 하기 때문이다. 인공지능 반도체를 만들려면 신물질, 신공정, 그리고 새로운 구조가 필요한데, 국내 반도체 기업들이 그동안 메모리 사업에서 축적한 설계, 재료, 공정, 장비 기술뿐만 아니라 우수 인력을 최대한 활용할 수 있다.

◇인공지능 반도체의 개발 방향

인공지능을 대표하는 알고리즘은 심층신경망(DNN·Deep Neural Network)이다. 이세돌을 꺾은 알파고와 같은 방식의 알고리즘이다. 이를 위해서는 수학적으로 수많은 행렬 곱셈 작업과 병렬 연산 과정을 수행해야 하고, 이와 동시에 계산 결과를 빠른 속도로 메모리에 저장해 두어야 한다. 여기서 인공지능 성능이 결정되고 대부분의 전력 소모가 발생한다. 따라서 계산 속도가 빛의 속도처럼 빠르고, 동시에 전력 소모가 최소화하는 미래의 인공지능 반도체에서는 구조 병렬화의 극단적 증대와 메모리의 최대 근접화가 핵심 개발 방향이다. 이를 위한 인공지능 반도체 개발은 단기·중기·장기 세 단계로 나눠 추진해야 한다.

먼저 기존의 프로세서 내부 구조에서 병렬화를 증대하고, 프로세서 내부에 자체 메모리 용량을 늘리거나, 같은 데이터를 재사용하는 방법을 쓸 수도 있다. 또는 계산의 정확성을 조금 희생하면서 계산 부담을 줄이기도 한다. 이러한 방식을 스마트폰 단말기 내의 프로세서인 AP (Application Processor)에 적용해서 인공지능 기능과 성능을 개선할 수 있다. 이러한 인공지능 반도체 구조를 인공지능 가속기라고 부른다(그림). 삼성전자, 퀄컴, 화웨이에서 필요한 기술이다.

다음 단계로는 프로세서와 메모리 반도체를 마치 고층 주상복합 건물을 짓고, 고속 엘리베이터를 설치하는 것처럼, 수직 방향으로 쌓는 방법이다. 그러면 계산 속도와 메모리 용량을 대폭 늘리고, 동시에 전력 소모를 크게 줄인다. HBM(High Bandwidth Memory) 모듈 구조로 불리며(그림), 주로 데이터 센터의 인공지능 컴퓨팅 서버에 사용될 수 있다. 고성능 인공지능 반도체 시장을 장악하기 위한 최적의 전략 분야이다.

마지막 단계의 방법은 아예 인간의 뇌 자체를 모방한 신경망을 물리적으로 반도체 표면에 회로로 구현하는 방법이다. 여기에는 한 개의 신경회로에 계산 기능과 메모리 기능이 같이 있다. 이러한 방식의 인공지능 반도체를 뉴로모픽 칩(Neuromorphic Chip)이라고 부른다. 이를 위해서는 저항성 메모리와 같은 새로운 소자가 필요하다. 재료와 공정을 개발하고, 충분한 수율과 안정성을 확보하기 위해서는 상당한 기간의 연구 개발과 투자가 필요하다. 하지만 진정한 사물인터넷 인공지능 시대를 열기 위해서 꼭 필요한 인공지능 반도체이다. 특히 '초격차' 메모리 기술을 갖고 있는 국내 반도체 기업들이 미래에 가장 큰 전략적 경쟁력을 가질 수 있다.

1980년대에 삼성전자가 반도체 메모리 사업을 시작했고, 그 이후 불굴의 노력으로 성공 신화를 창조했다. 이제 인공지능 반도체로 제2의 성공 신화를 다시 한 번 더 만들 수 있다. 통찰력에 기반한 정밀한 방향 설정과 우리의 확고한 추진 의지가 성공의 열쇠다.

 

-김정호 KAIST 전기·전자공학과 교수, 조선일보(19-06-17)-

 

 

=========================