구글, TPU '트릴리움' 내세워 AI 성능 향상 및 에너지 효율 증진 도모
구글은 인공지능(AI) 모델 학습과 추론 가속에 최적화된 전용 칩인 Tensor Processing Unit(TPU)의 6세대 '트릴리움'을 선보였다.
2013년 음성검색 기능 도입 당시, AI 연산을 위한 특별한 하드웨어 필요성을 느꼈던 구글은 10년간 TPU 개발에 집중했다. 모한 피치카 구글 클라우드 그룹 프로덕트매니저(PM)는 "그래픽처리장치(GPU)는 컴퓨터 그래픽 처리를 위해 설계된 칩으로, 병렬 처리 구조 덕분에 AI 워크로드에도 활용되고 있다. 반면, TPU는 신경망 연산을 위해 특별히 설계된 칩"이라고 설명했다.
구글은 트릴리움이 이전 세대 대비 추론 처리량이 최대 3배 증가했으며, 달러당 학습 성능은 2.5배, 추론 성능은 1.4배 향상되었다고 밝혔다. 고밀도 AI 모델뿐 아니라 전문가 혼합(MoE) 아키텍처를 활용한 AI 모델 학습에서도 이전 세대보다 3.8배 빠른 성능을 보였다.
TPU의 강점은 여러 분야에서 입증되었다. 단백질 구조 예측 프로그램으로 노벨상을 받은 알파폴드2도 TPU로 개발되었고, 구글의 최신 AI 모델인 '제미나이 2.0' 학습에도 트릴리움이 사용되었다. 신약 개발 분야에서 바이엘이 신약 개발 가속화를 위해 TPU를 도입했고, 딥제노믹스는 차세대 RNA 치료제 개발을 위한 기반 모델 구축에 트릴리움을 활용했다.
국내 카카오는 통합 AI 브랜드 '카나나' 개발에 트릴리움을 도입하여 높은 수준의 한국어 대응이 가능한 모델을 빠르게 확보했다. 트릴리움은 256개의 유닛이 하나처럼 매끄럽게 병렬 연산을 처리했으며, 기존 v5e에 비해 곧바로 3배가량 더 높은 성능을 보여주었다.
구글은 TPU '트릴리움' 개발을 통해 AI 모델 학습 성능 향상과 에너지 효율 개선을 동시에 달성했다는 점을 강조했다. 피치카 PM은 "2022년 출시된 이전 세대와 비교해 전력 효율이 67% 향상되었다"며 "트릴리움은 지금까지 출시된 TPU 중 가장 지속 가능한 제품"이라고 강조했다.
