단일 칩으로 초당 1PetaOps 제공
Groq는 TPS (Tensor Streaming Processor) 아키텍처라고합니다. 2 년 전 구글의 TPU (Tensor Processing Unit)를 개발 한 10 명 중 8 명을 채용했다고 밝혔다.
이 회사는 6 억 6,300 만 달러의 자금을 조달했습니다.
Groq의 아키텍처는 초당 1 조회 또는 1e15 ops / s에 해당하며 초당 250 조 부동 소수점 연산 (FLOPS)이 가능합니다.
“최고의 GPU 회사는 고객에게 향후 몇 년 내에 하나의 PetaOp / s 성능을 제공 할 수 있기를 희망하고 있습니다. Groq CEO Jonathan Ross는 Groq가 오늘 발표하고 있습니다.“Groq 아키텍처는 지연 시간이 짧고 초당 유추 측면에서 유추 가능한 다른 것보다 훨씬 여러 배 더 빠릅니다. 우리는 첫 번째 실리콘 백, 첫 번째 전원 공급, 첫 주에 실행되는 프로그램을 6 주 이내에 파트너와 고객에게 샘플링했으며 A0 실리콘을 생산에 투입했습니다.”
Groq의 TSP 아키텍처는 소프트웨어 우선 사고 방식을 통해 기존 GPU 및 CPU 아키텍처의 동기화 오버 헤드없이 컴퓨팅 유연성과 대규모 병렬 처리를 모두 달성한다고 주장합니다.
Groq의 아키텍처는 전통적인 머신 러닝 모델과 새로운 머신 러닝 모델을 모두 지원할 수 있으며 현재 x86 및 비 x86 시스템의 고객 사이트에서 운영되고 있습니다.
이 아키텍처는 컴퓨터 비전, 머신 러닝 및 기타 AI 관련 워크로드의 성능 요구 사항을 위해 특별히 설계되었습니다.
실행 계획은 소프트웨어에서 이루어 지므로 동적 명령 실행 전용의 실리콘 공간을 확보 할 수 있습니다.
이 아키텍처가 제공하는 엄격한 제어 기능은 안전성과 정확성이 가장 중요한 응용 분야에 특히 유용한 결정 성있는 처리 기능을 제공합니다.
Groq의 칩은 CPU, GPU 및 FPGA를 기반으로하는 복잡한 기존 아키텍처와 비교하여 인증 및 배포를 간소화하여 고객이 확장 가능한 고성능 와트 당 시스템을 간단하고 신속하게 구현할 수 있도록합니다.
