티스토리 뷰

크게 CPU, ASIC, FPGA로 구분될 수 있으며,
ASIC 하위 분류로 GPU, NPU, TPU, VPU 등으로 분류될 수 있음.

[목차] 

  • CPU(Central Processing Unit, 중앙처리장치)
  • GPU(Graphics Processing Unit, 그래픽처리장치)
  • NPU(Neural Processing Unit)
  • ASIC(Application-specific Integrated Circuit)
  • FPGA(Field-programmable Gate Array)
  • TPU(Tensor Processing Unit)
  • VPU(Vision Processing Unit)

 

[CPU]

  • 범용 프로세서로서 다양한 연산 작업을 처리할 수 있음.
  • 비교적 적은 수의 코어로 구성돼 있으며, 직렬 처리에 강점이 있음.
  • 소규모 AI 작업 또는 CPU에 최적화된 라이브러리를 이용한 연산에 활용 가능
  • 주로 머신러닝 작업, 데이터 전처리, 모델 추론 등의 보조적인 작업에 사용됨.

 

[GPU]

  • 다수의 코어를 활용하여 대규모 병렬 연산을 처리할 수 있음.
  • 딥러닝 훈련 및 추론에서 행렬 곱셈과 같은 연산을 가속화하는데 효과적임.
  • CUDA, TensorRT 등의 소프트웨어 프레임워크와 연동하여 딥러닝 작업을 최적화할 수 있음.
  • 주로 딥러닝 모델의 훈련 및 추론, 대규모 데이터 분석 등에 사용됨.

 

[NPU]

  • AI 및 딥러닝 연산에 특화된 프로세서
  • 대규모 행렬 연산과 신경망 연산에 최적화됨.
  • 병렬 처리 및 데이터 흐름 최적화를 통해 높은 에너지 효율과 연산 속도를 제공함.
  • 온칩 메모리와 데이터 재사용 기술을 활용하여 메모리 접근을 최소화함으로써 효율 극대화
  • 주로 자율주행 차량, IoT 디바이스, 데이터 센터 등에서 AI 모델의 실시간 훈련 및 추론 가속에 사용됨.

 

[ASIC]

  • 특정한 목적에 최적화된 전용 하드웨러로 설계된 프로세서의 통칭
  • 높은 성능과 에너지 효율을 제공하지만, 유연성이 떨어지고 특정 작업 외엔 활용하기 어려움
  • Google의 TPU와 같이 딥러닝 작업에 최적화된 프로세서가 대표적임.

 

[FPGA]

  • 사용자가 프로그래밍할 수 있도록 설계된 프로세서
  • AI 연산을 포함한 다양한 연산 작업에 활용 가능
  • ASIC에 비해 유연성이 높으며, 특정 AI 작업에 맞춰 프로그래밍함으로써 성능 향상 가능
  • 에너지 효율성과 성능은 높지만, 개발과 최적화에 시간이 많이 소요됨.
  • 주로 저지연 응용 프로그램, 엣지 컴퓨팅, 맞춤형 AI 솔루션에 사용됨.

 

[TPU]

  • 구글이 딥러닝 작업에 최적화하여 설계한 ASIC 기반 프로세서
  • 대규모 병렬 연산을 가속화하며, TensorFlow 프레임워크와 긴밀하게 통합됨.
  • 고성능 및 고에너지효율을 제공하며 대규모 AI 훈련 및 추론 작업에 사용됨.

 

[VPU]

  • 이미지 및 비디오 처리에 특화된 프로세서
  • 컴퓨터 비전 작업을 가속화함.
  • 낮은 전력 소비로 실시간 비전 작업에 적합하며, 딥러닝 기반의 이미지 인식, 객체 검출 등에 사용됨.
  • 주로 자율주행 차량, 드론, 스마트 카메라 등에서 컴퓨터 비전 작업을 지원함.

https://www.youtube.com/watch?reload=9&app=desktop&v=6ZDoFomU10A

 

반응형