2024/061 GPU를 이용한 병렬화에서 고려해야 할 요소 GPU의 특성vectorized 연산을 하는 것이 아니라, 동일한 연산을 개별적으로 동시에 수행하는 구조다.SM(Streaming Multiprocessor)에는 계산을 담당하는 Core, 각 Core가 사용하는 Register, Core들 간에 공유할 수 있는 Shared Memory 및 L1 Cache가 있다.Global memory는 GPU device마다 하나씩 있으며, device 내의 SM들이 여기로부터 데이터를 받아간다.몇가지 최적화 아이디어들Tiling흔히 알고 있는 2D block tiling뿐만 아니라, 하나의 스레드가 더 많은 일을 하게 하는 2D Thread tiling도 고려할 수 있다.Occupancy: Thread 및 Thread BlockGrid Size를 충분히 크게 해주어.. 2024. 6. 21. 이전 1 다음