반응형
Notice
Recent Posts
Recent Comments
Link
250x250
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- vpi
- boot process
- gstsample
- nvarguscamerasrc
- yocto
- meta-tegra
- Jetson
- RDEPENDS
- mkfs.ext4
- server error
- /dev/kmsg
- libargus api
- vpiimage
- camera
- 티스토리챌린지
- ssd 포맷
- bash
- bitbake
- libargus
- nvidia
- 봉화 숲속캠핑장
- 오블완
- LAYERS
- orin nx
- udpsink
- gcc7
- linux
- l4t
- cpu frequency
- lineedit
Archives
- Today
- Total
DREAMER
[Memory] pitch linear memory, block linear memory 본문
728x90
반응형
메모리 레이아웃을 최적화하는 것은 성능에 매우 중요하다.
특히 대량의 데이터가 처리되는 애플리케이션에서는 데이터들이 올바르게 정렬되어 있다면, GPU의 메모리 접근 및 control 시간을 최소화 하므로 프로그램이 더 빠르고 효율적으로 동작 할 수 있다.
Pich linear memory allocation
: 각 행이 컴퓨터 워드 크기의 배수인 메모리 주소에서 시작하도록 보장하여 메모리 접근 성능을 향상시킬 수 있다.
Pitch는 컴퓨터 그래픽스와 이미지 처리에서, 비트맵이나 이미지에서 한 행의 픽셀이 차지하는 바이트 수를 의미하는데, 실제 픽셀 데이터와 패딩을 포함한다. 패딩은 메모리에서 데이터를 올바르게 정렬하기 위해 추가된다.
Block Linear memory allocation
: 읽기 및 쓰기를 목적으로, 2D access 패턴의 일관성을 최적화 하는 것이다.
그러기 위해서는 데이터를 블록이나 청크로 구성하며, 다차원 배열의 요소에 접근할 때 캐시 일관성을 향상시키고, 캐시 미스를 줄이기 위해 주로 사용된다.
인접한 요소를 동일한 블록에 저장함으로써 프로세서 캐시는 전체 블록을 메모리에 로드할 수 있어, 동일한 블록 내에서의 후속 액세스의 효율성을 향상시킨다.
728x90
반응형
'프로그래밍 > NVIDIA' 카테고리의 다른 글
Module 별 Information (0) | 2024.02.01 |
---|---|
[JPEG] encodeFromFd, NvBuffer Sharing (0) | 2023.10.26 |
[camera] libargus api (0) | 2023.07.10 |
[Libargus Camera API] 설치 (0) | 2023.06.29 |
[Camera] Camera Software Architecture (0) | 2023.06.22 |
Comments