CS/컴퓨터 구조 39

7장 : 고성능 컴퓨터시스템 구조 - (5) 성능 분석과 측정

(컴퓨터의 성능을 분석함을 의미)성능 분석 방법기존 시스템 분석시뮬레이션분석 모델링성능 측정 방법클럭 주파수MIPSMFLOPSSPEC(벤치마크 프로그램)실행시간1. 성능 분석 방법종류기존 시스템 분석시뮬레이션분석 모델링2. 기존 시스템 분석의미실제 컴퓨터 대상으로, 변수(버퍼 등)에 따라 성능 변화를 측정장점성능 측정이 가장 정확단점컴퓨터의 다른 요인들이 영향을 줄 수 있기 때문에 측정이 어려움3. 시뮬레이션의미시스템의 중요 기능 대상으로 시뮬레이션을 돌림장점높은 유연성컴퓨터 구매보다 저렴단점시뮬레이션 비용(시뮬레이션 개발 시간, 실행 시간 등)4. 분석 모델링의미수학적 기법으로 성능을 분석위의 2가지 방법에 대한 결과가 합리적인지 판단하는데 도움을 줌5. 성능 측정 척도의미시스템 성능에 대한 실제 값좋..

CS/컴퓨터 구조 2025.01.22

7장 : 고성능 컴퓨터시스템 구조 - (4) 그래픽처리유니트(GPU)

CUDA구성호스트디바이스GPU계층 구조SMSP(GPU → SM → SP)기억장치지역 기억장치공유 기억장치전역 기억장치CUDA계층 구조그리드블록스레드(GPU안에서 해당 그룹대로 나눔)GPU ↔ CUDASM ↔ 블록SP ↔ 스레드FermiSM 16개SP 32개(각 SM 마다)왑 스케줄러0. CUDA의미GPU를 동작시키기 위한 프레임 워크(병렬 동작 수행)구성 요소호스트CPU(순차적인 프로그램 처리)디바이스GPU 기능(병렬 처리 실행 → SIMD 방식 처리)1. GPU(=디바이스)의미그래픽 처리 보조 프로세서내부 구성스트리밍 다중프로세서(SM)스트리밍 프로세서(SP)GPU → 여러 SM → 여러 SPSM = 5개각 SM 안에 SP = 16개각 SP 간에 교류는 전역 기억장치를 사용함 2. CUDA 프로그래밍 ..

CS/컴퓨터 구조 2025.01.20

7장 : 고성능 컴퓨터시스템 구조 - (3) 다중프로세서시스템 구조

다중프로세서시스템공유-기억장치 시스템공유 버스다중 버스크로스바 스위치다단계 상호연결망분산-기억장치 시스템선형 배열 구조링/코달 구조트리 구조팻 트리 구조매시 네트워크토러스 네트워크하이퍼큐브 구조1. 다중프로세서시스템의미MIMD 조직 기반 시스템분류공유기억장치 시스템분산기억장치 시스템2. 공유기억장치 시스템의미주기억장치가 모든 프로세서들에 공유되는 밀결합 시스템장점프로세서 간의 데이터 교환 필요X단점프로세서들은 기억장치에 접근하기 위해 자신의 순서를 기다려야함프로세서 수가 증가해도 선형적인 성능 향상X단점 극복 대안공유버스다중버스크로스바 스위치다단계 상호연결망3. 공유 버스의미하나의 버스로 모든 장치(프로세서, 기억장치 등)가 이동장점하드웨어 심플단점버스 경합으로 인한 지연 시간 증가(성능 향상을 위해 프..

CS/컴퓨터 구조 2025.01.17

7장 : 고성능 컴퓨터시스템 구조 - (2) 병렬컴퓨터 분류

플린의 분류SISDMISDSIMDMIMD병렬 컴퓨터-기억장치 액세스 분류UMANUMANORMA병렬 컴퓨터 분류대칭적 다중 프로세서(SMP)대규모 병렬 프로세서(MPP)캐시-일관성 NUMA 시스템(CC-NUMA)분산 시스템(DS)클러스터 컴퓨터(CS)1. 플린의 분류의미병렬 처리 방법을 분리한 것단어스트림하나의 프로세서가 순서대로 처리하는 명령어, 데이터 흐름명령어 스트림순서대로 처리되는 명령어 집합데이터 스트림명령어 스트림 수행을 위해 순서대로 나열된 데이터 집합PU(프로세싱 유니트)해당 프로세스의 연산을 수행하기 위한 하드웨어 모듈 집합(프로세스 수행을 위한 모든 하드웨어 집합이 아닌, 연산만을 담당하는 곳들)예시 → (ALU, …)CU(제어 유니트)MM(기억장치 모듈)IS(명령어 스트림)DS(데이터 ..

CS/컴퓨터 구조 2025.01.15

7장 : 고성능 컴퓨터시스템 구조 - (1) 병렬처리 단위

병렬처리 단위작업-단위 병렬성테스크-단위 병렬성스레드-단위 병렬성명령어-단위 병렬성※ 프로그램, 프로세스 차이프로그램 : 디스크에 저장된 데이터, 명령어프로세스 : 프로그램이 실행중인 상태(메모리에 할당된 상태)1. 병렬처리의미다수의 프로세서가 프로그램의 각 작업을 분할해서 수행조건다수의 프로세서가 작업을 분할해서 수행 시, 동시에 시작해서 동시에 끝나야함(동시에 끝나지 않으면 병렬처리의 의미가 없기 때문인가?)고려사항문제 분할프로세서간 통신2. 병렬처리 단위단위작업-단위 병렬성아예 다른 프로그램을 병렬처리ex) 음악, 문서 작성을 동시에 처리태스크-단위 병렬성하나의 큰 작업을 여러 개의 프로그램으로 분할 후 병렬처리(큰 작업?)프로세서들간의 정보 교환이 필요해짐스레드-단위 병렬성하나의 프로그램을 여러 ..

CS/컴퓨터 구조 2025.01.13

6장 : 시스템 버스, I/O 및 인터럽트 - (5) 직접기억장치액세스

I/O 제어기I/O 장치 접속 방법프로그램을 이용한 I/O 장치 접속인터럽트를 이용한 I/O 장치 접속직접기억장치액세스를 이용한 I/O 장치 접속방법DMA 활용한 I/O 장치 접속 방식DMA 및 입출력 버스 활용 방식DMA 및 입출력 프로세서 활용 방식IOP1. 직접기억장치액세스(DMA)의미I/O 장치 ↔ 기억장치CPU 없이, I/O 장치의 신호를 기억장치를 통해 처리하겠다.사이클 스틸링CPU가 시스템 버스를 사용하지 않을 때, DMA제어기가 버스를 사용하는 것2. DMA 제어기의미I/O 장치 ↔ 기억장치로 데이터 전송하는 하드웨어 모듈구조실행 순서(주기억장치 내용을 디스크에 저장)CPU → DMA 제어기 정보 보내기(정보 : I/O장치 ↔ 기억장치 연결을 위한 정보(기억장치 주소 등))DMA 제어기 →..

CS/컴퓨터 구조 2025.01.10

6장 : 시스템 버스, I/O 및 인터럽트 - (4) 인터럽트-구동 I/O 접속 방식

I/O 제어기I/O 장치 접속 방법프로그램을 이용한 I/O 장치 접속인터럽트를 이용한 I/O 장치 접속직접기억장치액세스를 이용한 I/O 장치 접속인터럽트-구동 I/O 접속 방식방법다중 인터럽트 방식데이지 체인 방식소프트웨어 폴링 방식1. 인터럽트-구동 I/O 접속 방식의미I/O 동작이 진행되는 동안에 CPU는 다른 작업 처리과정CPU → I/O 제어기로 명령 전송 후, CPU는 다른 작업 수행I/O 제어기 → I/O 장치로 해당 명령 수행I/O 명령 완수 후, I/O제어기 → CPU 인터럽트 신호 전송CPU는 인터럽트 접수 후, CPU 작업 일시중지CPU → I/O 서비스 프로그램으로 가서 I/O 동작 처리CPU는 원래하던 작업으로 복귀2. 인터럽트-구동 I/O 접속 방식 구현 방법의미어떤 I/O 장치인..

CS/컴퓨터 구조 2025.01.08

6장 : 시스템 버스, I/O 및 인터럽트 - (3) I/O 장치 접속

I/O 제어기I/O 장치 접속 방법프로그램을 이용한 I/O 장치 접속인터럽트를 이용한 I/O 장치 접속직접기억장치액세스를 이용한 I/O 장치 접속※ I/O 장치는 시스템 버스에 직접 접속 불가(속도 문제)⇒ I/O 제어기로 버스 사용(1개의 I/O장치는 1개의 I/O 제어기 존재)1. I/O 제어기기능I/O 장치 제어 및 타이밍 조정CPU와 통신I/O 장치와 통신데이터 버퍼링 기능오류 검출2. CPU → 프린터로 데이터 출력과정CPU → 프린터 제어기프린터 상태 요청제어기 → CPU프린터 상태 전달CPU → 제어기CPU는 RDY 비트 부분으로 상태 점검. 보낼 수 있으면 제어기로 출력 신호 및 데이터 전송제어기 → 프린터프린터에게 제어 신호 및 데이터 보내서 프린터 동작 실행프린터 I/O 구성품데이터 레..

CS/컴퓨터 구조 2025.01.06

6장 : 시스템 버스, I/O 및 인터럽트 - (2) 버스 중재

버스 중재방식병렬 중재 방식직렬 중재 방식중앙집중식 중재 방식분산식 중재 방식폴링 중재 방식우선 순위고정 우선순위 방식가변 우선순위 방식회전 우선순위 방식동등 우선순위 방식임의 우선순위 방식최소-최근 사용 방식1. 버스 중재의미버스 마스터 여러개가 동시에 버스 이용 시도 시, 우선순위 정해줌용어버스 경합버스 마스터들끼리의 버스 경쟁 발생경합자원에 대한 동시 접근 상황버스 중재기버스 중재를 수행하는 하드웨어방식병렬 중재 방식각 버스 마스터들은 전용 버스 요청 선이 있음버스 마스터 개수 = 버스 요구 신호선 개수 = 버스 승인 신호 선 개수직렬 중재 방식버스 요구 신호 선이 1개버스 승인 신호 선 1개중앙집중식 중재 방식버스 중재기 1개만 존재장점버스 중재기의 고장 판별이 쉬움단점버스 중재기의 부담 증가(아..

CS/컴퓨터 구조 2025.01.03

6장 : 시스템 버스, I/O 및 인터럽트 - (1) 시스템 버스

버스 대역폭제어 버스일반 제어 버스기억장치 쓰기 신호기억장치 읽기 신호I/O 쓰기 신호I/O 읽기 신호전송 확인 신호중재 제어 버스버스 요구 신호(BREQ)버스 승인 신호(BGNT)버스 사용중 신호(BBUSY)인터럽트 버스인터럽트 요구 신호(INTR)인터럽트 확인 신호(INTA)버스 동작동기식 버스비동기식 버스1. 시스템 버스버스데이터를 전달하는 시스템버스 선데이터가 지나가는 길데이터 버스데이터를 전송하는 선들의 집합주소 버스기억 장치 주소를 전송하는 선들의 집합제어 버스기억장치, I/O에 대한 제어 신호 선들의 집합2. 버스 대역폭의미버스의 속도단위 시간당 전송 가능한 데이터 크기크기데이터 버스 폭 / 버스 클럭의 주기응용주소 버스의 폭에 따라 지정 가능한 기억장소 주소가 정해진다주소 버스 =16bit..

CS/컴퓨터 구조 2025.01.01