CS 스터디를 진행하면서 저장소를 관리하기 위해 커밋 메시지 Rule을 정했지만, Branch에 대한 Rule을 정하진 않았다.
Git의 Branch는 협업을 위한 기본 토대이기 때문에 최소한의 Rule이 있어야 협업 시의 혼란을 방지할 수 있다.
GitHub에서 GitHub에 올라간 Branch들에 대해 Rule을 지정할 수 있게 도와준다.
이 Rule을 적용하면 특정 Branch를 실수로 지우거나 Branch에 강제로 푸시할 수 있는 지에 대한 여부를 정의할 수 있다.
그리고 Merge하기 전에, 상태를 확인하거나 선형 커밋 기록과 같은 것들을 Branch에 푸시하는 것에 대한 요구 사항을 설정할 수 있다.
Branch Protection Rule이 적용되도록 Branch 이름을 적어둔다.
기본적으로 main(또는 master)를 적어둔다.
8가지 Rule 중에 가장 많이 쓰이는 Rule 이다.
모든 Commit들은 별도의 Branch를 만들어서 Merge 하기 전에 PR(pull request)을 보내야 하는 Rule이다.
즉, 로컬에서 Direct Push가 안되고, Push를 하려면 별도의 Branch를 만들어야 한다.
협업 시 Branch를 로컬로부터 Direct Push를 막아주고 코드리뷰를 통해 Merge 할 수 있다.
개인이 PR를 보내고 Merge를 하기 전에 승인해주는 인원을 정하는 의미다.
예) Required number of approbals before merging : 1
은 1명만 승인해주면 된다는 의미다.
그 밖에 다양한 설정들이 있다.
8가지 Rule 중에 두번째로 많이 쓰이는 Rule이다.
테스트에 통과하게 되면 Merge를 할 수 있다는 Rule이다.
코딩테스트 연습 > Summer/Winter Coding(~2018)
구현(시뮬레이션)
import java.util.*;
class Solution {
public int[] solution(int n, String[] words) {
int[] answer = {0,0};
// 사용 단어 저장
HashSet<String> set=new HashSet<>();
// 첫 번째 단어의 마지막 문자 저장
char prev=words[0].charAt(words[0].length()-1);
// 첫 번째 단어 저장
set.add(words[0]);
// 2번째 단어부터 탐색
for(int i = 1 ; i < words.length; i++){
// 앞 단어의 마지막 문자로 시작하지 않거나 이미 말한 단어라면 종료
if(prev != words[i].charAt(0) || set.contains(words[i])){
// 탈락자 번호
answer[0]= i % n + 1;
// 몇 번째 차례에서 탈락했는지에 대한 갯수
answer[1]= i / n + 1;
break;
}
// 아니라면, 다음 체크를 위해 prev, set 설정
prev = words[i].charAt(words[i].length()-1);
set.add(words[i]);
}
return answer;
}
}
단어의 중복 체크는 HashSet을 이용한다.
set
에 넣어 저장한다.앞 단어와 끝말잇기 조건에 맞는지 확인한다.
char prev를 두어 앞 단어의 마지막 문자를 저장한다.
일단 0번째 시작 단어는 앞문자가 없으므로 바로 prev와 set에 넣는다.
1번째부터 앞 문자와 체크한다. 앞 단어의 끝 문자 prev와 나(i)의 시작 단어가 다르거나 set에 있는 단어라면 answer에 값 넣고 종료한다.
이 글의 사진과 내용은 공룡책 과 컴퓨터학부 수업인 운영체제 강의자료를 기반으로 작성했습니다.
[1] 모든 Page가 Physical memory에 매핑된다.
[2] Physical memory의 크기는 제한적이다.
Key idea
: 현재 사용하지 않는 page들을 Disk에 저장하는 것이다.
Swap Space
이란 Physical memory에서 매핑되지 않는 page들을 위한 Disk 공간이다.
Swap Space에서는 두 가지 작업이 제공된다.
Swap out
이란 pages을 Physical memory에서 Swap space로 이동하는 것이다.
Swqp in
이란 pages을 Swap space에서 Physical memory로 이동하는 것이다.
이 글의 사진과 내용은 공룡책 과 컴퓨터학부 수업인 운영체제 강의자료를 기반으로 작성했습니다.
TLB가 관리할 수 있는 page보다 더 많은 page를 요구하는 프로세스를 처리하는 경우
Page table에 사용되는 메모리 공간을 줄이는 방법에 대해서 알아보자.
Linear (Page) Tables
(선형 페이지 테이블) : 일반적으로 시스템에서 모든 process에 대해 하나의 page table을 가진다.
예) 4KB(2^12) 크기의 Page
와 4-byte 크기의 Page table entry
를 가지는 32-bit 크기의 가상 주소(address space)
가 있다.
여기서 Page table size
를 구하는 방법은 (가상 주소 공간의 크기 / page의 크기 ) x page table entry의 크기로 구하면 된다.
가상 주소 공간
의 크기 : 32-bit = 2^32
Page
의 크기 : 4KB = 2^12
Page table entry
의 크기 : 4B = 4byte = 2^2
계산) Page table size = (2^32 / 2^12) x 2^2 = 2^20 x 2^2 = 1MByte x 4Byte = 4MByte (Process 한개당)
하나의 Process를 위해 총 4MByte의 page table이 필요하다는 의미이다.
결론적으로 Page table 이 너무 커서 너무 많은 메모리를 사용하고 있다.
Page table이 너무 클 경우를 대비해서 Page table의 크기를 줄여 메모리를 절약하는 방법에 대해 알아보자.
Page table의 크기를 줄이는 방법 중 하나는 Page의 크기를 늘려서 Page table size를 줄이는 것이다.
예) 16KB 크기의 page 와 4byte 크기를 갖는 page table entry를 가지는 32-bit의 가상 주소(adress space)이 있다.
(이전에는 page 크기는 4KB이고, 현재의 page 크기는 16KB 이다)
위의 예시를 통해 Page table size
= 1MByte로 이전 예시보다 Page table 크기가 작아져서 메모리를 절약할 수 있다는 점을 확인할 수 있다.
하지만, Page 자체가 활용도가 낮아서(under-utilized)(= page 자체 크기가 커서) 내부 단편화가 발생하는 문제점이 있다. (낭비하는 공간이 크다는 점)
내부 단편화
란 메모리를 할당할 때 프로세스가 필요한 양보다 더 큰 메모리가 할당되어서 프로세스에서 사용하고 남은 공간을 의미한다. (예) 메모리가 10KB가 할당되었고 프로세스가 필요한 양은 7KB일 때, 남는 공간인 3KB가 낭비된다)더 큰 Page size는 더 적은 page 수를 의미하며 이는 메모리가 빨리 소모된다는 것을 의미한다.
결론적으로 Page의 크기를 늘리는 방법은 완전한 해결책은 아니다.
이런 상황에서 Page table의 크기를 줄이는 방법 중 다른 하나는 Paging 기법과 Segmentation 같이 사용하는 것이다.
Page table의 메모리 오버헤드를 줄이기 위해서는
base
레지스터는 실제주소의 page table를 가리키는데 사용한다.
bound
레지스터는 해당 page table의 끝을 나타내는데 사용한다.
Paging과 Segments
을 같이 사용하는 방법에 대해 알아보자.예) 각각의 Process는 연관된 3개의 Page table을 가진다고 가정한다.
Page의 크기는 4KB
, 가상 주소 공간의 크기는 32-bit
, 4개의 Segment 중 3개
만 사용한다고 가정한다.
Process가 실행 중일 때 이러한 각 Segment의 base 레지스터
는 해당 Segment에 대한 linear page table의 실제 주소(physical address)가 포함된다.
이 글의 사진과 내용은 공룡책 과 컴퓨터학부 수업인 운영체제 강의자료를 기반으로 작성했습니다.
Paging 기법을 사용하여 메모리 가상화를 지원한다면 오버 헤드가 발생한다.
[1] Page Table에 한번 접근하고, [2] Page Table을 기반으로 실제 메모리에 접근하기 때문에 메모리 낭비가 발생하는 문제점이 있다.
즉, Paging 기법은 메모리 낭비가 발생하고, 느리기 때문에 이를 좀 더 빠르게 만들기 위해 TLB
가 나오게 되었다.
TLB
는 Memory-Management Unit(MMU)의 일부분이자, 주소 변환의 하드웨어 캐시이다.TLB에는 자주 사용하는 VPN(virtual page number)와 PFN(physical frame number) 정보가 쌍으로 존재하며 이를 사용해 가상 주소를 실제 주소로 변환하도록 도와주는 Hardware cache이다.
이를 사용해 CPU가 Paging 기법으로 주소 변환을 할 때 Page Table이 아닌 TLB에 접근하는데, CPU가 원하는 VPN과 PFN의 정보가 TLB에 있다면, 해당 정보로 빠르게 주소변환을 할 수 있다.
즉, 해당 정보를 Page Table 없이 TLB로 가져오기 때문에 주소 변환이 빠르게 수행하는 장점이 있다.
하지만, 해당 정보가 TLB에 없다면 어쩔 수 없이 Page Table에서 가져오는 단점이 있다.
위의 그림은 TLB를 사용한 Paging Hardware 예시이다.
TLB hit
(= TLB가 있으면) Page Table 거쳐갈 필요 없이 가상 주소를 실제 주소로 변환한다.
TLB miss
(= TLB가 없으면) Memory에 있는 Page Table에서 가상 주소에 해당하는 정보를 가져와서 실제 주소로 변환한다.
TLB는 Full Associative method에 의해 관리된다.
일반적인 TLB는 32, 64 또는 128개의 항목을 가질 수 있다.
하드웨어는 전체 TLB를 병렬로 검색하여 원하는 변환을 찾습니다
Other bits : valid bits , protection bits, address-space identifier, dirty bit
정리하자면, 자주 사용하는 TLB에는 VPN(virtual page number)과 PFN(Page Frame Number) 정보가 쌍으로 존재하며, 이를 사용해 주소 변환을 하도록 도와주는 Hardware Cache이다.
Cache는 임시로 쓰이는 버퍼(buffer) 메모리이다.
빈번하게 사용하는 데이터들을 하위 메모리보다 빠른 공간에 임시로 넣어두고, 필요할 때마다 바로 쓸 수 있도록 하기 위해 생겨난 기술이자, 구조이자 장치라고 할 수 있다.
메모리가 다른 I/O 장치보다는 빠르지만, Process의 속도보다는 많이 느리다. 그래서 전체적인 시스템 성능을 높이기 위해서 메모리에서 데이터를 읽어오는 속도를 빠르게 하기 위해 Cache
(캐시)가 등장한 것이다.
예로 들자면, 팬시
가 “Operating Systems Three Easy Pieces” 이라는 운영체제 책을 빌리려고 학교 도서관(Main Memory)에 갔다.
하지만, 운영체제 책뿐만 아니라 다른 책들도 빌릴 때마다 도서관을 이용하게 되는데, 문제는 도서관까지 가고, 원하는 책을 찾는데 시간이 너무 오래 걸린다는 점이다.
이러한 점을 해결하기 위해 IT 학부에서는 컴퓨터학부생들의 시간 효율성을 위해 IT 융복합관(5호관) 지하 1층에 서재(Cache)를 만들었다.
서재(Cache)를 만든 이후부터 팬시
는 컴퓨터학부와 관련된 책을 IT 융복합관 지하에 있는 서재(Cache)에 가서 빌림으로써 도서관(Main Memory)에서 빌리는 시간보다 더 효율적이고 빠르게 해결했다.
가정) Page의 크기는 16-byte이며 가상 주소 공간의 크기를 8-bit(2^8=196byte)라고 가정한다.
가상 주소 공간에 존재하는 Page 수는 16개(가상 주소 공간의 크기 / Page의 크기)가 된다.
int 자료형이 4byte이므로 for문에 적용하면 총 배열의 크기는 40byte이다. (배열이 가상 주소 공간 100에서 시작하면 Page Table이 왼쪽 그림과 같이 그려진다)
for문을 돌리고, [1] a[0]이 요청이 오면 VPN = 6(a[0] ~ a[2])이 전부 올라간다.
a[3]이 요청이 오면 VPN = 6에 없으므로 miss
가 되고, VPN = 7(a[3] ~ a[6])에 올라간다.
결론적으로 3개의 miss와 7개의 hit이 생겼고, 그러므로 TLB hit rate = 70% 이라는 결론이 나왔다.
3개의 miss
는 a[0], a[3], a[7]이며, 7개의 hit
은 a[1], a[2], a[4], a[5], a[6], a[8], a[9]이다.
a 배열에 요청이 올 때 해당하는 값이 VPN에 없으면 miss가 발생하고, 한 번 접근한 뒤에 다시 a 배열에 요청이 오면 이미 TLB에 변환 정보가 존재하기 때문에 hit으로 처리된다.
여기서는 page의 크기가 16byte이므로 hit rate가 70%라는 값이 나왔지만, 배열의 요소 개수가 이 보다 더 많이 증가한다면, 100%에 가깝게 될 것이다.
TLB에서 주소변환이 성공한 것을 TLB Hit
이라고 한다.
TLB가 없는 상황에서는 총 10번의 반복이 발생하고, 반복할 때 마다 page table에 접근하여 주소 변환을 해줘야 한다.
하지만, 위의 그림처럼 TLB가 있는 상황에서는 a 배열에 대한 10번의 접근 중 3번의 TLB miss만 발생했기 때문에, 3번만 page table에 접근하여 주소 변환을 해주면 된다.
TLB는 Spatial Locality
(공간 지역성)로 인해, 성능을 향상시킨다.
Temporal Locality
(시간 지역성)란 최근에 접근한 데이터에 접근할 가능성이 높다는 의미이다. 주로 반복문에서 확인할 수 있다.
하드웨어에서는 cache(캐시)라는 작고 빠른 메모리에 정보를 저장하여 지역성을 활용하다.
캐시의 크기가 작기 때문에 빠르게 메모리에 정보를 저장하는 것이지, 만약에 캐시의 크기가 커진다면 빠르게 될 수 없다.
Spatial Locality
(공간 지역성)란 어떤 요소에 접근한 상황이라면 그 주변의 요소들에 접근할 가능성이 높다는 의미이다.
배열과 같은 데이터에 접근할 때 순차적으로 접근(연속적인 접근)하게 되므로 apple 이라는 요소에 접근한 상황이라면 다음에 접근할 때에는 apple 주변의 요소들에 접근할 가능성이 높다는 것이다.
실제 메모리에 접근하는 시간(EAT)를 구하는 방법에 대해 알아보자.
다음 예시를 가정해보자.
TLB hit ratio $\alpha$ = 80%
TLB search : 20 ns (TLB에서 해당 정보를 찾는 시간)
Memory access : 100 ns (메모리에 한번 접근하여 데이터를 가져오는 시간)
EAT
= 0.80 x (20 + 100) + 0.20 x (20 + 100 + 100) = 140 ns
(20 + 100)
: TLB Hit이 된 경우 TLB에 가서 메모리가 접근한 시간을 의미한다.(TLB가 있는 경우)
(20 + 100 + 100)
: TLB search + Page table에 접근한 시간 + Memory access 합한 값을 의미한다. (TLB가 없는 경우)
ns 로 표기하는 것이 중요하고 잊지 말자.
Process A
의 VPN 10에 대한 주소 변환 정보가 TLB에 저장되어 있다.
참고로 Process마다 각자의 Virtual Memory를 가지고 있다.
이때 Context Switching이 발생하여 Process B
로 넘어가게 되는데, Process B 역시 VPN 10에 대한 주소 변환 정보가 TLB에 저장되어 있다.
이런 경우 Process A, B 둘다 VPN은 10으로 동일하지만 PFN은 서로 다른 것을 확인할 수 있다.
하지만 위와 같이 TLB에 정보를 저장하게 되면 어떤 정보가 어떤 Process의 정보인지 알 수가 없다.
Process에서 서로의 주소 공간이 아닌 곳에 접근을 하게 될 경우 문제가 발생하므로 이를 해결할 방법이 필요하다.
ASID
(address space identifier)라는 정보를 추가하여 문제를 해결하는 것이다.어떤 프로세스의 정보인지 구별하기 위해 TLB에서 ASID
를 제공한다.
이를 통해 프로세스마다 다른 ASID 정보를 저장하여 주소 변환을 성공적으로 수행할 수 있도록 한다.
위의 예시를 가정해보면 Process 1은 Process 2와 같은 PFN 값이 101로 동일하다.
두 개의 Process가 PFN 값이 같으므로 Page를 공유할 수 있다.
그러면 메모리의 사용을 줄일 수 있으므로 메모리의 공간을 이전보다 더 확보할 수 있게 된다.
하지만, 어떤 프로세스인지 구별을 확인하기 위해 ASID
값도 같이 저장한다.
TLB에 저장 가능한 공간이 꽉 찼을 경우 새로운 프로세스가 실행된다면, 어떤 프로세스를 빼고 새로운 것을 넣어야 하는지에 대해 알아보자.
우선, 목표는 TLB miss rate를 최소화 하는 것이다. (TLB hit rate를 향상시키는 것과 같은 말이다)
전형적으로 2가지 간단한 접근 방법이 있다. (LRU, Random policy)
LRU
(Least-recently-used) : 최근에 사용하지 않는(예전에 사용하고 지금은 사용하지 않는) Process를 내보내는 방법이다.
Temporal Locality
의 장점을 이용한다.Random policy
: 이름 그대로 랜덤하게 제거하는 방법이다.
Reference Row : 주어진 새로운 숫자(프로세스)가 순차적으로 실행한다는 것을 의미한다.
4번째에 숫자 ‘2’라는 새로운 프로세스가 발생했을 때, 가장 오래 사용하지 않았던 숫자 ‘7’를 빼고 ‘2’를 넣는 것을 확인할 수 있다.
이처럼 최근에 가장 사용하지 않았던 프로세스를 내보내고, 그 자리에 새로운 프로세스가 들어온다.
18번 중에 11번의 miss가 발생했기 때문에, 결론적으로 TLB miss ratio
= 11/18 = 0.61 = 61% 값을 확인할 수 있다.
TLB가 나오게 된 배경은 무엇이고, TLB 개념에 대해 설명해주세요.
TLB가 메모리 성능을 어떻게 향상시키는지 TLB hit rate
와 Spatial Locality
개념과 연관지어 설명해주세요.
TLB를 사용할 때 Context Switching
이 발생한다면 어떻게 해결하는 지 설명해주세요. (2가지 해결방안)
TLB에 저장 가능한 공간이 꽉 찼을 경우 새로운 프로세스가 실행된다면, 어떤 프로세스를 빼고 새로운 것을 넣어야 하는지 과정에 대해 설명해주세요. (TLB Replacement policy)