이 글은 내 코드가 그렇게 이상한가요? 책을 읽고 정리한 내용을 바탕으로 작성하였습니다.
소프트웨어 설계에서
결합도
는 모듈 사이의 의존도를 나타내는 지표이고,책무
는 어떤 관심사를 정상적으로 작동하게 제어하는 책임이다.
단일 책임 원칙
을 기반으로 설계해야 한다.
단일 책임 원칙
은 ‘클래스가 담당하는 책임은 하나로 제한해야 한다’는 설계 원칙이다.
책임을 대신 지는 클래스가 만들어지면, 다른 클래스가 제대로 성장할 수 없다. (= 성숙해지지 않는다)
따라서 관심사에 따라 분리해서 독립되어 있는 구조, 즉 느슨한 결합
으로 설계해야한다.
DRY 원칙(= Don’t Repeat Yourself) : ‘빈복을 피해라’
DRY는 각각의 개념 단위내에서 반복을 하지 말라는 의미이다.
같은 로직, 비슷한 로직이라도 개념이 다르면 중복을 허용해야 한다.
무리하게 중복을 제거하려 하면, 강한 결합 상태가 된다.
상속을 하면, 강한 결합 구조를 유발하게 된다. (이 책에서는 상속 자체를 권장하지 않는다)
상속 관계에서 서브 클래스는 슈퍼 클래스에 크게 의존하게 된다. -> 서브 클래스가 슈퍼 클래스의 구조를 하나하나 신경 써야 한다.
강한 결합을 피하려면, 상속보다 컴포지션
을 사용하는 것이 좋다.
컴포지션
이란 사용하고 싶은 클래스를 pri-vate 인스턴스 변수로 갖고 사용하는 것을 의미한다.
상속은 전략 패턴 등으로 조건 분기를 줄일 때 활용할 수 있다.
만약 상속을 사용한다면, 반드시 단일 책임 원칙
을 염두에 두고 구현해야 하며, 값 객체와 컴포지션 등 다른 설계를 사용할 수는 없는지 검토한다.
관련된 것끼리 클래스로 분리한다.
특별한 이유 없이 public
을 사용하지 않는다. -> public
을 붙이면, 강한 결합 구조가 되어버린다. -> 유지보수가 어려워진다.
package private
(default)로 만들고, 패키지 외부에 공개할 필요가 있는 클래스에 한해서만 public
으로 선언한다.한 클래스 내에서 private 메서드가 많으면, 책임이 너무 많은 건 아닌지 확인해본다. -> 책임이 다른 메서드는 다른 클래스로 분리한다.
스마트 UI
는 화면 표시를 담당하는 클래스 중에서 화면 표시와 직접적인 관련이 없는 책무가 구현되어 있는 클래스를 말한다.
트랜잭션 스크립트 패턴
은 메서드 내부에 일련의 처리가 하나하나 길게 작성되어 있는 구조이다.
갓 클래스
는 하나의 클래스 내부에 수천에서 수만 줄의 로직을 담고 있으며, 수많은 책임을 담당하는 로직이 난잡하게 섞여있는 클래스이다.
강한 결합 클래스 대처 방법 -> 객체 지향 설계와 단일 책임 원칙에 따라 제대로 설계한다.
200줄
, 일반적으로 100줄
정도이다.데드코드
는 절대로 실행되지 않는 조건 내부에 있는 코드를 말한다. -> 발견하는 즉시 제거한다.
YAGNI
: ‘You Aren’t Gonna Need it.’ -> 지금 필요 없는 기능을 만들지 말라 -> 지금 당장 필요한 것들만 만들라는 방침이다.
매직 넘버
는 로직 내부에 직접 작성되어 있어서, 의미를 알기 힘든 숫자를 말한다. -> 구현자 본인만 의도를 이해할 수 있다.
영향 범위가 가능한 한 되도록 좁게 설계해야 한다. -> 호출할 수 있는 위치가 적고 국소적일수록 로직을 이해하고 구현하기 쉽다.
null을 리턴/전달하지 않는다. -> null 대신 static final 인스턴스 변수 EMPTY로 만든다.
예외를 확인했다면, 바로 기록하는 것이 좋다.
비즈니스 클래스는 비즈니스 개념을 기준으로 폴더를 구분하는 것이 좋다. -> 도메인 별로 구분되어 응집도가 높아진다.
이 책에서 설명하는 방법들은 사양 변경이 있을 때, 이를 조금이라도 쉽게 하기 위한 설계를 설명한다.
결합이 느슨하고 응집도가 높은 구조로 만들기 위해서는 관심사 분리로, 관심사에 따라서 각각 클래스로 분할해야 한다.
관심사 분리
는 ‘관심사(유스케이스, 목적, 역할)에 따라서 분리한다’라는 소프트웨어 공학의 개념이다.이름 설계하기
최대한 구체적이고, 의미 범위가 좁고, 특화된 이름을 선택하기 -> 어떤 비즈니스를 하는지 모두 파악해야 한다.
존재가 아니라 목적을 기반으로 생각하기 예시) 상품
이라면 -> 입고 상품, 예약 상품, 주문 상품, 발송 상품
어떤 관심사가 있는지 분석하기
소리 내어 이야기해 보기 -> 비즈니스 측면을 잘 이해하고 있는 사람과 이야기 해본다. -> 잘못 인식하는 부분이 있으면 바로 피드백을 받을 수 있다.
이용 약관 읽어보기 -> 비즈니스 규칙과 클래스를 일치하게 만든다.
다른 이름으로 대체할 수 없는지 검토하기 -> ‘고객’이 아니라 ‘투숙객’, ‘결제자’처럼 대체할 수 없도록 이름을 변경한다.
결합이 느슨하고 응집도가 높은 구조인지 검토하기
이름
을 기반으로 메서드와 클래스를 설계해야 한다. -> 프로그램 구조를 크게 좌우한다.
수식어를 붙이면서까지 차이를 나타내고 싶은 대상은 각각 클래스로 설계하는 것이 좋다. -> 의미가 다른 개념을 서로 다른 클래스로 설계해서 구조화하면, 개념 사이의 관계를 이해하기 쉽다.
OriginalMaxHitPoint : ‘캐릭터의 원래 최대 히트 포인트’를 나타내는 클래스
CorrectedMaxHitPoint : ‘장비 착용으로 높아진 최대 히트 포인트’를 나타내는 클래스
DTO(Data Transfer Object) : 예외적으로 데이터 클래스를 사용하는 경우
메서드의 이름은 동사 하나로 구성되게 한다.
실제 내용과 내용이 다른 주석은 제거한다.
주석 규칙
로직을 변경할 때는 반드시 주석도 함께 변경해야 한다. -> 주석을 제대로 변경하지 않으면, 실제 로직과 달라져 주석을 읽는 사람에게 혼란을 준다.
로직의 내용을 단순하게 설명하기만 하는 주석은 달지 않는다. -> 시간이 지남에 따라 내용이 낡은 주석이 될 가능성이 높다.
로직의 의도와 사양을 변경할 때 주의할 점을 주석으로 달아야 한다. -> 유지 보수와 사양 변경에 도움이 된다.
문서 주석
이란 특정 형식에 맞춰 주석을 작성하면, API 문서를 생성해 주거나 코드 에디터에서 주석의 내용을 팝업으로 표시해 주는 기능입니다.
Javadoc
을 참고하자.getter/setter는 값을 마음대로 변경할 수 있으므로 잘못된 값이 섞일 수도 있고, 코드가 중복되는 등 응집도를 낮출 수 있다.
매개변수에 final 수식자를 붙여서, 불변으로 만든다.
출력 매개변수는 사용하지 않는 것이 좋다. -> 가독성 저하
매개변수는 최대한 적게 설계한다. -> 메서드가 처리할 게 많아지면, 그만큼 로직이 복잡해진다.
오류는 특정 값으로 리턴하지 말고, 곧바로 예외를 발생시키는 것이 좋다. -> throw new IllegalArgumentException()
굿프렌즈 프로젝트 구조는 위 그림과 같다.
클라이언트와 WAS 사이에 리버스 프록시 서버
를 둔다.
클라이언트는 웹 서비스처럼 리버스 프록시 서버에 요청을 하고, WAS는 리버스 프록시로부터 사용자의 요청을 대신 받는다.
WAS는 리버스 프록시로부터 사용자의 요청을 대신 받는다.
클라이언트는 리버스 프록시 서버 뒷단의 WAS의 존재를 알지 못한다.
이로인해 보안이 한층 강화되었다.
그리고 프론트엔드는 정적 소스 배포를 위해 Nginx를 사용했다.
이전 굿프렌즈 서버는 HTTP
요청으로 이뤄져있었다.
하지만, HTTP
는 누군가 네트워크에서 신호를 가로채면 내용이 노출될 수 있는 문제를 발생하므로, 이를 해결하기 위해 HTTPS
를 적용해야 한다.
(HTTPS를 왜 사용하는지에 대한 글은 이전에 작성했던 왜 HTTPS를 사용하나요?)을 참고하면 좋을 것 같다)
이때, 리버스 프록시 서버에 SSL 인증서를 발급해두어 HTTPS
를 적용한다.
WAS 서버가 여러대로 늘어나도 SSL 인증서 발급을 추가하지 않아도 확장성이 있다.
또한 WAS 서버가 SSL 요청을 처리하는데 드는 비용도 들지 않는다.
리버스 프록시 서버는 Nginx
를 사용한다. (Nginx를 왜 사용하는지에 대한 글은 이전에 작성했던 NGINX란?를 참고하면 좋을 것 같다)
굿프렌즈 프로젝트는 백엔드 기술 스택으로 Spring Boot를 사용했기 때문에, WAS를 Spring Boot를 이용했지만, 프로젝트에 따라서 node.js, fast api, django를 사용해도 상관없다.
CA
로는 무료로 SSL 인증서 발급 기관인 Let's Encrypt
을 사용했다.
또한 간단한 SSL 인증서 발급 및 Nginx 환경 설정을 위해 Cerbot
을 사용했다.
Let's Encrypt
에서 Cerbot
을 함께 사용하는 것을 권장하는 문장을 아래 이미지를 통해 확인할 수 있다.
이 글에서는 총 3개의 서버가 사용된다. AWS의 EC2 또는 타사 VPS를 사용해도 된다.
서버 하나는 WAS가 돌아갈 서버이고(백엔드), 다른 하나는 WS가 돌아갈 서버이고(프론트), 나머지 하나는 리버스 프록시로 사용될 Nginx 이다.
또한 SSL을 적용하기 위해 도메인을 2개 준비해야 한다.
(굿프렌즈 프로젝트의 경우 가비아를 통해 도메인 2개를 구매했다)
아래 AWS EC2와 도메인 연결 부분에서는 가비아를 기반으로 정리했습니다.
AWS EC2에 있는 서버를 가비아에서 구매한 도메인 주소와 연결하기 위해서는 Amazone Route 53
을 이용해야 한다.
Amazon Route 53는 가용성과 확장성이 뛰어난 도메인 이름 시스템(DNS) 웹 서비스입니다. Route 53는 사용자 요청을 AWS 또는 온프레미스에서 실행되는 인터넷 애플리케이션에 연결합니다.
Amazone Route 53에 대한 주요 기능에 대해 자세히 살펴보고 싶다면, Amazon Route 53 기능을 참고하자.
Route 53 검색 후 호스팅 영역을 생성한다.
굿프렌즈의 경우, 프론트엔드 도메인 이름은
goodfriends.life
, 백엔드 도메인 이름은goodfriends.pro
이다.
호스팅 영역에서 도메인 이름
과 설명
을 아래와 같이 작성한 후 유형 부분에 퍼블릭 호스팅 영역
을 클릭한 뒤 생성 버튼을 클릭한다.
호스팅 영역에서 생성한 도메인에서 레코드 생성
버튼을 클릭한다.
레코드 생성안에 값
이라는 부분에 EC2 서버의 퍼블릭 IPv4 주소
를 기입하고 생성 버튼을 클릭하면 된다. 그러면 레코드가 생성된 것을 확인할 수 있다.
레코드를 생성 완료했다면, NS
(네임서버)에서 가비아와 연결할 값/트래픽 라우팅 대상
을 확인한다.
그런 다음, 해당 값/트래픽 라우팅 대상
에 있는 값을 가비아 홈페이지에서 My가비아
-> 구매한 도메인의 관리 탭 클릭 -> 네임서버
설정에 동일하게 넣어준다.
아래 Nginx 설치부분은 Spring Boot 기반으로 작성한 내용입니다.
Nginx 서버에 아래의 명령어를 입력하여 운영체제 내 패키지 정보를 업데이트를 하고나서 nginx
패키지를 설치한다.
sudo apt-get update
sudo apt-get install nginx
그런 다음, Nginx 버전을 확인한다.
nginx -v # nginx version: nginx/1.18.0 (Ubuntu)
현재 리눅스에서 실행 중인 프로세스 목록을 확인하기 위해 아래의 명령어를 입력한다. (nginx만 조회)
ps -ef | grep nginx
이제 리버스 프록시를 위한 Nginx 설정을 할 것이다.
이 글은 sites-available/sites-enabled 기반으로 Nginx를 설정했다.
cd /etc/nginx/sites-available
vi default
위 명령을 실행해서 default
파일을 아래의 내용으로 채운다.
server {
listen 80;
server_name your.domain.com;
location / {
proxy_pass http://192.168.XXX.XXX;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
proxy_set_header Host $http_host;
}
}
server_name
부분에 SSL을 적용할 도메인을 입력해준다. 굿프렌즈의 경우 서버 도메인 이름이 goodfriends.pro
으로 입력했다.
이후에 Certbot이 이 server_name
을 기준으로 Nginx 설정 파일을 찾고, 여기에 HTTPS에 대한 설정을 자동으로 추가해줄 것이다.
proxy_pass
는 프록시 서버가 클라이언트 요청을 전달할 리얼 서버의 주소를 적는다. 리버스 프록시의 큰 목적 중 하나는 실제 서버의 IP 주소를 클라이언트에게 노출하지 않기 위함으로서 여기서는 Private IP를 입력했다. Public IP를 입력해도 큰 차이는 없다.
Certbot 공식문서를 참고하여 서버에 HTTPS 설정을 한다.
참고로 굿프렌즈의 경우 AWS EC2 서버를 생성할 때 [애플리케이션 및 OS 이미지]를 Ubuntu Server 20.04 LTS (프리 티어)로 설정했다.
Certbot
은 손쉽게 SSL 인증서를 자동 발급할 수 있도록 도와주는 도구이다. Certbot
은 우분투의 snap 이라는 패키지 매니저를 사용하여 설치하는 것을 권장한다. 따라서 apt가 아닌 snap
을 사용하여 설치한다.
우선 snap
이라는 패키지를 설치하고 이미 설치되어 있는 certbot은 제거한다.
# certbot을 설치하기 위한 snap을 설치한다.
sudo apt update
sudo apt install snapd
# 이미 설치되어있는 certbot을 제거한다.
sudo apt-get remove certbot
그리고 아래의 명령어를 통해 Certbot을 설치하고, SSL 인증서를 발급 받기 위해 nginx에 연결하는 명령어를 입력한다.
# certbot을 설치한다.
sudo snap install --classic certbot
# certbot이 잘 설치되어있는지 확인한다.
sudo ln -s /snap/bin/certbot /usr/bin/certbot
# certbot을 nginx에 연결하기
sudo certbot --nginx
이메일을 입력하고, 이용약관에 동의/비동의를 한 다음에 사용할 도메인을 입력한다.
이때, 적용할 도메인에 대한 A 레코드가 Amazon Route 53
에 반드시 적용되어 있어야 한다.
만약 기존에 적용되어 있다면, 아래처럼 도메인 이름을 알려준다.
콤마(,)로 구분하여 여러 도메인을 대상으로도 설정할 수 있지만, 굿프렌즈의 경우 1개의 도메인만 설정하도록 했다.
ubuntu@ip-{프라이빗 IP 주소}:~$ sudo certbot --nginx
Saving debug log to /var/log/letsencrypt/letsencrypt.log
Enter email address (used for urgent renewal and security notices)
(Enter 'c' to cancel): fancy.junyongmoon@gmail.com
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Please read the Terms of Service at
https://letsencrypt.org/documents/LE-SA-v1.3-September-21-2022.pdf. You must
agree in order to register with the ACME server. Do you agree?
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
(Y)es/(N)o: yes
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Would you be willing, once your first certificate is successfully issued, to
share your email address with the Electronic Frontier Foundation, a founding
partner of the Let's Encrypt project and the non-profit organization that
develops Certbot? We'd like to send you email about our work encrypting the web,
EFF news, campaigns, and ways to support digital freedom.
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
(Y)es/(N)o: no
Account registered.
Saving debug log to /var/log/letsencrypt/letsencrypt.log
Which names would you like to activate HTTPS for?
We recommend selecting either all domains, or all domains in a VirtualHost/server block.
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
1: goodfriends.pro
2: www.goodfriends.pro
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Select the appropriate numbers separated by commas and/or spaces, or leave input
blank to select all options shown (Enter 'c' to cancel): 1
Requesting a certificate for goodfriends.pro
Successfully received certificate.
Certificate is saved at: /etc/letsencrypt/live/goodfriends.pro/fullchain.pem
Key is saved at: /etc/letsencrypt/live/goodfriends.pro/privkey.pem
This certificate expires on 2024-01-10.
These files will be updated when the certificate renews.
Certbot has set up a scheduled task to automatically renew this certificate in the background.
Deploying certificate
Successfully deployed certificate for goodfriends.pro to /etc/nginx/sites-enabled/default
Congratulations! You have successfully enabled HTTPS on https://goodfriends.pro
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
If you like Certbot, please consider supporting our work by:
* Donating to ISRG / Let's Encrypt: https://letsencrypt.org/donate
* Donating to EFF: https://eff.org/donate-le
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
위 과정을 통해 Cerbot은 Let’s Encrypt를 통해 자동으로 SSL 인증서를 발급해준다.
또한 우리가 작성한 Nginx의 default
파일을 확인해보면 HTTPS를 위한 여러 설정이 자동으로 추가된 것을 확인할 수 있다.
server {
server_name your domain.com;
location / {
proxy_pass http://192.168.XXX.XXX:8080; # set for reverse proxy
proxy_set_header Host $http_host;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
}
listen [::]:443 ssl; # managed by Certbot
listen 443 ssl; # managed by Certbot
ssl_certificate /etc/letsencrypt/live/goodfriends.store/fullchain.pem; # managed by Certbot
ssl_certificate_key /etc/letsencrypt/live/goodfriends.store/privkey.pem; # managed by Certbot
include /etc/letsencrypt/options-ssl-nginx.conf; # managed by Certbot
ssl_dhparam /etc/letsencrypt/ssl-dhparams.pem; # managed by Certbot
}
server {
if ($host = your.domain.com) {
return 301 https://$host$request_uri;
} # managed by Certbot
return 301 https://$host$request_uri;
listen 80;
listen [::]:80 default_server;
server_name your.domain.com;
return 404; # managed by Certbot
}
첫 번째 서버 블록에서 location / { ... }
은 모든 요청에 대한 처리 규칙을 정의한다.
proxy_pass
는 실제로 요청을 처리할 upstream 서버의 주소를 설정한다. 이 경우 192.168.XXX.XXX의 IP 주소와 8080 포트로 요청을 전달한다.
proxy_set_header
는 프록시 서버로 전달하는 요청 헤더를 설정한다.
listen [::]:443 ssl;
, listen 443 ssl;
을 통해 443 포트에서 SSL을 사용하여 HTTPS 트래픽을 처리한다.
ssl_certificate
로 시작하는 두 줄은 SSL 인증서 및 키의 경로를 설정한다.
include /etc/letsencrypt/options-ssl-nginx.conf;
는 Let’s Encrypt에서 제공하는 Nginx 옵션 파일을 포함하여 보안 설정을 추가하는 것을 의미한다.
두 번째 서버 블록은 HTTP 트래픽을 HTTPS로 리다이렉트하는 역할을 한다.
listen 80;
, listen [::]:80 default_server;
은 80 포트에서 HTTP 트래픽을 처리한다.
if ($host = your.domain.com) { return 301 https://$host$request_uri; }
은 요청 도메인이 your domain.com
일 경우 HTTPS로 리다이렉트하는 것을 의미한다.
만약 HOST
가 일치하지 않으면 404
를 반환한다.
Certbot으로부터 발급받은 인증서의 만료일을 확인하기 위해 아래의 명령어를 입력한다.
ubuntu@ip-{프라이빗 IP 주소}:~$ certbot certificates
그러면 아래의 결과와 같이 56일 남은 것을 확인할 수 있다.
Saving debug log to /var/log/letsencrypt/letsencrypt.log
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Found the following certs:
Certificate Name: {your.domain.com}
Serial Number: {your.serial.number}
Key Type: ECDSA
Domains: goodfriends.pro // your.domain.com
Expiry Date: 2024-01-10 06:43:57+00:00 (VALID: 56 days)
Certificate Path: /etc/letsencrypt/live/goodfriends.pro/fullchain.pem
Private Key Path: /etc/letsencrypt/live/goodfriends.pro/privkey.pem
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
아쉽게도 Let’s Encrypt에서 발급해주는 SSL 인증서는 90일짜리 단기 인증서이다.
그래서 90일마다 서버에 접속하여 SSL 인증서를 수동으로 다시 발급해줘야 한다.
Certbot에서 이러한 SSL 인증서를 수동으로 다시 발급해주는 것이 아닌 갱신을 하기 위해 아래의 명령어를 입력해주면 된다.
# Certbot이 인증서 갱신을 어떻게 수행할지 테스트 명령어, 이를 통해 갱신 프로세스에 문제가 있는지 확인이 가능하다.
ubuntu@ip-{프라이빗 IP 주소}:~$ certbot renew --dry-run
여기서 실제로 갱신하기 위해서는 --dry-run
을 실행해주면 된다.
하지만, SSL 인증서를 수동으로 다시 발급하거나, 갱신하는 것을 넘어서 자동화를 해주면 매번 SSL 인증서를 신경쓰지 않아도 된다.
리눅스 Crontab
을 이용해서 이를 자동화해주면 된다.
소프트웨어 유틸리티
cron
은 유닉스 계열 컴퓨터 운영 체제의 시간 기반 잡 스케줄러이다. 소프트웨어 환경을 설정하고 관리하는 사람들은 작업을 고정된 시간, 날짜, 간격에 주기적으로 실행할 수 있도록 스케줄링하기 위해 cron을 사용한다. -위키백과-
Crontab
은 리눅스에서 제공하는 기능으로, 지정된 시간과 날짜에 정기적으로 작업을 수행하는 경우에 사용한다다.
즉, Crontab
은 스케줄링 도구로 아래 명령어를 이용해서 cron job
하나를 생성한다.
# Crontab 편집
ubuntu@ip-{프라이빗 IP 주소}:~$ crontab -e
기본 에디터는 자신이 가장 잘 사용하는 에디터를 선택하면 된다. 필자는 vim(2번)을 선택했다.
그리고 주석 가장 아래에 아래의 내용을 추가하고 파일을 저장하면 된다.
0 0 * * * certbot renew --post-hook "sudo service nginx reload"
위 명령어의 의미를 해석하면,
매월, 매일 0시 0분에 certbot을 실행하여 SSL 인증서를 갱신하고, 갱신 이후 nginx의 설정 파일을 reload 해주는 작업을 의미한다.
*
이 총 5개인데, 왼쪽부터 분(0-59)
, 시간(0-23)
, 일(1-31)
, 월(1-12)
, 요일(0-7)
순으로 설정이 가능하다.
요일
에서 0과 7은 일요일이고, 1~6이 월요일~토요일이다.
Crontab
의 사용은 별도로 공부를 해서 익히거나, https://crontab-generator.org/ 와 같이 제너레이터를 사용하는 방법도 있다.
마지막으로 Crontab
을 재실행하는 명령어를 아래와 같이 입력해주면, 이후부터는 매월, 매일 0시 0분에 자동으로 SSL 인증서를 갱신할 것이다.
ubuntu@ip-{프라이빗 IP 주소}:~$ service cron start
https://docs.nginx.com/nginx/admin-guide/web-server/reverse-proxy/
https://certbot.eff.org/
https://crontab-generator.org/
HTTPS에서 S
는 secure을 의미한다. 즉, 기존의 HTTP 보다 안전하다는 얘기다.
무엇으로부터 안전하냐면, 크게 둘로 나뉜다.
먼저, [1] 내가 어떤 사이트에 보내는 정보를 다른 누군가 훔쳐보지 못하게 한다.
네이버에 접속해서 아이디와 비밀번호를 입력하고 로그인 버튼을 누르면,
이 두 정보가 인터넷을 타고, 네이버의 서버로 전송된다.
그런데 그냥 HTTP
로 보내게 되면 이 암호가 입력한 텍스트 그대로, 누구든 알아볼 수 있는 형식으로 보내진다.
만약 누군가가 이 정보를 중간에 들여다보면(도청), 나의 네이버 아이디와 비밀번호를 알게되어 버린다.
하지만, HTTPS
는 네이버만 알아볼 수 있는 알 수 없는 텍스트로 변경해서 보내게 된다.
다른 하나는, [2] 내가 접속한 사이트가 진품인지, 신뢰할 수 있는 사이트인지 판별해준다.
HTTP를 사용한 요청, 응답에서는 통신 상대를 확인하지 않는다.
네이버
를 클릭해서 들어갔는데, 네이놈
이라는 피싱 사이트인 경우가 있다.
거기에 네이버의 아이디와 비밀번호를 입력하게 되면, 나의 네이버 계정을 알게된다.
돈과 관련 있는 은행같은 온라인뱅킹 사이트의 경우 더 큰일이 나게 된다.
HTTPS
는 이러한 수상한 사이트를 걸러낼 수 있도록 해준다.
기관으로부터 검증된 사이트만 주소에 HTTPS 사용이 허가되고, HTTP만 사용되는 사이트들은 "안전하지 않음"
와 같은 표시가 뜨게 된다.
요약하자면, HTTPS
는 [1] 내가 사이트에 보내는 정보들을 제 3자가 못보게 하고, [2] 접속한 사이트가 믿을 만한 곳인지를 알려준다.
대칭키
는 동일한 키로 암호화
와 복호화
를 같이할 수 있는 방식의 암호화 기법을 의미한다.
암호화와 복호화를 위해 양쪽이 같은 키를 가져야 한다는 점에서 이 키를 대칭키
라고 한다.
암호화: 어떤 정보를 외부에 노출시키지 않기 위해 변형하는 것을 의미한다.
복호화: 반대로 암호화된 데이터를 원본으로 복원하는 것을 의미한다.
네이버에 로그인하는 상황을 가정해보면, 내가 로그인할 때 아이디와 비밀번호를 대칭키로 이용해서 암호화
하고,
네이버에서는 이를 복호화
해서 인식할 수 있다.
그러면 중간에 누가 이걸 훔쳐보더라도 알아볼 수 없게 된다.
그런데 대칭키는 큰 단점이 있다.
어떻게 이 동일한 키를 애초에 양쪽이 공유하느냐는 것이다.
결국 한 번은 한쪽에서 다른 한쪽으로 대칭키
를 전달해야 하는데, 이 과정에서 제 3자로부터 대칭키
가 탈취된다면, 제 3자도 정보를 복호화해서 알 수 있게 된다.
이러한 한계점을 보완하기 위해 1970년대 수학자들에 의해 개발되어 나온 암호화 방식이 비대칭키
(공개키)다. (개발자들 사이에서는 공개키
라고 부른다)
비대칭키는 키가 두개가 있다.
A키로 암호화하면 B키로 복호화할 수 있고, B키로 암호화하면 A키로 복호화하는 방식이다.
이후부터는 공개키(=비대칭키)라고 부르는게 더 이해하기 쉬울 것 같아서
공개키
로 부르겠습니다.
이 방식에 착안해서 두개의 키 중 하나를 공개키, 다른 하나를 비공개 키로 지정한다.
아래 그림을 통해 자세히 살펴보면 다음과 같다.
네이버 서버는 이 두개의 키들 중 하나는 비밀로 보관하고(개인키), 다른 하나를 대중에게 공유하는 공개키를 제공한다고 가정했을 때,
우리가 비밀번호를 암호화해서 네이버에 보내는 과정에서, 중간에 누군가가 가로채도 같은 공개키
로는 해당 암호문을 풀 수가 없다.
이 암호문을 볼 수 있는 건 비공개키(개인키)
를 가진 네이버 회사만 가능하다.
즉, 비공개키(개인키)
가 없으면 복호화
가 불가능하기 때문에 대칭키 방식의 단점을 극복할 수 있다.
이 원리로 이제 사용자는 개인 정보들을 안심하고 네이버에 보낼 수 있다.
그런데, 이 사이트가 네이버라는 걸 어떻게 증명하나요?
네이버에서 우리에게 보내는 정보들은 그 일부가 이 네이버의 개인키
로 암호화가 되어 있다.
우리가 네이버의 공개키
로 풀어서 알아볼 수 있는 건 네이버의 개인키
로 암호화된 정보들 뿐이다.
신뢰할 수 있는 기관에게 네이버의 공개키만 검증해주면, 이 기준으로 안전하게 네이버를 이용할 수 있다.
CA
(Certificate Authority)라고 부른다.하지만 공개키 방식의 문제점은 대칭키 방식보다 암호화 연산시간이 더 소요되어 비용이 크다.
결론적으로 대칭키 방식의 장점이 공개키 방식의 단점이 되고, 대칭키 방식의 단점이 공개키 방식의 장점이 된다.
그래서 SSL
은 각 방식이 가진 단점 때문에 하나의 방식만 채택하지 않고 두 방식 모두 적절히 섞어서 사용한다.
SSL(Secure Socket Layer): Netscape Communications Corporation에서 서버와 웹 브라우저간의 보안을 위해 만든 프로토콜로, 공개키 방식과 대칭키 방식을 혼합해서 사용한다.
SSL은 서버와 브라우저 사이에 안전하게 암호화된 연결을 만들 수 있게 도와주고, 서버와 브라우저가 민감한 정보를 주고받을 때 해당 정보가 도난당하는 것을 막아준다.
참고로 SSL 3.0버전은 IETF에서 표준으로 제정되어 TLS라는 이름을 갖게 되었다.
SSL
은 공개키 방식과 대칭키 방식을 적절히 혼합해서 사용하는데, 이를 보다 더 구체적으로 정리하면,
SSL
은 공개키 방식으로 대칭키를 안전하게 전달한다.
그리고 이 대칭키를 활용해서 암호화와 복호화를 하고 서버와 브라우저간 통신을 한다.
통신이 끝나면 종료한다.
이렇게 됨으로써 대칭키를 중간에 탈취당하지 않고, 공개키 방식보다 빠르게 통신할 수 있게 된다.
SSL 통신 과정을 살펴보면 아래와 같은 세가지 과정으로 진행된다.
HandShake
-> 통신 -> 통신 종료
앞서 이야기한 것처럼 HTTP는 통신 상대를 확인하지 않는다. 클라이언트가 서버로부터 받은 공개키가 진짜인지 가짜인지 판별하기 위해 CA
(Certicifate Authority)라는 제 3자를 통해 가능하다.
CA
는 정말 엄격한 인증 과정을 거쳐야 될 수 있다고 한다. 이 과정을 조금 더 자세히 알아보자.
[1] 먼저 서버는 CA
에게 자신의 공개키
를 건넨다.
CA의 개인키
로 암호화하여 서명한다.[2] 이렇게 암호화된 것을 공개키 인증서(Public Key Certificate)
라고 한다. 서버는 이 공개키 인증서
를 클라이언트에게 보낸다.
SSL 통신
은 데이터를 주고 받기 이전에 어떻게 데이터를 암호화할지, 믿을 만한 서버인지 등에 대한 과정을 확인한다.
[3] 클라이언트가 서버에 접속한다. 이 단계를 Client Hello
라고 한다. 이 단계에서 주고 받은 정보는 아래와 같다.
클라이언트 측에서 생성한 랜덤 데이터
클라이언트가 지원하는 암호화 방식들 ⇒ 클라이언트가 가능한 암호화 방식을 서버에 알려주기 위함
[4] 서버는 Client Hello
에 대한 응답으로 Server Hello
를 하게 된다.(이때, 클라이언트에게 공개키 인증서
전달) 이 단계에서 주고 받은 정보는 아래와 같다.
서버 측에서 생성한 랜덤 데이터
서버가 선택한 클라이언트의 암호화 방식 ⇒ 선택한 암호화 방식을 클라이언트에게 알려주기 위함
[5] 클라이언트
는 서버의 인증서
가 CA
에 의해 발급된 것인지 확인한다. 이때, 브라우저에 내장된 CA리스트와 CA 공개키
를 사용해서 인증서를 복호화한다.
성공적으로 인증서가 복호화 됬다면, 서버가 전달한 공개키 인증서
가 CA의 개인키
로 암호화된 문서임이 보증된 것이다.
즉, 올바른 서버임을 신뢰 할수 있게된다.
서버를 신뢰할수 있으므로 클라이언트는 서버가 생성한 랜덤 데이터
와 클라이언트가 생성한 랜덤 데이터
를 조합하여 pre master secret
이라는 키를 생성한다.
이때, 공개키 방식
을 사용한다.
[6] 서버의 공개키
를 전달받은 클라이언트는 pre master secret
를 암호화해서 서버로 전송한다.
서버는 자신의 비공개키를 통해 pre master secret
를 복호화한다.
이를 통해, 클라이언트와 서버는 안전하게 같은 pre master secret
를 가진다.
[7] 서버와 클라이언트가 공개키 방식을 통해 pre master secret
를 master secret
라는 대칭키
를 생성한다.
클라이언트는 서버로부터 받은 공개키를 이용하여 자신의 대칭키를 암호화한다.
클라이언트는 이렇게 암호화된 대칭키를 서버에게 전달한다.
서버는 전달받은 암호화된 대칭키를 자신의 비공개키(개인키)를 통해 복호화하고, 이 복호화로 인해 클라이언트로부터 대칭키를 얻을 수 있게 된다.
그리고 클라이언트와 서버는 HandShake
가 종료되었음을 서로에게 알린다.
이 대칭키를 통해 실제로 클라이언트와 서버가 암호화된 메시지를 주고받을 수 있게 된다.
다른 말로 표현하면, master secret
라는 대칭키
를 통해 클라이언트와 서버는 데이터를 암호화/복호화하면서 주고 받게 된다.
데이터의 전송이 끝나면 SSL 통신
이 끝났음을 서로에게 알려준다.
그리고 사용한 대칭키인 master secret
은 폐기한다.
지난 8-9월에 굿프렌즈 프로젝트에서 백엔드와 프론트엔드 서버에 HTTPS를 설정하는 작업을 진행했었다.
HTTPS의 중요성과 그에 기반한 지식들을 복습하기 위해 이 글을 작성하게 되었다.
처음에는 완전히 이해가 안됐지만, 계속 보다보니 이해가 점점 되어가는 내 자신에게 뿌듯함을 안겨줬다.
HTTPS에 대한 더 깊은 지식은 나중에 이어 학습하고 정리하자.
이 글은
데이터베이스 개론
교재와 ERD와 정규화 과정를 공부하고 필자의 생각을 포함하여 정리한 내용으로 사실과 맞지 않는 부분이 있을 수 있습니다.
이 글은 정규화를 이용해 데이터베이스를 설계하는 방법에 대해 소개한다.
정규화
는 데이터베이스를 설계한 후 설계 결과물을 검증하기 위해 사용하기도 한다.
두 설계 방법은 데이터 설계 결과물이 비슷한 수준을 유지하므로 상황에 따라 적절한 방법을 선택하면 된다.
데이터베이스를 잘못 설계하면 불필요한 데이터 중복이 발생하여 릴레이션에 대한 데이터 삽입, 수정, 삭제 연산을 수행할 때 부작용이 발생하는데
이러한 부작용을 이상(anomaly)
현상이라 부른다.
이상 현상을 제거하면서 데이터베이스를 올바르게 설계해 나가는 과정이 정규화
다.
정규화의 필요성과 방법을 구체적으로 알아보기에 앞서 먼저 이상 현상을 종류별로 알아보자.
삽입 이상
(insertion anomaly)은 새 데이터를 삽입하기 위해 불필요한 데이터도 함께 삽입해야 하는 문제를 말한다.[그림 9-2]의 이벤트참여 릴레이션은 고객들이 이벤트에 참여한 결과를 저장하고 있는 릴레이션이다.
여기서 이벤트참여 릴레이션에 아이디가 melon
이고, 이름이 성원용
, 등급이 gold
인 신규 고객에 대한 데이터를 삽입한다고 가정해보자.
이 고객이 참여한 이벤트가 아직 없다면, 다시 말하면, 이벤트번호와 당첨여부가 존재하지 않는다면 해당 릴레이션에 신규 고객에 대한 데이터를 삽입할 수 없다.
따라서 신규 고객(성원용)와 같이 이벤트참여 릴레이션에 삽입하려면 실제로 참여하지 않는 임시 이벤트번호를 삽입해야 하는데, 이때 발생하게 되는 것이 삽입 이상
이다.
갱신 이상
(update anomaly)은 릴레이션의 중복된 튜플(=행)들 중 일부만 수정하여 데이터가 불일치하게 되는 모순이 발생하는 문제를 말한다.[그림 9-2]의 이벤트참여 릴레이션에는 아이디가 apple
인 고객에 대한 튜플(행)이 3개 존재하여, 고객아이디, 고객이름, 등급 속성의 값이 중복되어 있다.
만약 아이디가 apple
인 고객의 등급이 gold
에서 vip
로 변경하게 된다면, apple
고객에 대한 튜플 3개의 등급 속성 값이 모두 수정되어야 한다.
그렇지 않고, 아래 [그림 9-4]와 같이 2개의 튜플만 등급이 수정되면 apple
고객이 서로 다른 등급을 가지는 모순이 생겨 갱신 이상
이 발생하게 된다.
삭제 이상
(deletion anomaly)은 릴레이션에서 튜플(행)을 삭제하면 꼭 필요한 데이터까지 함께 삭제하여 데이터가 손실되는 연쇄 삭제 현상을 말한다.
아이디어가 orange
인 고객이 이벤트 참여를 취소하여 [그림 9-2]의 이벤트참여 릴레이션에서 관련된 튜플을 삭제해야 한다면, 아래 [그림 9-5]와 같이 하나의 튜플만 삭제하면 된다.
그런데 이 튜플은 이벤트에 대한 정보(이벤트번호, 당첨여부) 뿐만 아니라 의도치 않게 해당 고객에 대한 정보인 고객아이디, 고객이름, 등급에 대한 정보도 같이 손실되는 삭제 이상
이 발생하게 된다.
[그림 9-2]의 이벤트참여 릴레이션에서 여러 이상 현상
이 발생하는 이유는 관련 없는 속성들이 하나의 릴레이션에 모아두고 있기 때문이다.
이상 현상이 발생하지 않기 위해서는 관련 있는 속성들로만 릴레이션을 구성 해야 하는데 이를 위해 필요한 것이 정규화
다.
정규화
는 이상 현상이 발생하지 않도록, 릴레이션을 관련있는 속성들로만 구성하기 위해 릴레이션을 분해
하는 과정이다.
정규화
과정에서 고려해야 하는 속성들 간의 관련성을 함수적 종속성
(FD, Functional Dependency)이라고 한다.
이후부터는
함수적 종속성
대신함수 종속성
이라는 용어를 사용하기로 한다.
함수적 종속성
: 테이블의 특정 컬럼 A의 값을 알면 다른컬럼 B
값을 알 수 있을 때,컬럼 B
는 컬럼 A에 함수적 종속성이 있다고 한다.
함수 종속 관계는 X -> Y를 표현하고 X를 결정자
, Y를 종속자
라고 한다.
일반적으로 릴레이션에 함수적 종속성이 하나 존재하도록 정규화를 통해 릴레이션을 분해한다.
아래 [그림 9-7]의 고객 릴레이션을 대상으로 속성 간의 함수 종속 관계를 판단해보자.
고객 릴레이션에서 각 고객아이디
속성 값에 대응되는 고객이름
속성과 등급
속성의 값이 단 하나이므로,
고객아이디
가 고객이름
과 등급
을 결정한다고 볼 수 있다.
그러므로 고객 릴레이션에서 고객아이디
는 결정자가 되고, 고객이름
과 등급
은 종속자가 된다.
함수 종속에는 2가지 종류가 있다.
완전 함수 종속
은 릴레이션에서 속성 집합 Y가 속성 집합 X 전체에 함수적으로 종속되어 있다는 의미이다.
부분 함수 종속
은 속성 집합 Y가 속성 집합 X의 전체가 아닌 일부분에도 함수적으로 종속됨을 의미한다.
고객이름
은 고객아이디에 완전 함수 종속되어 있지만, {고객아이디, 이벤트번호}에는 부분 함수 종속되어 있다. 그리고 당첨여부
는 {고객아이디, 이벤트번호}에 완전 함수 종속되어 있다.정규화
(normalization)란 함수적 종속성을 이용하여 릴레이션을 연관성이 있는 속성들로만 구성되도록 분해해서, 이상 현상이 발생하지 않는 올바른 릴레이션으로 만들어나가는 과정을 말한다.
정규화
의 기본 목표는 관련이 없는 함수 종속성을 별개의 릴레이션으로 표현하는 것이다.
릴레이션이 정규화된 정도는 정규형
(NF, Nomal Form)으로 표현된다.
정규형은 크게 기본 정규형
과 고급 정규형
으로 나뉜다.
기본 정규형
에는 제1정규형, 제2정규형, 제3정규형, 보이스/코드 정규형이 있다.
고급 정규형
에는 제4정규형, 제5정규형이 있다.
각 정규형마다 만족시켜야 하는 제약조건이 존재하며, 정규형의 차수가 높아질수록 요구되는 제약조건이 많이지고 엄격해진다.
일반적으로 차수가 높은 정규형일수록 바람직한 릴레이션일 수 있다.
하지만 모든 릴레이션이 제5정규형에 속해야 되는 것은 아니므로 릴레이션의 특성을 고려해서 적합한 정규형을 선택해야 한다.
일반적으로 기본 정규형
에 속하도록 릴레이션을 정규화하는 경우가 대부분이므로 여기서는 기본 정규형
을 중심으로 정규화 과정을 알아본다.
제1정규형
: 릴레이션에 속한 모든 속성의 도메인이 원자값으로만 구성되어 있으면 제 1 정규형에 속한다.
릴레이션이 제1정규형에 속하려면 릴레이션에 속한 모든 속성이 더는 분해되지 않는 원자 값만 가져야 한다.
즉, 다중 값을 가질 수 있는 속성은 분리되어야 한다.
[그림 9-16]의 이벤트참여 릴레이션에서 이벤트번호 속성과 당첨여부 속성은 하나의 고객아이디에 해당하는 값이 여러 개다.
제1정규형에 속하게 하려면 튜플마다 이벤트번호
와 당첨여부
속성 값을 하나씩만 포함되도록 분해하여, 모든 속성이 원자값을 가지도록 해야 한다.
제1정규형을 만족하도록 정규화를 수행한 결과는 아래 [그림 9-17]과 같다.
제1정규형을 정리하면 아래와 같다.
[1] 모든 속성은 원자 값을 가져야 한다.
[2] 다중 값을 가질 수 있는 속성은 분리되어야 한다.
[그림 9-17]은 제1정규형에 속하지만, 불필요한 데이터 중복으로 인해 이상 현상이 발생하는 릴레이션이 있을 수 있다.
이러한 문제를 해결하기 위해서는 부분 함수 종속이 제거되도록 이벤트참여 릴레이션을 분해해야 한다.
릴레이션을 분리하여 부분 함수 종속을 제거하면, 분해된 릴레이션들은 제2정규형에 속하게 되고 이상 현상은 발생하지 않게 된다.
제2정규형
: 릴레이션이 제1정규형에 속하고, 기본키가 아닌 모든 속성이 기본키에 완전 함수 종속되면 제2정규형에 속한다.
제2정규형
을 만족하게 하려면, 부분 함수 종속을 제거하고 모든 속성이 기본키에 완전 함수 종속되도록 릴레이션을 분해하는 정규화 과정을 거쳐야 한다.이벤트참여 릴레이션에서 기본키인 {고객아이디, 이벤트번호}에 완전 함수 종속되지 않는 등급, 할인율 속성이 존재하므로
[그림 9-24]와 같이 2개의 릴레이션으로 분해하면, 분해된 고객
릴레이션과 이벤트참여
릴레이션은 모두 제2정규형에 속하게 된다.
정규화 과정에서 릴레이션을 분해할 때 주의할 점은, 분해된 릴레이션들을 자연 조인하여 분해 전의 릴레이션으로 다시 복원할 수 있어야 한다.
즉, 릴레이션이 의미상 동등한 릴레이션들로 분해되어야 하고, 릴레이션을 분해했을 때 정보 손실이 발생하지 않아야 한다.
제2정규형을 정리하면 아래와 같다.
[1] 제 1정규형을 만족하고 모든 Non-Key 컬럼은 기본키(PK) 전체에 종속(완전 종속)되어야 한다.
[2] 만약 Non-Key 컬럼이 기본키에 종속되어있지 않거나 부분 종속되어 있으면, 기본키에 완전 종속되도록 릴레이션을 분리되어야 한다.
[3] 정규화 과정에서 수행되는 릴레이션의 분해는 무손실 분해
여야 한다.
무손실 분해
(nonloss decomposition): 정보의 손실 없이 릴레이션을 분해하는 것을 의미한다.
제3정규형
: 릴레이션이 제2정규형에 속하고, 기본키가 아닌 모든 속성이 기본키에 이행적 함수 종속이 되지 않으면, 제3정규형에 속한다.
제3정규형을 살펴보기에 앞서 이를 이해하기 위해 필요한 이행적 함수 종속
(transitive FD)을 잠깐 살펴보자.
릴레이션을 구성하는 3개의 속성 집합 X, Y, Z에 대해 함수 종속 관계 X -> Y 와 Y -> Z가 존재하면 논리적으로 X -> Z가 성립한다.
이때 속성 집합 Z가 집합 X에 이행적으로 함수 종속되었다고 한다.
제2정규형
을 만족하더라도 하나의 릴레이션에 함수 종속 관계가 여러개 존재하고, 논리적으로 이행적 함수 종속 관계가 유도되면 이상 현상이 발생할 수 있다.
제3정규형
을 만족하기 위해서는 릴레이션에서 이행적 함수 종속을 제거해서, 모든 속성이 기본키에 이행적 함수 종속이 되지 않도록 릴레이션을 분해하는 정규화 과정을 거쳐야 한다.
위 [그림 9-26]에서 보는 것처럼 고객아이디가 등급을 결정하고, 등급이 할인율을 결정하는 함수 종속 관계로 인해,
고객아이디가 등급을 통해 할인율을 결정하는 이행적 함수 종속 관계도 존재한다.
이러한 이행적 함수 종속이 나타나는 이유는 함수 종속 관계가 하나의 릴레이션에 여러 개 존재하기 때문이다.
따라서 고객 릴레이션
에 이상 현상이 발생하지 않도록 하려면 이행적 함수 종속이 나타나지 않게 2개의 릴레이션으로 분해해야 한다.
제3정규형을 만족하기 위해서 [그림 9-26]의 분해된 고객 릴레이션은 고객아이디 -> 등급, 등급 -> 할인율의 함수 종속 관계를 유지할 수 있도록 아래 [그림 9-32]와 같이 2개의 릴레이션으로 분해하면 된다.
![](
보이스/코드 정규형
(BCNFm Boyce/Codd Normal Form): 릴레이션의 함수 종속 관계에서 모든 결정자가 후보키이면 보이스/코드 정규형에 속한다.
하나의 릴레이션에 여러개의 후보키가 존재할 수도 있는데, 이 경우에는 제3정규형까지 모두 만족하더라도 이상 현상이 발생할 수 있다.
이를 해결하기 위해 제3정규형보다 좀 더 엄격한 제약조건을 제시한 것이 보이스/코드 정규형
이다.
[그림 9-26]에서 {고객아이디, 이벤트번호} -> 당첨여부의 함수 종속 관계를 포함하고 있는 분해된 이벤트참여 릴레이션
은 {고객아이디, 이벤트번호}가 유일한 후보키
이자 기본키이면서 함수 종속관계에서도 유일한 결정자
다.
그러므로 제3정규형에 속하는 이벤트참여 릴레이션
은 보이스/코드 정규형에도 속한다.
[그림 9-32]에서 고객아이디 -> 등급의 함수 종속 관계를 포함하고 있는 분해된 고객 릴레이션
도 마찬가지로 기본키인 고객아이디가 함수 종속 관계에서 유일한 결정자이므로 보이스/코드 정규형에 속한다.
이제 제3정규형에 속하지만 보이스/코드 정규형에는 속하지 않는 릴레이션의 예를 통해, 후보키가 여러 개인 릴레이션에서 어떠한 이상 현상이 발생할 수 있는지 알아보자.
[그림 9-34]의 강좌신청 릴레이션은 고객이 인터넷강좌를 신청하면 해당 강좌의 담당강사에 대한 데이터를 저장한다.
요구 사항은 다음과 같다고 가정해본다.
한 고객이 인터넷강좌를 여러 개 신청할 수 있지만 동일한 인터넷강좌를 여러 번 신청할 수는 없다.
그리고 강사 한 명이 인터넷강좌를 하나만 담당할 수 있고, 하나의 인터넷강좌는 여러 강사가 담당할 수 있다.
그러므로 튜플을 구별할 수 있는 후보키는 {고객아이디, 인터넷강좌}, {고객아이디, 담당강사번호}가 있고 이 중에서 {고객아이디, 인터넷강좌}를 기본키로 선정했다.
[그림 9-34]의 강좌신청 릴레이션에서 기본키인 {고객아이디, 인터넷강좌}가 담당강사번호 속성을 함수적으로 결정하는 것은 당연하다.
그리고 강사 한 명이 인터넷강좌를 하나만 담당하므로 담당강사번호가 인터넷강좌를 함수적으로 결정한다고 볼 수 있다.
강좌신청 릴레이션의 함수 종속 다이어그램은 아래 [그림 9-35]와 같다.
후보키: 유일성과 최소성을 만족하는 속성 또는 속성들의 집합이다.
고객아이디
속성은 단독으로 고객 튜플을 유일하게 구별할 수 있으므로 후보키가 될 수 있다.
- 키에 대해 자세한 설명은 이전에 작성한 [DB] 관계 데이터 모델의 개념 - Key의 종류글을 참고하자.
고객담당강사 릴레이션은 함수 종속 관계가 성립하지 않는 고객아이디, 담당강사번호 속성으로 구성하고, {고객아이디, 담당강사번호}가 기본키의 역할을 담당한다.
강좌담당 릴레이션은 담당강사 -> 인터넷강좌의 함수 종속 관계를 포함하고 있고 담당강사번호가 유일한 후보키이자 기본키다.
두 개의 릴레이션 모두 후보키가 아닌 결정자가 존재하지 않아 보이스/코드 정규형에 속한다.
고급 정규형으로 분류되는 제4정규형과 제5정규형은 필요시 나중에 자료를 직접 찾아보고 정리하기로 하고 여기서는 간단하게 개념만 알고 넘어가자 .
제4정규형
은 릴레이션이 보이스/코드 정규형을 만족하면서, 함수 종속이 아닌 다치 종속(MVD, Multi Valued Dependency)을 제거해야 만족할 수 있다.
제5정규형
은 릴레이션이 제4정규형을 만족하면서 후보키를 통하지 않는 조인 종속(JD, Join Dependency)를 제거해야 만족할 수 있다.
실제로 데이터베이스를 설계할 때 모든 릴레이션이 무조건 제5정규형에 속하도록 분해해야 하는 것은 아니라고 생각한다.
오히려 제5정규형으 만족할때 까지 분해하면 비효율적이고 바람직하지 않는 경우가 많다. (성능이 100% 좋아지는 것은 아니다)
테이블을 나누게 되면 어떠한 쿼리는 조인을 해야 하는 경우도 발생해서 오히려 느려질 수도 있기 때문에 서비스에 따라 정규화 또는 비정규화 과정을 진행해야 한다고 생각한다.
실제로 최근에 했던 굿프렌즈의 경우 여러번의 조인을 발생하지 않고 한번만 조인을 하도록 설계했다.
일반적으로는 제3정규형이나 보이스/코드 정규형에 속하도록 릴레이션을 분해하여 데이터 중복을 줄이고 이상 형산이 발생하는 문제를 해결하는 경우가 있다.
굿프렌즈 프로젝트를 진행할 때 정규화 과정을 생각하면서 테이블을 설계했지만, 위의 정규화 과정을 모두 지킨 것은 아니라고 생각한다. 굿프렌즈 프로젝트에 있는 DB 설계 부분을 서비스 환경과 성능에 따라 개선할 수 있는 부분이 있다면 추후에 리팩터링하자.
이 글은 내 코드가 그렇게 이상한가요? 책을 읽고 중요하다고 생각한 부분들을 중점으로 정리했습니다.
결론부터 말하면 조건 분기 중첩을 해결하기 위해서는 인터페이스, 전략 패턴, 정책 패턴을 사용한다.
세 가지에 대해서 하나씩 정리해 가보자.
if문을 중첩으로 하면 코드의 가독성이 크게 떨어지는 문제가 있다.
이런 중첩 악마를 퇴치하는 방법 중 하나로 조기 리턴
(early return)이 있다.
조기 리턴
은 조건을 만족하지 않는 경우 곧바로 리턴하는 방법이다.가독성을 낮추는 else 구문
도 조기 리턴으로 해결이 가능하다.
단일 책임 선택의 원칙이란 소프트웨어 시스템이 선택지를 제공해야 한다면, 그 시스템 내부의 어떤 한 모듈만으로 모든 선택지를 파악할 수 있어야 한다. - 객체 지향 소프트웨어 설계 2판 원칙과 개념 -
따라서 조건식이 같은 조건 분기가 있으면, 여러 클래스로 작성하지 말고 하나의 클래스에 작성하자.
그리고 클래스가 거대해지면 관심사에 따라 작은 클래스로 분할하는 것이 중요한데, 이러한 문제를 해결할 때는 인터페이스
를 사용한다.
인터페이스
는 기능 변경을 편리하게 할 수 있는 개념으로, 분기 로직을 작성하지 않고도 분기와 같은 기능을 구현할 수 있다.
인터페이스
에는 다음과 같은 장점들이 있다.
같은 자료형으로 사용할 수 있으므로, 굳이 자료형을 판정하지 않아도 된다.
조건 분기를 따로 작성하지 않고도 각각의 코드를 적절하게 실행할 수 있다.
자료형 판정 분기를 따로 작성하지 않아도 된다.
예를 들어 사각형과 원을 프로그램상에서 같은 도형을 다룰 수 있게 가정한다.
여기서 도형을 나타내는 Shape라는 이름의 인터페이스를 만든다.
그리고 공통 메서드도 정의한다. 도형의 면적을 나타내는 area 메서드를 정의한다.
삼각형을 나타내는 Triangle 클래스, 타원을 나타내는 Ellipse 클래스 등 새로운 도형을 추가할 수도 있다.
전략 패턴
(strategy pattern) 이라고 한다.인터페이스는 switch 조건문의 중복을 제거할 수 있을 뿐만 아니라, 다중 중첩된 복잡한 분기를 제거하는 데 활용할 수 있다.
이러한 상황에서 유용하게 활용할 수 있는 패턴으로 정책 패턴
(policy pattern)이 있다.
정책 패턴
은 조건을 부품처럼 만들고, 부품으로 만든 조건을 조합해서 사용하는 패턴이다.예를 들어 다음의 상황을 가정해보자.
온라인 쇼핑몰에서 우수 고객인지 판정하는 로직이 있다.
고객의 구매 이력을 확인하고 다음 조건을 모두 만족하는 경우, 골드 회원으로 판정한다.
골드 회원의 구매 금액 규칙: 지금까지 구매한 금액이 100만원 이상
구매 빈도 규칙: 한 달에 구매하는 횟수가 10회 이상
반품률 규칙: 반품률이 0.1% 이하
아래의 코드처럼 하나하나의 규칙(판정 조건)을 나타내는 인터페이스를 만든다.
// 우수 고객 규칙을 나타내는 인터페이스
interface ExcellentCustomerRule {
/**
* @param history 구매 이력
* @return 조건을 만족하는 경우 true
*/
boolean ok(final PurchaseHistory history);
}
ExcellentCustormerRule
을 구현해서 만든다.// 골드 회원의 구매 금액 규칙
class GoldCustomerPurchaseAmountRule implements ExcellentCustomerRule {
public boolean ok(final PurchaseHistory history) {
return 1000000 <= history.totalAmount;
}
}
// 구매 빈도 규칙
class PurchaseFrequencyRule implements ExcellentCustomerRule {
public boolean ok(final PurchaseHistory history) {
return 10 <= history.purchaseFrequencyPerMonth;
}
}
// 반품률 규칙
class ReturnRateRule implements ExcellentCustomerRule {
public boolean ok(final PurchaseHistory history) {
return history.returnRate <= 0.001;
}
}
// 우수 고객 정책을 나타내는 클래스
class ExcellentCustomerPolicy {
private final Set<ExcellentCustomerRule> rules;
ExcellentCustomerPolicy() {
rules = new HashSet();
}
/**
* 규칙 추가
*
* @param rule 규칙
*/
void add(final ExcellentCustomerPolicy rule) {
rules.add(rule);
}
/**
* @param history 구매 이력
* @return 규칙을 모두 만족하는 경우 true
*/
boolean complyWithAll(final PurchaseHistory history) {
for(ExcellentCustomerRule each : rules) {
if(!each.ok(history)) return false;
}
return true;
}
}
Rule(ExcellentCustomerRule
)과 Policy(ExcellentCustomerPolicy)
을 사용해서 골드 회원 판정 로직을 개선했다.
그러면 골드 회원에 대한 정책을 아래와 같이 작성할 수 있다.
class GoldCustomerPolicy {
private final ExcellentCustomerPolicy policy;
GoldCustomerPolicy() {
policy = new ExcellentCustomerPolicy();
policy.add(new GoldCustomerPurchaseAmountRule());
policy.add(new PurchaseFrequencyRule());
policy.add(new ReturnRateRule());
}
/**
* @param history 구매이력
* @return 규칙을 모두 만족하는 경우 true
*/
boolean complyWithAll(final PurchaseHistory history) {
return policy.complyWithAll(history);
}
}