원티드 프리온보딩 2024.03 :: AWS를 활용한 시스템 아키텍쳐 설계 (1)

태그

DevOps

Backend

Database

3 more properties

Agenda

Index

좋은 아키텍쳐란? 

Monolithic server :: 서버가 하나일 때

RDS scailing

EC2 scailing

Cache

CDN

Serverless

•

보안

1. 좋은 아키텍쳐란?

서비스 운영 방식에 적합한 아키텍쳐

개발자가 생각하기에 “이거 무조건 해야돼요”

사용자가 서비스를 사용하는데 bottleneck이 발생하지 않는 아키텍쳐

일반적인 케이스

엔지니어링 관점에서 이런 것들을 고려해서 서비스를 안정적으로 운영할 수 있음

케이스에 따라 그렇지 않은 경우도 있음

초기단계에서 굳이 Auto Scailing을 해야하는지

2. Monolithic Server :: 서버가 하나일 때

•

api.server.com으로 요청을 보낸다면?

DNS에 주소를 날리면 아이피 주소를 반환한다. 
(브라우저 → 주소 → DNS → IP주소 → 브라우저)

브라우저는 IP주소를 가지고 서버에 접속한다.

서버는 요청에 대한 response를 반환한다. 

서버는 DB에 Read, Write, Update를 요청하고 DB는 Data를 반환한다. 

위 구조를 AWS 용어로 보자면?

Route53에 주소를 날리면 아이피 주소를 반환한다. 
(브라우저 → 주소 → DNS → IP주소 → 브라우저)

브라우저는 IP주소를 가지고 EC2에 접속한다.

EC2는 요청에 대한 response를 반환한다. 

EC2는 RDS에 Read, Write, Update를 요청하고 RDS는 Data를 반환한다. 

이 때, EC2와 RDS는 같은 VPC(가상 프라이빗 클라우드 :: Virtual Private Cloud)안에 속한다.

RDS는 VPC외부의 접속이 차단되고, 같은 VPC에 속한 EC2를 통해서만 접속 가능하다.

더 안정적인 서비스를 위해서라면? (베스천 :: bastion) → 브라우저와 통신하는 EC2와 RDS사이에 서버를 하나 더 두고, 새로운 서버만 RDS에 접속할 수 있게 설정한다.

Route 53

DNS 서비스 

도메인 구입 및 관리

도메인 Routing Policy

NS - 네임서버

특정 도메인의 DNS 서버

도메인을 IP주소로 redirect 시키는 역할

“일반적으로 도메인 등록 업체”에 가까움

GoDabby에서 구입한 도메인을 AWS에서 관리할 수도 있음

ii.

도메인 설정에서 NS를 AWS에서 지정한 곳으로 옮김

SOA - Start Of Authrity

도메인 관련 주요 정보

이론상으로는 primary name server, 도메인 관리자 이메일, 시리얼 넘버 등등 정보

TXT - Text

도메인 권한 확인할 때 많이 사용

A - Address

IP주소 입력해서 Routing

CNAME - Canonical Name

도메인 이름을 활용해서 Routing

MX - Mail Exchange

이메일 활용

도메인 이전 (NS 변경)

도메인 구입 업체(?)에서 기관 이전이 가능하도록 해야함

업체는 계속해서 돈을 벌고싶기 때문에 아마 막아놨음

3. RDS scailing

Scailing을 고려한 Database 선택

RDS

Relational Database Service, 관계형 데이터베이스 서비스

PostgreSQL, MySQL, MariaDB

NoSQL

비정형 테이블

DocumentDB(MongoDB), DynamoDB

서비스를 처음 만들 때

관계형 DB로 많이 시작

레퍼런스가 많다. 

많은 시니어들이 관계형 DB에 익숙해서(최적화)경험이 더 많다.

무료 - 비용측면에서 매우 유리

RDS는 무료가 아니다. MySQL이 무료 라이센스라는 의미.

ii.

EC2 + RDS 구조보다 EC2 < Docker : MySQL이 더 저렴하다.

서비스의 규모가 커진다면?

Join이 많이 발생하면 관계형 DB는 느려진다.

데이터 양이 많아지면 더 느려짐.

이런 경우 NoSQL 도입을 고려하게 된다.

AWS는 대부분 DynamoDB

ii.

물론 서비스의 특성에 따라서 NoSQL로 시작할 수도 있다.

iii.

Meta의 ‘Threath' 

•

데이터의 유형이나 양에 따라서 관계형 DB와 NoSQL 중 선택하는게 올바르다.

Scale Up vs Scale Out

유형	설명
Scale Up	머신의 성능을 올린다. (사이즈를 키운다.)
Scale Out	같은 머신을 늘린다.

AWS의 경우 large와 xlarge의 cpu, memory, 가격 모두 정확히 2배이다.

그러나, Scale Out은 머신의 개수를 늘리기 때문에 요청을 n개 처리할 수 있다.

관리의 측면에선 Scale Up이 물리적인 성능을 높이기 때문에 편해서 서로의 특성을 고려하여 선택하면 된다.

RDS의 Scale Up

성능이 더 좋은 장비를 구입

AWS 콘솔에서 버튼 클릭

RDS의 Scale Out - READ Replica

READ만 가능한 복제본을 만드는 것

서버로 동시에 여러 클라이언트가 요청을 보내면

서버는 여러 DB에 READ query를 날릴 수 있음

요청이 몰려서 DB가 느려지거나, 터지는 것을 방지할 수 있음

WRITE는 Replicate 하지 않음

WRITE는 여러 인스턴스에서 발생하면 데이터 복제가 복잡해짐

WRITE는 하나만 할 수 있고, READ는 복제된 데이터를 여러곳에서 가져올 수 있도록

Multi-Write를 바탕으로 구현된 DB도 있다.

서비스의 특성에 따라 다름

WRITE DB가 죽으면?

READ DB중 하나가 WRITE DB로 대체

WRITE DB의 Stand by DB를 가지고 있음

Add reader - Replica를 개발자가 추가

Add replica auto scaling

AWS가 manage하면서 자동으로 scale Out

필요 시 인스턴스 늘리고

필요 없어지면 줄이는 방식

•

샤딩과의 차이점

유형
Replica	데이터가 같은 DB를 복사
Sharding	DB가 각각 다른 데이터를 가짐

RDS Scale Out - Connection Pooling

connection을 미리 여러개 생성해두고 활용하는 방식 

AWS RDS Proxy 사용 가능

Idle Timeout

Max Connection

Subnet

connection Pool은 AWS RDS보다 어플리케이션 단에서 처리하는게 일반적

비용문제

개발자가 코드로 관리하는게 유리할 것 같다는 의견

DynamoDB Scale Up

Capacity 변경 가능

DynamoDB Scale Out

Partition Key를 활용한 자동 Partitioning

걱정할 것 없음

Serverless - 비용 매우 저렴

개인 프로젝트도 가급적 DynamoDB 추천 의견

개인 프로젝트에 RDS 사용하면 수십만원의 비용이 발생할 수도 있음

4. EC2 scailing

scailing을 고려한 서버 선택

EC2도 RDS와 유사하게 Scale Up/Out 가능

Scale Up은 RDS와 유사하게 더 큰 사이즈의 인스턴스를 선택 

Scale Out은 Load Balancer가 필요

Load Balancer

단어 그대로 Load를 Balance하는 역할

클라이언트는 로드밸런서로 요청을 보내고, 로드밸런서가 요청을 서버로 분산

EC2 헬스 체크

SSL 인증서 적용

High availability (왠만한 문제가 발생하더라도 서비스에 문제가 발생하지 않도록 AWS가 처리한다.

ALB, NLB

CLB도 있는데, 이제 사용하지 않음

ii.

ALB (Application Layer Load Balancer) - HTTP/HTTPS, WebSocket 

iii.

NLB - TCP, TLS, UDP

iv.

EC2는 주로 ALB와 사용한다.

ALB 설정 

VPC 설정 후 Target Group을 지정한다. 

ii.

EC2 Security Group 

ALB에서 EC2에 접근할 수 있도록 설정 필요

클라이언트에서 오는 요청을 직접 받을 필요가 없음

Ingress 요청을 ALB가 처리한다. 

+ 보안그룹과 서브넷의 차이점

Security Group	외부의 접근을 제어
Subnet	내부의 접근을 제어

5. Cache

DB Cache

Read가 빈번한 경우 Cache에 저장

DB에 가지 않고 데이터를 가져올 수 있음

Cache에 데이터가 있으면 바로 Read

ii.

Cache에 데이터가 없으면 DB 접근

iii.

Server  Cache  DB

하지만, Cache를 사용하는 것도 비용

Cache Instance 비용

개발 유지보수 비용

latency를 줄이는것이 서비스 운영에 얼마나 중요한지를 고려해야함 :: “캐시를 꼭 써야하나?”

업데이트 주기도 고려해야 한다.

DB는 업데이트 됐는데, Cache는 예전 데이터를 가지고 있다면?

Expiration 정책을 활용하거나, sync를 자주 해줘야한다.

서비스 운영 방식에 따라 다르게 고려해야한다. 

AWS Cache

Elastic Cache

AWS DynamoDB Accelerator

DynamoDB에 붙여서 사용 - READ 10배 빠름

CloudFront - CDN

Content Delivery Network

static한 것들을 빠르게 가져올 수 있도록

ii.

주로 이미지나 영상 

6. CDN

AWS CloudFront

다른 서비스들과 다르게 Region이 Global

Route 53도 Global이다.

Edge Location 활용

AWS 자체적으로 데이터를 여러군데 흩뿌려줌

여러 Data Center에 caching해서 latency를 줄임

S3 연동 시 bucket policy 변경

CloudFront에서 접근할 수 있도록 설정해주어야 CDN 활용 가능

CloudFront 생성 시 S3 연결하면, 복사할 수 있는 Policy 제공

안정적인 서비스의 인프라 구성

사용자는 CloudFront(CDN)을 통해서 이미지나 영상(static한 데이터) 접근

서버와 DB가 통해서 데이터를 받을 때는 Write와 Read DB를 분리해놓는다. (데이터 정합성을 위하여 Write는 하나로 구성하는게 유리하다. → 인스타그램처럼 사용자가 너~무 많으면 Write도 분리해야 할 수도 있다.)

Elastic Cache도 사용하면서 조회가 빈번한 데이터는 DB를 거치지 않게끔 설계 

7. Serverless

* 보안

1) Stateful

상태를 기억하는 것

과거에 어떤 클라이언트가 요청을 보냈는지 

Problem :

•

Load Balancer가 세션을 관리하지 않는 서버로 요청을 전달하면?

→ 해당 서버는 사용자의 인증정보를 알 수 없기 때문에 문제가 발생한다.

Solution :: Sticky Session

Load Balancer가 클라이언트가 요청을 보낸 서버를 기억하는 것

만약 이전에 요청을 처리한 서버가 죽었다면?

사용자는 인증을 다시 한다.

죽은 서버가 살아날 때까지 기다린다.

Sticky Session 설정 방법

Cloud Formation에서 yml설정으로 배포 

ELB 생성할 때 configuration

2) Stateless

각각의 요청이 분리됨

모든 서버가 클라이언트의 요청을 처리할 수 있음

로드밸런서의 오버헤드 감소 

latency 감소

Bastion Host(배스천 호스트) 란?

클라우드에 보안을 위한 내/외부 게이트 호스트

https://harris91.vercel.app/bastion-host