기타 덩덩/늘어나라 테크 지식

[모든 개발자를 위한 HTTP 웹 기본 지식 - 김영한] 세션8 HTTP 헤더2 - 캐시와 조건부 요청

stop-zero 2023. 10. 4. 02:25

캐시 기본 동작

요청하면 응답 http를 보면 헤더와 바디가 합쳐져서 1.1m 용량 보내짐. 

  • 같은 데이터라도 계속 네트워크로 데이터를 다운받아야 한다.
  • 인터넷 네트워크는 매우 느리고 비싸다.
  • 브라우저 로딩 속도가 느리다. 

 

캐시 적용 - 첫 번째 요청

헤더에 캐시가 유효한 시간을 넣어주면 60초동안은 캐시가 유효한다. 이는 브라우저 캐시에 저장된다.

 

두 번째 요청

두 번째 요청 때 캐시에 저장되어 있고 60초가 유효하다면 캐시에서 바로 가져온다. 

  • 비싼 네트워크 사용X
  • 비싼 네트워크 사용량 감소
  • 빠른 브라우저 로딩 속도

 

세 번째 요청 - 캐시 시간 초과

캐시 유효 시간이 지나면 네트워크를 사용해 다시 조회하고 캐시를 갱신한다. 이때 다시 네트워크 다운로드가 발생한다.

 

검증 헤더와 조건부 요청1

캐시 시간 초과

1. 서버에서 기존 데이터 변경

2. 서버에서 기존 데이터를 변경하지 않는다.

=> 데이터를 전송하는 대신 저장해 두었던 캐시를 재사용한다. 단 요청한 데이터와 서버의 데이터가 같은 데이터인지 확인해야 한다.

 

검증 헤더 추가 - 첫 번째 요청

헤더에 데이터가 마지막에 수정된 시간을 넣는다. 응답 결과를 캐시에 저장하고 데이터 최종 수정일을 기록한다.  

 

검증 헤더 추가 - 두 번째 요청

캐시 시간이 초과된 상태에서 서버에 요청을 보낼 때 요청 헤더와 데이터 최종 수정일을 보낸다면, 서버에서 데이터가 수정되지 않은 것을 검증한다. 서버는 수정된 게 없다는 Not Modified 와 HTTP 헤더만 전송한다. 캐시를 다시 세팅하고 사용하게 된다. 결과적으로 네트워크 다운로드가 발생하지만 용량이 적은 헤더 정보만 다운로드 하기에 매우 실용적이다. 

 

검증 헤더와 조건부 요청2

검증 헤더 

  • 캐시 데이터와 서버 데이터가 같은지 검증
  • Last-Modified, ETag

 

조건부 요청 헤더

  • 검증 헤더로 조건에 따른 분기
  • If-modified-Since : Last-Modified 사용
  • If-None-Match : ETag 사용 
  • 조건이 만족하면 200 OK
  • 조건이 만족하지 않으면 304 Not Modified

 

Last-Modified, If-Modified-Since 단점

  • 1초 미만 단위로 캐시 조정 불가능
  • 날짜 기반의 로직 사용
  • 데이터를 수정해서 날짜가 다르지만, 같은 데이터를 수정해서 데이터 결과가 똑같은 경우 => 원본은 똑같은 경우
  • 서버에서 별도의 캐시 로직을 관리하고 싶은 경우(ex. 스페이스나 주석처럼 크게 영향이 없는 변경에서 캐시를 유지하고 싶은 경우)

 

ETag(Entity Tag), If-None-Match

  • 캐시용 데이터에 임의의 고유한 버전 이름을 달아둠
    • ex. ETag : v1.0 , ETag : a2jiodwjekl3
  • 데이터가 변경되면 이 이름을 바꾸어서 변경함 (Hash 재생성)
    • ex. ETag : aaaaa, ETag : bbbbb
  • 진짜 단순하게 ETag만 보내서 같으면 유지, 다르면 다시 받기

ETag(Entity Tag), If-None-Match 정리

  • ETag 같으면 유지 다르면 다시!
  • 캐시 제어 로직을 서버에서 관리
  • 클라이언트는 단순히 값을 서버에 제공(클라이언트는캐시 메커니즘 모름)
    • 서버는 배타 오프 기간인 3일동안 파일이 변경되어도 ETag를 동일하게 유지
    • 애플리케이션 배포 주기에 맞춰 ETag 모두 갱신

 

캐시와 조건부 요청 헤더

캐시 제어 헤더

Cache-Control : 캐시 제어

  • Cache-Control : max-age
    • 캐시 유효 시간, 초 단위
  • Cache-Control : no-cache
    • 데이터는 캐시해도 되지만, 항상 원(origin) 서버에 검증하고 사용
  • Cache-Control : no-store
    • 데이터에 민감한 정보가 있으므로 저장하면 안됨(메모리에서 사용하고 최대한 빨리 삭제)

Pragma : 캐시 제어(하위 호환)

  • Pragma : no-cache
  • HTTP 1.0 하위 호환

Expires : 캐시 유효 기간(하위 호환)

  • expires : Mon, 01 Jan 1990 00:00:00 GMT
  • 캐시 만료일을 정확한 날짜로 지정
  • HTTP 1.0부터 사용
  • 지금은 더 유연한 Cache-Control : max-age 권장
  • Cache-Control : max-age 와 함께 사용하면 Expires 는 무시

 

검증 헤더와 조건부 요청 헤더

검증 헤더(Validator)

  • ETag : v1.0 ETag : asid93hkrh2I
  • Last-Modified : Thu, 04 Jun 2020 07:19:24 GMT

조건부 요청 헤더

  • If-Match, If-None-Match : ETag 값 사용
  • If-Modified-Since, If-Unmodified-Since : Last Modified 값 사용

 

프록시 캐시

한국에서 미국까지 가려면 0.5초 걸린다 생각하자. 프록시 캐시를 도입하면 빠른 응답을 받을 수 있다. 유튜브에서 사람들이 많이 보는 걸 보면 로딩 속도가 빠른 이유이다. 

 

Cach-Control 캐시 지시어(directives) - 기타 (이런 거 있다 정도)

  • Cache-Control : public
    • 응답이 public 캐시에 저장되어도 됨
  • Cache-Control : private
    • 응답이 해당 사용자만을 위한 것, private 캐시에 저장해야 함 (기본값)
  • Cache-Control : s-maxage
    • 프록시 캐이세만 적용되는 max-age
  • Age: 60(HTTP 헤더)
    • 오리진 서버에서 응답 후 프록시 캐시 내에 머문 시간(초)

 

캐시 무효화

Cache-Control, 확실한 캐시 무효화 응답

캐시를 적용안하면 되는 거 아닌가요?

No, 웹 브라우저가 임의로 Get 요청인 경우에는 캐시를 해버리게 된다. 그러니 통장 잔고와 같은 것들에는 무효화처리를 해야 한다.

  • Cache-Control : no-cache, no-store, must-revalidate
  • Pragma : no-cache
    • HTTP 1.0 하위 호환

 

캐시 지시어 - 확실한 캐시 무효화

  • Cache-Control : no-cache
    • 데이터는 캐시해도 되지만, 항상 원(origin) 서버에 검증하고 사용(이름에 주의!)
  • Cache-Control : no-store
    • 데이터에 민감한 정보가 있으므로 저장하면 안됨(메모리에서 사용하고 최대한 빨리 삭제)
  • Cache-Control : must-revalidate
    • 캐시 만료후 최초 조회시 원 서버에 검증
    • 원 서버 접근 실패시 반드시 오류 발생 - 504(Gateway Timeout)
    • must-ravalidate는 캐시 유효 시간이라면 캐시 사용
  • Pragma : no-cache
    • HTTP 1.0 하위 호환

 

 

no-cache

순간적으로 네트워크가 단절된다면 프록시 캐시는 오류보다는 오래된 데이터를 보내준다. 

must-revalidate

네트워크 단절이라 원 서버 접근 불가라면 504 Gateway Timeout, 통장 잔고가 옛날 게 보이는 것보다. 오류가 낫다.