- header-field = field-name “:” OWS field-value OWS (OWS : 띄어쓰기 허용)
- field-name은 대소문자 구분 없음
- 용도
- HTTP 전송에 필요한 모든 부가정보
- ex) 메세지 바디의 내용, 메세지 바디의 크기, 압축, 인증, 요청 클라이언트, 서버 정보, 캐시 관리 정보..
- 표준 헤더가 너무 많음
- 필요 시 임의의 헤더 추가 가능
분류
RFC 2616(과거)
- General 헤더 : 메세지 전체에 적용되는 정보 ex) Connection: close
- Request 헤더 : 요청 정보 ex) User-Agent: Mozilla/5.0 (Macintosh; ..)
- Response 헤더 : 응답 정보 ex) Server: Apache
- Entity 헤더 : 엔티티 바디 정보 ex) Content-Type: text/html, Content-Length: 3423
- 메세지 본문(message body)은 엔티티 본문(entity body)을 전달하는데 사용
- 엔티티 본문은 요청이나 응답에서 전달할 실제 데이터
- 엔티티 헤더는 엔티티 본문의 데이터를 해석할 수 있는 정보 제공
- 데이터 유형(html, json), 데이터 길이, 압축 정보 등
- 1999년 RFC 2616 폐기됨
RFC7230 (최신)
- HTTP 표준 : 2014년 RFC 7230~7235 등장
- RFC723x 변화
- 엔티티(Entity) → 표현(Representation)
- Representation = representation Metadata + Representation Data
- 표현 = 표현 메타데이터 + 표현 데이터
- RFC723x 변화
- 메세지 본문(message body)을 통해 표현 데이터 전달
- 메세지 본문 = 페이로드(payload)
- 표현 : 요청이나 응답에서 전달할 실제 데이터
- 표현 헤더는 표현 데이터를 해석할 수 있는 정보 제공
- 데이터 유형(html, json), 데이터 길이, 압축 정보 등
- 참고 : 표현 헤더는 표현 메타데이터와, 페이로드 메세지를 구분해야하지만.. 여기서는 생략
표현
- Content-Type : 표현 데이터의 형식
- Content-Encoding : 표현 데이터의 압축 방식
- Content-Language : 표현 데이터의 자연 언어
- Content-Length : 표현 데이터의 길이
Content-Type
- 표현 데이터의 형식 설명
- 미디어 타입, 문자 인코딩
- ex)
- text/html; charset=utf-8
- application/json
- image/png
Content-Encoding
- 표현 데이터를 압축하기 위해 사용
- 데이터를 전달하는 곳에서 압축 후 인코딩 헤더 추가
- 데이터를 읽는 쪽에서 인코딩 헤더의 정보로 압축 해제
- ex)
- gzip
- deflate
- identity (= 압축 안함)
Content-Language
- 표현 데이터의 자연 언어를 표현
- ex)
- ko
- en
- en-US
Content-Length
- 표현 데이터의 길이
- 바이트 단위
- Transfer-Encoding(전송 코딩)을 사용하면 Content-Length를 사용하면 안됨
협상 (Content Negotiation)
- 클라이언트가 선호하는 표현 요청 (최대한 가능하다면 주세요~ 요구)
- Accept : 클라이언트가 선호하는 미디어 타입 전달
- Accept-Charset : 클라이언트가 선호하는 문자 인코딩
- Accept-Encoding : 클라이언트가 선호하는 압축 인코딩
- Accept-Language : 클라이언트가 선호하는 자연 언어
- 협상 헤더는 요청 시에만 사용
협상과 우선순위
- Quality Values(q) 값 사용
- 0~1, 클수록 높은 우선순위
- 생략하면 1
- Accept-Language: ko-KR,ko;q=0.9,en-US;q=0.8,en;q=0.7
- ko-KR;q=1 (q생략)
- ko;q=0.9
- en-US;q=0.8
- en;q=0.7
- 구체적인 것이 우선한다.
- Accept: text/*, text/plain, text/plain;format=flowed, /
- text/plain;format=flowed
- text/plain
- text/*
- /
- 구체적인 것을 기준으로 미디어 타입을 맞춘다.
- Accept : text/*;q=0.3, text/html;q=0.7, text/html;level=1,
- text/html;level=2**;q=0.4, /*;q=0.5
전송방식
- 단순 전송 (Content-Length)
- 메세지 바디에 대한 Content 길이를 알 때 한 번에 요청하고 한 번에 받는 것
- 압축 전송 (Content-Encoding)
- 서버에서 압축(ex) gzip)을 해서 전송(Content-Encoding 포함되어야 한다)
- 분할 전송 (Transfer-Encoding)
- 바이트 별로 나눠서 전송 (용량이 커서 한 번에 보내기 어려울 때)
- 범위 전송 (Range, Content-Range)
- 중간에 끊긴다면? 다시 요청하여 처음부터 다시 보내기 → 용량이 아까움
- 이미 ~만큼 받았으니 ~범위 만큼 요청
일반 정보
- From
- 유저 에이전트의 이메일 정보
- 일반적으로 잘 사용되지 않음
- 검색 엔진 같은 곳에서 주로 사용
- 요청에서 사용
- Referer
- 이전 웹 페이지 주소
- 현재 요청된 페이지의 이전 웹 페이지 주소
- A → B로 이동하는 경우 B를 요청할 때 Refer: A 를 포함해서 요청
- Referer를 사용해서 유입 경로 분석 가능
- 요청에서 사용
- 참고 : referer는 단어 referrer의 오타.. → 예전에 실수로 지정한 것이 현재까지 이어짐
- User-Agent
- user-agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/ 537.36 (KHTML, like Gecko) Chrome/86.0.4240.183 Safari/537.36
- 클라이언트의 애플리케이션 정보(웹 브라우저 정보 등)
- 통계 정보
- 어떤 종류의 브라우저에서 장애가 발생하는지 파악 가능
- 요청에서 사용
- Server
- 요청을 처리하는 ORIGIN 서버의 소프트웨어 정보
- Server: Apache/2.2.22 (Debian)
- server: nginx
- 응답에서 사용
- Date
- 메세지가 발생한 날짜와 시간
- Date: Tue, 15 Nov 1994 08:12:31 GMT
- 응답에서 사용
특별한 정보
Host
- 요청한 호스트 정보(도메인)
- 요청에서 사용
- 필수
- 하나의 서버가 여러 도메인을 처리해야 할 때
- 하나의 IP 주소에 여러 도메인이 적용되어 있을 때
Location
- Page Redirection
- 웹 브라우저는 3xx 응답의 결과에 Location 헤더가 있으면 Location 위치로 자동 이동 (Redirect)
- 응답코드 3xx에서 설명
- 201 (Created) : Location 값은 요청에 의해 생성된 리소스 URI
- 3xx (Redirection) : Location 값은 요청을 자동으로 Redirection 하기 위한 대상 리소스를 가리킴
Allow
- 허용 가능한 HTTP 메서드
- 405 (Method Not Allowed) 에서 응답에 포함해야 함
- ex) Allow: GET, HEAD, PUT → POST 지원을 안하는 구나~
Retry-After
- 유저 에이전트가 다음 요청을 하기까지 기다려야 하는 시간
- 503 (Service Unavailable) : 서비스가 언제까지 불능인지 알려줄 수 있음
- Retry-After: Fri, 31 Dec 1999 23:59:59 GMT (날짜 표기)
- Retry-After: 120 (초단위 표기)
인증
- Authorization
- 클라이언트 인증 정보를 서버에 전달
- Authoriztion: Basic xxxxxxxxxxxxxxxx
- WWW-Authenticate
- 리소스 접근 시 필요한 인증 방법 정의
- 401 Unauthorized 응답과 함께 사용
- WWW-Authenticate: Newauth realm=”apps”, type=1,
- title=”Login to \\”apps\\””, Basic realm=”simple”
쿠키
- Set-Cookie : 서버에서 클라이언트로 쿠키 전달(응답)
- Cookie : 클라이언트가 서버에서 받은 쿠키를 저장하고, HTTP 요청 시 서버로 전달
- HTTP는 무상태(Stateless) 프로토콜이다.
- 클라이언트와 서버가 요청과 응답을 주고 받으면 연결이 끊어진다.
- 클라이언트가 다시 요청하면 서버는 이전 요청을 기억하지 못한다. → 쿠키 미사용 시..
- 클라이언트와 서버는 서로 상태를 유지하지 않는다. → 쿠키가 꼭 필요하다!
- 대안 : 모든 요청에 사용자 정보를 포함할 수 있지 않을까?
- 모든 요청과 링크에 사용자 정보를 포함해야한다..
- 보안적으로도 문제가 있고 여러 문제점이 발생한다.
- 브라우저를 완전히 종료하고 다시 열면?
- → 쿠키라는 개념이 도입된다.
1. 웹브라우저가 POST로 로그인
2. 서버는 Set-Cookie를 통해 정보를 웹 브라우저 내부의 쿠키 저장소에 저장
3. 로그인 이후에 웹 브라우저가 요청을 보낼 때마다 무조건 쿠키 저장소를 뒤진다.
→ 서버에 요청을 보낼 때마다 쿠키 값을 무조건 꺼내서 헤더를 만들어서 서버에 보낸다.
- 모든 요청에 쿠키 정보를 자동으로 포함한다.
- 그러나.. 정말 모든 곳에 다 쿠키 정보를 보낸다면? 보안상 문제도 있고 여러 문제점이 발생한다.
- ex) set-cookie: sessionId=abcde1234; expires=Sat, 26-Dec-2020 00:00:00 GMT; path=/;
- domain=.google.com; Secure
- 사용처
- 사용자 로그인 세션 관리
- 광고 정보 트래킹
- 쿠키 정보는 항상 서버에 전송됨
- 네트워크 트래픽 추가 유발
- 최소한의 정보만 사용 (세션 id, 인증 토큰)
- 서버에 전송하지 않고, 필요할 때만 웹 브라우저 내부에 데이터를 저장하고 싶으면 웹 스토리지
- (localStorage, sessionStorage) 참고
- 주의!
- 보안에 민감한 데이터는 저장하면 안됨(주민번호, 신용카드 번호 등)
생명주기
- Expires, max-age
- Set-Cookie: expires=Sat, 26-Dec-2020 04:39:21 GMT
- 만료일이 되면 쿠키 삭제
- Set-Cookie: max-age=3600 (3600초)
- 0이나 음수를 지정하면 쿠키 삭제
- 세션 쿠키 : 만료 날짜를 생략하면 브라우저 종료 시 까지만 유지
- 영속 쿠키 : 만료 날짜를 입력하면 해당 날짜까지 유지
도메인 (Domain)
- ex) domain=example.org
- 명시 : 명시한 문서 기준 도메인 + 서브 도메인 포함
- domain=example.org를 지정해서 쿠키 생성
- example.org는 물론이고 dev.example.org도 쿠키 접근
- 생략 : 현재 문서 기준 도메인만 적용
- example.org 에서 쿠키를 생성하고 domain 지정을 생략
- example.org 에서만 쿠키 접근
- dev.example.org는 쿠키 미접근
경로 (Path)
- ex) path=/home
- 이 경로를 포함한 하위 경로 페이지만 쿠키 접근
- 일반적으로 path=/ 루트로 지정
- ex)
- path=/home 지정
- /home → 가능
- /home/level1 → 가능
- /home/level1/level2 → 가능
- /hello → 불가능
보안 (Secure, HttpOnly, SameSite)
- Secure
- 쿠키는 http, https를 구분하지 않고 전송
- Secure를 적용하면 https인 경우에만 전송
- HttpOnly
- XSS 공격 방지
- 자바스크립트에서 접근 불가(document cookie)
- HTTP 전송에만 사용
- SameSite
- XSRF 공격 방지
- 요청 도메인과 쿠키에 설정된 도메인이 같은 경우만 쿠키 전송