URI (Uniform Resource Identifier)
- “리소스를 식별하는 통합된 방법”
- “URI는 로케이터(Locator), 이름(Name) 또는 둘 다 추가로 분류될 수 있다.”
- Uniform : 리소스 식별하는 통일된 방식
- Resource : 자원, URI로 식별할 수 있는 모든 것(제한 없음)
- Identifier : 다른 항목과 구분하는데 필요한 정보
- URL = Uniform Resource Locator
- 리소스가 있는 ‘위치’를 지정
- URN = Uniform Resource Name
- 리소스에 ‘이름’을 부여
- 위치는 변할 수 있지만, 이름은 변하지 않는다.
- URN 이름만으로 실제 리소스를 찾을 수 있는 방법이 보편화 되지 않았음 → 한계가 많다.
- 앞으로 URI를 URL과 같은 의미로 이야기 하겠음
URL 전체 문법
- scheme://[userinfo@]host[:port][/path][?query][#fragment]
- https://www.google.com:443/search?q=hello&hl=ko
- 프로토콜 (https)
- 호스트명 (www.google.com)
- 포트번호 (443)
- 경로 (/search)
- 쿼리 파라미터 (q=hello&hl=ko)
- 쿼리 : 데이터베이스 등에서 원하는 정보를 검색하기 위해 요청하는 것을 말한다. ex) SQL
- 웹에서는 데이터를 GET 요청 방식으로 전송할 때 URL 끝에 쿼리 문자열로 포함되어 전송된다.
URL scheme
- 주로 프로토콜을 사용
- 프로토콜 : 어떤 방식으로 자원에 접근할 것인가 하는 약속 규칙 ex) http, https, ftp…
- http는 80 포트, https 는 443 포트를 주로 사용, 포트는 생략 가능
- https는 http에 보안 추가 (HTTP Secure)
URL userinfo
- URL에 사용자 정보를 포함해서 인증해야 할 때 사용
- 거의 사용하지 않음
URL host
- 호스트명
- 도메인명 또는 IP 주소를 직접 사용 가능
URL PORT
- 포트 (접속포트)
- 일반적으로 생략, 생략 시 http는 80, https는 443
URL path
- 리소스 경로(path), 계층적 구조
- /home/file1.jpg 와 같이 디렉토리처럼 되어 있을 수 있음
URL query
- key = value 형태
- ? 로 시작, & 로 추가 가능 → ?keyA=valueA&keyB=valueB
- query parameter, query string 등으로 불림. 웹 서버에 제공하는 파라미터. 문자형태(숫자도 문자로)
URL fragment
- html 내부 북마크 등에 사용
- 서버에 전송하는 정보 아님
웹브라우저의 요청 흐름
https://www.google.com:443/search?q=hello&hl=ko
1. DNS 조회 + 포트 확인 → IP : 200.200.200.2 / PORT : 443 (생략되어 있어도 됨)
2. HTTP 요청 메세지 생성 → GET /search?q=hello&hl=ko HTTP/1.1
→ Host: www.google.com
3. SOCKET 라이브러리를 통해 전달
- TCP/IP 연결 (IP, PORT)
- 데이터 전달
4. TCP/IP 패킷 생성, HTTP 메세지 포함
5. 서버에서 HTTP 응답 메세지 생성 (HTTP 버전, 타입, 언어, 길이 등..)
6. 서버에서 웹브라우저로 응답패킷 전달 → 도착