URL là gì? Cấu trúc của URL

Cùng với osuairportpart150.com tìm hiểu về URL là gì? Cấu trúc của URL

lúc duyệt web bạn cứng cáp hẳn bạn đã nghe nói về URL (đọc tiếng Anh nôm na là iu a eo) nhưng chính xác URL là gì, cấu trúc URL như thế nào và thành phần ra sao? Bài viết này sẽ cung cấp cho bạn tầm nhìn tổng quan về URL và cấu trúc của nó.

URL là gì?

URL là viết tắt của Uniform Resource Locator, dịch sang tiếng Việt là định vị tài nguyên thống nhất. Cụ thể, URL là địa chỉ của một tài nguyên duy nhất trên Web. Mỗi URL hợp lệ sẽ trỏ tới một tài nguyên duy nhất, tài nguyên đó sở hữu thể là trang HTML, tài liệu CSS, hình ảnh, video, file PDF… Trong một số trường hợp ngoại lệ, URL sở hữu thể trỏ tới những tài nguyên ko còn tồn tại hoặc đã bị di chuyển sang địa chỉ khác (moved).

URL sở hữu thể chứa nhiều thành phần khác nhau. Nó bao gồm hostname (tên máy) ánh xạ tới địa chỉ IP của một tài nguyên cụ thể trên Internet và một loạt những thông tin bổ sung thông báo cho trình duyệt và máy chủ biết cách xử lý mọi thứ. Bạn sở hữu thể nghĩ địa chỉ IP như số điện thoại, hostname như tên của người sở hữu số điện thoại đó mà bạn muốn tra cứu. Và một tiêu chuẩn được gọi là Hệ thống tên miền (Domain Name System – DNS) hoạt động trong nền tương tự một cuốn danh bạ điện thoại, dịch những hostname thành địa chỉ IP để mạng sử dụng để định tuyến lưu lượng truy cập.

Cấu trúc của URL

Cấu trúc URL lần đầu được xác định vào năm 1994 bởi Sir Tim Berners-Lee, người đã tạo ra web và trình duyệt lần thứ nhất. Về cơ bản, URL kết hợp tên miền với việc sử dụng đường dẫn file để xác định cấu trúc file và thư mục cụ thể. Vì vậy, nó tương tự như sử dụng đường dẫn C:DocumentsPersonalmyfile.txt trong Windows, nhưng thêm một số thứ ở đầu để sở hữu thể tìm đúng máy chủ trên Internet nơi chứa đường dẫn đó và sử dụng giao thức để truy cập thông tin.

URL chứa một vài đường dẫn khác. Ví dụ, bên dưới là hình ảnh một URL cơ bản, hãy cùng phân tích cấu trúc của nó.

Cấu trúc URL cơ bản

URL đơn thuần này được chia thành hai thành phần chính: Scheme (giao thức kết nối) và Authotiry (nhà cung cấp).

Scheme

Rất nhiều người nghĩ rằng URL như một địa chỉ web nhưng nó ko hoàn toàn đơn thuần như vậy. Một địa chỉ web là URL nhưng tất cả URL ko phải là địa chỉ web. những dịch vụ khác bạn sở hữu thể truy cập trên Internet như FTP hoặc thậm chí MAILTO cũng là URL. Phần Scheme của URL (những chữ loại theo sau dấu hai chấm) biểu thị giao thức mà ứng dụng (như trình duyệt web) và máy chủ giao tiếp.

những địa chỉ web là URL phổ biến nhất, tuy nhiên còn sở hữu những URL khác nữa. Do đó, bạn sẽ thấy những Scheme như:

  • Giao thức truyền tải siêu văn bản (HTTP): Đây là giao thức cơ bản của web, xác định hành động của những máy chủ web và trình duyệt cần thực hiện để đạt được ý muốn những lệnh nhất định.
  • Giao thức HTTP an toàn (HTTPS): Đây là một dạng HTTP hoạt động trên một lớp bảo mật, được mã hóa để truyền tải thông tin an toàn hơn.
  • Giao thức truyền tập tin (File Transfer Protocol – FTP): Giao thức này thường được sử dụng để truyền file qua Internet.

Trong những trình duyệt tiên tiến, về mặt kỹ thuật Scheme ko nhất thiết là một phần của URL. Nếu bạn nhập trang web như www.osuairportpart150.com, trình duyệt sẽ tự động xác định giao thức phù hợp để sử dụng. Tuy nhiên, một số ứng dụng khác (và giao thức) lại yêu cầu sử dụng scheme.

Authority

Phần Authority của một URL (phần bắt đầu sau hai dấu gạch chéo) được chia thành những phần nhỏ. Hãy bắt đầu với một URL đơn thuần, thường là URL dẫn bạn tới trang chủ của một trang web.

Thành phần của Authority

Trong ví dụ đơn thuần này, toàn bộ phần “www.example.com” được gọi là hostname và sở hữu nhiệm vụ lấy một địa chỉ IP. Nếu biết địa chỉ IP, bạn sở hữu thể gõ nó vào thanh địa chỉ trình duyệt thay vì hostname.

Đây là một số thành phần của nó:

  • Tên miền cấp cao nhất: Trong ví dụ ở đây, “com” là tên miền cấp cao nhất. Đây là mức cao nhất trong hệ thống tên miền phân cấp được sử dụng để dịch địa chỉ IP thành địa chỉ tiếng nói đơn thuần, dễ nhớ. Những tên miền cấp cao nhất này được Tập đoàn Internet cấp số và tên miền (ICANN) tạo và quản lý. sở hữu ba tên miền cấp cao nhất phổ biến là .com., .net, .gov. Hầu hết những quốc gia đều sở hữu trên miền cấp cao nhất gồm hai chữ loại, bạn sẽ thấy tên miền như .us (Mỹ), .vn (Việt Nam), .ca (Canada), v.v… sở hữu một số tên miền cấp cao nhất bổ sung (như .museum) được những tổ chức cá nhân tài trợ và quản lý. Ngoài ra, cũng sở hữu một số tên miền cấp cao nhất tiêu dùng chung như.club, .life và .news.
  • Tên miền phụ (Subdomain): Vì DNS là một hệ thống phân cấp, cả hai phần “www” và “example” của URL ví dụ trên được xem là tên miền phụ. Phần “www” là tên miền phụ của tên miền cấp cao nhất “com” và phần “www” là tên miền phụ của tên miền “example”. Đó là nguyên nhân tại sao bạn thấy nhà hàng sở hữu tên đăng ký như “google.com” được chia thành những tên miền phụ như “www.google.com”, “news.google.com”, “mail.google.com”, v.v…

Đây là ví dụ cơ bản nhất về phần Authority của URL, những URL khác sở hữu thể phức tạp hơn. sở hữu hai thành phần khác trong phần Authority:

  • Thông tin người tiêu dùng: Phần Authority cũng sở hữu thể chứa tên người tiêu dùng và mật khẩu của trang web bạn đang truy cập. Ngày nay, bạn sở hữu thể ít bắt gặp cấu trúc URL này. Phần thông tin người tiêu dùng ở trước tên máy chủ và nó theo sau bởi dấu @. Ví dụ, bạn sở hữu thể thấy một URL bao gồm thông tin người tiêu dùng như sau:
//username:[email protected]
  • Số cổng: Thiết bị mạng sử dụng địa chỉ IP để nhận thông tin tới máy tính phù hợp trên mạng. lúc lưu lượng truy cập tới, số cổng thông báo với máy tính biết ứng dụng mà lưu lượng truy cập đó đang nhắm tới. Bạn thường ko thấy số cổng lúc lướt web, nhưng sở hữu thể thấy nó trong những ứng dụng mạng như trò chơi yêu cầu nhập URL. Nếu URL chứa số cổng, nó xuất hiện ở sau tên máy chủ và trước dấu hai chấm. Bạn sẽ thấy nó trông tương tự này:
//www.example.com:8080

Thành phần bổ sung của URL

sở hữu ba phần bổ sung của URL mà bạn sở hữu thể thấy sau phần Authority: đường dẫn, truy vấn và phân mảnh.

Đường dẫn (path)

Phần Authority của URL đưa trình duyệt (hoặc những ứng dụng khác) tới đúng máy chủ trên mạng. Đường dẫn (hoạt động như đường dẫn trong Windows, macOS hoặc Linux) đưa bạn tới đúng thư mục hoặc file trên máy chủ đó. Đường dẫn được bắt đầu bằng dấu gạch chéo và sở hữu những dấu gạch chéo giữa những thư mục và thư mục con như sau:

www.example.com/folder/subfolder/filename.html

Phần cuối cùng là tên file sẽ được mở lúc truy cập vào trang web. Mặc dù sở hữu thể bạn ko thấy đường dẫn này trên thanh địa chỉ, nhưng điều đó ko sở hữu nghĩa là nó ko sở hữu. Một vài tiếng nói được sử dụng để tạo trang web ẩn tên và phần phát triển thêm của file để người tiêu dùng dễ nhớ và gõ URL hơn.

Truy vấn (query)

Phần truy vấn của một URL được sử dụng để xác định những thứ ko phải là thành phần của một cấu trúc đường dẫn cố định. Thông thường, bạn sẽ thấy chúng được sử dụng để thực hiện tìm kiếm hoặc lúc trang web phân phối dữ liệu thông qua biểu mẫu. Phần truy vấn này được bắt đầu bằng dấu hỏi chấm và theo sau đường dẫn (hoặc sau tên máy chủ nếu ko sở hữu đường dẫn).

Ví dụ, dưới đây là URL lúc thực hiện tìm kiếm “wi-fi extender” trên trang Amazon.

https://www.amazon.com/s/ref=nb_sb_noss_2?url=search-alias%3Daps&field-keywords=wi-fi+extende

Biểu mẫu tìm kiếm đã chuyển thông tin tới công cụ tìm kiếm của Amazon. Theo sau dấu chấm hỏi là hai phần của truy vấn: URL cho tìm kiếm (đó là phần “url=search-alias%3Daps&field”) và từ khóa đã nhập (đó là phần “keywords=wi-fi+extender”).

Đây là một ví dụ khá đơn thuần và bạn sẽ thường thấy những URL với những phần bổ sung khác nhau. Ví dụ đây là URL lúc tìm kiếm từ khóa “osuairportpart150.com” trên Google.

https://www.google.com.vn/search?q=osuairportpart150.com&oq=osuairportpart150.com&aqs=chrome..69i57j69i60j69i65j69i60l2.2397j0j1&sourceid=chrome&ie=UTF-8

Như bạn sở hữu thể thấy, sở hữu một số thông tin khác ở đây. Trong trường hợp này bạn sẽ thấy cả trình duyệt sử dụng.

Phân mảnh (fragment)

Thành phần cuối cùng của URL mà bạn sở hữu thể thấy được gọi là phân mảnh. Phân mảnh được bắt đầu bằng một dấu thăng (#) và được sử dụng để xác định vị trí cụ thể của trang web. lúc viết code cho một trang web, những nhà thiết kế sở hữu thể tạo liên kết neo (anchor) cho văn bản cụ thể như tiêu đề. lúc sử dụng một phân mảnh thích hợp ở cuối URL, trình duyệt của bạn sẽ tải trang và sau đó chuyển tới liên kết neo đó. Liên kết neo và URL cùng với phân mảnh thường được sử dụng để tạo mục lục trang web giúp điều hướng dễ dàng hơn.

Như những bạn thấy, trong bài viết này được chia thành 2 phần, mỗi phần lại sở hữu mục con. Mỗi một tiêu đề trên trang này sở hữu một liên kết neo và mục lục ở trên đầu bài viết bao gồm liên kết để bạn sở hữu thể chuyển tới những phần khác nhau một cách nhanh chóng.

Xem thêm:

Nguồn: URL là gì? Cấu trúc của URL ; URL là gì? Cấu trúc của URL