Biểu thức chính quy (RegEx): Hướng dẫn đầy đủ và ví dụ

Cập nhật lần cuối: Có thể 2 của 2026
  • Biểu thức chính quy là gì và mục đích của chúng: dùng để định nghĩa các mẫu nhằm tìm kiếm, xác thực và thao tác văn bản một cách hiệu quả.
  • Các yếu tố chính: ký tự theo nghĩa đen, lớp ký tự, siêu ký tự và lượng từ cho phép xây dựng các mẫu chính xác.
  • Các ứng dụng chính: xác thực biểu mẫu, tìm kiếm và trích xuất dữ liệu, thay thế văn bản và lọc nhật ký.
  • Các công cụ kiểm thử và gỡ lỗi: Regex101 và Regexr cung cấp khả năng kiểm thử và trực quan hóa theo thời gian thực.

Ví dụ RegEx

các biểu thức chính quyhoặc RegEx, là một công cụ cơ bản trong quản lý và xử lý văn bản. Cho phép bạn tìm kiếm patrones, thi hành xác nhận o thay thế phân đoạn văn bản một cách hiệu quả. Nó được sử dụng trong nhiều lĩnh vực, từ quản trị hệ thống đến phát triển web và lập trình bằng nhiều ngôn ngữ.

Trong bài viết này, chúng ta sẽ tìm hiểu chi tiết về cách thức hoạt động của biểu thức chính quy, chúng bao gồm những gì và chúng có thể hỗ trợ thao tác văn bản nâng cao như thế nào. Ngoài ra, chúng ta sẽ thấy ví dụ thực tế và ứng dụng của nó trong nhiều tình huống khác nhau.

Biểu thức chính quy là gì?

một cụm từ thông thường là một chuỗi các ký tự xác định một mẫu tìm kiếm trong một chuỗi văn bản. Chúng được sử dụng trong nhiều ngôn ngữ lập trình và công cụ cho thao tác dữ liệu.

Ban đầu, khái niệm biểu thức chính quy xuất hiện trong lĩnh vực lý thuyết ngôn ngữ hình thức và được phổ biến trong thế giới Unix nhờ các công cụ như grep, sed và awk. Theo thời gian, chúng đã trở thành một phần quan trọng trong Xác thực biểu mẫu, thao tác nhật ký, xử lý dữ liệu và nhiều hơn nữa.

Công dụng chính của biểu thức chính quy

  • Xác nhận dữ liệu: Chúng có thể được sử dụng để kiểm tra xem một địa chỉ email, One số điện thoại hoặc một mã bưu điện có định dạng đúng.
  • Tìm kiếm và trích xuất thông tin: Họ tạo điều kiện thuận lợi cho việc tìm kiếm patrones trong các văn bản dài, chẳng hạn như url o mã nhận dạng.
  • Thay thế văn bản: Chúng cho phép bạn sửa đổi chuỗi văn bản bằng cách thay thế một số patrones cho các giá trị khác.
  • Rò rỉ thông tin: Chúng rất hữu ích cho việc phân tích và cấu trúc dữ liệu trong nhật ký, cơ sở dữ liệu hoặc cấu hình.
  Eclipse IDE là gì và tại sao nó là môi trường cần thiết cho các nhà phát triển?

Cú pháp RegEx cơ bản

Các thành phần cơ bản của biểu thức chính quy

RegEx được tạo thành từ các thành phần khác nhau yếu tố cho phép xác định mẫu tìm kiếm cụ thể. Dưới đây là những cách được sử dụng phổ biến nhất:

1. Ký tự theo nghĩa đen

Chúng là những phần tử đơn giản nhất trong một biểu thức chính quy. Họ đại diện chính xác cho nhân vật bằng văn bản.

Ví dụ: Cách diễn đạt casa sẽ tìm kiếm từ “house” chính xác như từ đó xuất hiện trong văn bản.

2. Lớp nhân vật

Họ cho phép xác định một bộ ký tự có giá trị cho một vị trí nhất định.

  • [abc]: Phù hợp với a, b hoặc c.
  • [0-9]: Phù hợp với bất kỳ số nào từ 0 đến 9.
  • [^az]: Phù hợp với bất kỳ ký tự nào không phải là chữ cái thường.

3. Siêu ký tự

Con trai nhân vật đặc biệt có chức năng cụ thể trong biểu thức chính quy.

  • .: Biểu thị bất kỳ ký tự nào ngoại trừ ký tự ngắt dòng.
  • \d: Phù hợp với bất kỳ chữ số nào từ 0 đến 9.
  • \s: Biểu thị bất kỳ khoảng trắng nào (bao gồm cả tab và ngắt dòng).

4. Các lượng từ

Họ định nghĩa số lần rằng một nhân vật hoặc một nhóm nhân vật phải xuất hiện.

  • +: Một hoặc nhiều hơn.
  • *: Không hoặc nhiều hơn.
  • ?: Không hoặc một lần.
  • {n, m}: Giữa các lần lặp lại nym.

Ví dụ thực tế về RegEx

Ví dụ thực tế về biểu thức chính quy

1. Xác thực email

Chúng ta có thể sử dụng biểu thức sau để kiểm tra xem email có định dạng hợp lệ:

^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$

Biểu thức này là hợp lệ email từ các miền khác nhau đảm bảo rằng chúng chứa ký hiệu “@” và tên miền hợp lệ.

2. Xác thực số điện thoại

Để xác minh định dạng của một số điện thoại, chúng ta có thể sử dụng biểu thức sau:

^\+?[0-9]{1,3}?[-.\s]?([0-9]{2,4}[-.\s]?){2,3}[0-9]{2,4}$

Cho phép các định dạng khác nhau, bao gồm mã quốc gia tùy chọn và các dấu phân cách như dấu gạch nối hoặc khoảng trắng.

3. Trích xuất URL

Để giải nen URL Trong một văn bản, chúng ta có thể sử dụng:

  Moment.js: Giải thích đầy đủ và ví dụ thực tế về thư viện ngày tháng

https?://[\w.-]+(?:\.[a-zA-Z]{2,6})?

Cách kiểm tra và gỡ lỗi biểu thức chính quy

Để đảm bảo rằng biểu thức chính quy hoạt động chính xác, chúng ta có thể sử dụng công cụ trực tuyến như:

Các nền tảng này cho phép bạn nhập một biểu thức chính quy và kiểm tra nó bằng các biểu thức khác nhau chuỗi văn bản để xem kết quả trong thời gian thực.

Gỡ lỗi RegEx

Biểu thức chính quy là một công cụ cực kỳ hữu ích trong việc xử lý văn bản. Biết của bạn cú pháp và bằng cách áp dụng chúng một cách chính xác, chúng ta có thể tạo điều kiện thuận lợi xác nhận, tìm kiếm y chuyển đổi dữ liệu trong nhiều lĩnh vực, từ lập trình đến quản trị hệ thống.