- מהם ביטויים רגולריים ומטרתם: הגדרת דפוסים לחיפוש, אימות ותפעול יעילים של טקסט.
- אלמנטים מרכזיים: תווים ליטרליים, מחלקות תווים, מטא-תווים וכימותים המאפשרים בניית תבניות מדויקות.
- יישומים עיקריים: אימות טפסים, חיפוש וחילוץ נתונים, החלפת טקסט וסינון יומני רישום.
- כלים לבדיקה וניפוי שגיאות: Regex101 ו-Regexr מציעים בדיקה והדמיה בזמן אמת.

לאס ביטויים קבועים, או RegEx, הם כלי בסיסי בניהול ועיבוד טקסטים. מאפשר לך לחפש הפטרונס, לבצע אימותים o להחליף קטעי טקסט ביעילות. השימוש בו נע מניהול מערכות ועד פיתוח אתרים ותכנות במספר שפות.
במאמר זה, נחקור בפירוט כיצד פועלים ביטויים רגולריים, ממה הם מורכבים וכיצד הם יכולים להקל על מניפולציה מתקדמת של טקסט. בנוסף, נראה דוגמאות מעשיות ויישומה בתרחישים שונים.
מהם ביטויים רגולריים?
א ביטוי רגיל הוא רצף של תווים שמגדיר את א דפוס חיפוש במחרוזת טקסט. הם משמשים במספר שפות תכנות וכלים עבור מניפולציה של נתונים.
במקור, מושג הביטויים הרגולריים עלה בתחום תורת השפה הפורמלית וזכו לפופולריות בעולם יוניקס הודות לכלים כגון grep, sed ו-awk. עם הזמן, הם הפכו לחלק מרכזי ב אימות טופס, מניפולציה ביומן, עיבוד נתונים ועוד ועוד.
שימושים עיקריים בביטויים רגולריים
- אימות מידע: ניתן להשתמש בהם כדי לבדוק אם א כתובת דוא"ל, אחד מספר טלפון או מיקוד הוא בפורמט הנכון.
- חיפוש והפקת מידע: הם מקלים על החיפוש אחר הפטרונס בתוך טקסטים ארוכים, כגון כתובות אתרים o קודי זיהוי.
- החלפת טקסט: הם מאפשרים לך לשנות מחרוזות טקסט על ידי החלפת מסוימות הפטרונס לערכים אחרים.
- דליפת מידע: הם שימושיים מאוד לניתוח ומבנה נתונים ביומנים, מסדי נתונים או תצורות.

אלמנטים בסיסיים של ביטויים רגולריים
RegEx מורכבים משונים אלמנטים שמאפשרים להגדיר דפוסי חיפוש ספֵּצִיפִי. להלן אלו הנפוצים ביותר בשימוש:
1. תווים מילוליים
הם האלמנטים הפשוטים ביותר בביטוי רגולרי. הם מייצגים בדיוק את אופי כתוב.
לדוגמה: ההבעה casa יחפש את המילה "בית" בדיוק כפי שהיא מופיעה בטקסט.
2. שיעורי אופי
הם מאפשרים להגדיר א סט תווים תקף לתפקיד נתון.
- [א ב ג]: מתאים ל-a, b או c.
- [0-9]: מתאים לכל מספר מ-0 עד 9.
- [^אז]: מתאים לכל תו שאינו אות קטנה.
3. מטא-תווים
בן דמויות מיוחדות שיש להם פונקציות ספציפיות בתוך ביטויים רגולריים.
- .: מייצג כל תו מלבד מעבר שורה.
- \d: מתאים לכל ספרה מ-0 עד 9.
- \s: מייצג כל רווח לבן (כולל טאבים ומעברי שורות).
4. מכמתים
הם מגדירים את מספר פעמים שחייבים להופיע דמות או קבוצת תווים.
- +: אחד או יותר.
- *: אפס או יותר.
- ?: אפס או פעם אחת.
- {נ,מ}: בין חזרות נימה.

דוגמאות מעשיות לביטויים רגולריים
1. אימות מייל
אנו יכולים להשתמש בביטוי הבא כדי לבדוק אם לדוא"ל יש א פורמט חוקי:
^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$
ביטוי זה תקף מיילים מתחומים שונים ומבטיחים שהם מכילים את הסמל "@" וא דומיין חוקי.
2. אימות מספר טלפון
כדי לאמת את פורמט של מספר טלפון, נוכל להשתמש בביטוי הבא:
^\+?[0-9]{1,3}?[-.\s]?([0-9]{2,4}[-.\s]?){2,3}[0-9]{2,4}$
מאפשר פורמטים שונים, כולל קודי מדינה אופציונלי ומפרידים כגון מקפים או רווחים.
3. חילוץ כתובת URL
לחלץ כתובות בטקסט, נוכל להשתמש ב:
https?://[\w.-]+(?:\.[a-zA-Z]{2,6})?
כיצד לבדוק ולאפות באגים בביטויים רגולריים
כדי להבטיח שביטוי רגולרי פועל כהלכה, אנו יכולים להשתמש כלים מקוונים כמו:
פלטפורמות אלו מאפשרות לך להזין ביטוי רגולרי ולבדוק אותו עם שונה מחרוזות טקסט לצפייה בתוצאות בזמן אמת.

ביטויים רגולריים הם כלי שימושי ביותר במניפולציה של טקסט. לדעת את שלך תחביר ועל ידי יישום נכון, נוכל להקל על אימות, búsqueda y טרנספורמציה של נתונים במספר תחומים, מתכנות ועד ניהול מערכות.