Mengenal Karakter Literal di Regex

Karakter literal dalam konteks pemrograman dan khususnya dalam regular expressions (regex), adalah karakter yang dicocokkan secara langsung dan persis seperti yang ditulis. Tidak ada interpretasi khusus atau fungsi tambahan yang diberikan kepada karakter tersebut. Karakter literal hanya berarti dirinya sendiri.

Misalnya, dalam string “Hello World”:

  • Karakter ‘H’ adalah karakter literal yang mewakili huruf ‘H’.
  • Karakter ‘e’ adalah karakter literal yang mewakili huruf ‘e’.

Contoh dalam Regex

  1. Regex tanpa karakter literal khusus:
  • Regex: hello
  • Mencocokkan string: “hello”
  • Tidak akan mencocokkan string: “Hello” (karena ‘H’ besar berbeda dengan ‘h’ kecil)
  1. Regex dengan karakter literal khusus:
  • Regex: h.e
  • Mencocokkan string: “hie”, “hoe”, “h e” (karena titik . adalah metakarakter yang mencocokkan sembarang karakter kecuali newline)
  1. Menggunakan karakter literal khusus dalam regex:
  • Untuk mencocokkan titik literal dalam string, Anda harus menghindari fungsi khusus dari titik dengan menggunakan backslash \.
  • Regex: h\.e
  • Mencocokkan string: “h.e” (karena \. mencocokkan titik literal, bukan sembarang karakter)

Karakter Literal vs Metakarakter

Metakarakter dalam regex memiliki arti khusus dan digunakan untuk membentuk pola pencocokan yang lebih kompleks:

  • . : Mencocokkan sembarang karakter kecuali newline.
  • * : Mencocokkan nol atau lebih dari karakter sebelumnya.
  • ^ : Mencocokkan awal baris.
  • $ : Mencocokkan akhir baris.
  • \d : Mencocokkan digit (0-9).
  • [abc] : Mencocokkan salah satu karakter ‘a’, ‘b’, atau ‘c’.

Untuk mencocokkan metakarakter sebagai karakter literal, Anda menggunakan backslash (\) sebelum metakarakter:

  • Untuk mencocokkan titik literal: \.
  • Untuk mencocokkan tanda bintang literal: \*
  • Untuk mencocokkan tanda kurung literal: \( dan \)

Contoh Lebih Lanjut

  • Regex: 3\.14
  • Ini mencocokkan string “3.14” karena \. mencocokkan titik literal.
  • Regex: \$100
  • Ini mencocokkan string “$100” karena \$ mencocokkan tanda dolar literal.

Ringkasan

Karakter literal adalah karakter yang dicocokkan dalam teks secara langsung dan tidak memiliki arti atau fungsi khusus dalam pola regex. Untuk mencocokkan karakter yang biasanya memiliki arti khusus dalam regex (seperti titik, tanda dolar, tanda kurung, dll.), Anda perlu menggunakan backslash untuk menjadikan mereka karakter literal.

About Reza Ervani 430 Articles
Adalah pendiri programming.rezaervani.com -

Be the first to comment

Leave a Reply

Your email address will not be published.


*


This site uses Akismet to reduce spam. Learn how your comment data is processed.