kali ini Admin akan membahas mengenai Text atau STR atau String yang digunakan dalam python
Sebelumnya ada yang tahu gak sih apa itu String ?
String sendiri adalah kumpulan beberapa karakter, yang umumnya digunakan untuk memunculkan text.
Operation dalam String
| Operation | Interprestasi |
| S = '' | String kosong |
| S = "spam's" | Duabuah quotes, dihitung sama |
| S = 's\np\ta\x00m' | Escape sequences |
| S = """...multiline...""" | Triple-quoted block strings |
| S = r'\temp\spam' | Raw strings (no escapes) |
| B = b'sp\xc4m' | Byte strings dalam Py 2.6, 2.7, and 3.X |
| U = u'sp\u00c4m' | Unicode strings in 2.X and 3.3+ |
| S1 + S2 | penambahan, |
| S * 3 | pengulangan |
| S[i] | index |
| S[i:j] | slicing |
| len(S) | panjang |
| a %s parrot % | Semacam format string menentukan expresi |
| a {0} parrot.format(kind) | String format method pada 2.6, 2.7, and 3.X |
| S.find('pa') | String methods : search, |
| S.rstrip() | remove whitespace, |
| S.replace('pa', 'xx') | replacement, |
| S.split(',') | split on delimiter |
| S.isdigit() | content test, |
| S.lower() | case conversion, |
| S.endswith('spam') | end test, |
| 'spam'.join(strlist) | delimiter join, |
| S.encode('latin-1') | Unicode encoding, |
| B.decode('utf8') | Unicode decoding, etc. |
| for x in S: print(x) | Iteration |
| 'spam' in S | |
| [c * 2 for c in S] | membership |
| map(ord, S) | |
| re.match('sp(.*)am', line) | Pattern matching: library module |
untuk mendefinisikan string letakan text antara quotes("text"). Python dapat memuat satu sampai tiga buah quotes
Input text, text berada dalam tanda petik atau quotes

Output text.
Beberapa karakter tidak dapat di masukan secara langsung dalam quote sting yang bersamaan; ini akan mengakibatakan kesalahan pambacaan text.
karakter seperti ini harus diletakan backslash (\) sebelum menaruh karakter tersebut
.contoh karakter spesial khusus (run in IDLE python 3.7)
python juga menyediakan cara yang mudah untuk menghindari atau meminimalisir penggunaan "\n" pada sebuah string dengan cara membuat tiga buah set dari quotes.
Contoh penggunaan 3 set quotes
Sequence Operations
Sebagai contoh, jika kita memiliki string empat karakter yang dikodekan di dalam tanda kutip (biasanya dari varietas tunggal), kita dapat memverifikasi panjangnya dengan len function built-in dan mengambil
komponen dengan ekspresi pengindeksan:
contoh text "S=Spam"Fungsi len (s) menghitung panjang text (S) dan S (0) karakter pertama pada text dan S(1) merupakan karakter kedua pada text
Pada Python semua string pada text dimuali dari hitungan "0" dan seterusnya.
Sequence Operations
Sebagai contoh, jika kita memiliki string empat karakter yang dikodekan di dalam tanda kutip (biasanya dari varietas tunggal), kita dapat memverifikasi panjangnya dengan len function built-in dan mengambil
komponen dengan ekspresi pengindeksan:
contoh text "S=Spam"Fungsi len (s) menghitung panjang text (S) dan S (0) karakter pertama pada text dan S(1) merupakan karakter kedua pada text
Pada Python semua string pada text dimuali dari hitungan "0" dan seterusnya.
selain it, kita juga dapat melakukan indexing secara terbalik, dari belakang text dengan menambahkan tanda "-"
Perhatikan
bahwa kita dapat menggunakan ekspresi acak dalam tanda kurung siku,
bukan hanya angka yang dikodekan secara harfiah — di mana pun Python menginginkan suatu nilai, kita dapat menggunakan sebuah literal, sebuah variabel, atau ekspresi apa pun yang kami inginkan. Sintax Python benar-benar umum dengan cara ini. Selain pengindeksan posisi sederhana, urutan juga mendukung bentuk yang lebih umum
pengindeksan dikenal sebagai mengiris, yang merupakan cara untuk mengekstrak seluruh bagian (slice) dalam satu
langkah. Sebagai contoh:
pengindeksan dikenal sebagai mengiris, yang merupakan cara untuk mengekstrak seluruh bagian (slice) dalam satu
langkah. Sebagai contoh:
Dan akhirnya, sebagai susunan string juga mendukung penggabungan dengan tanda tambah (menggabungkan dua string ke string baru) dan pengulangan (membuat string baru dengan mengulang yang lain):
Karena Python membersihkan objek lama saat menggunakannya (seperti yang akan Anda lihat nanti), ini tidak seefisien kedengarannya:
Anda dapat mengubah data berbasis teks di tempat jika Anda memperluasnya menjadi daftar karakter individual dan menggabungkannya kembali tanpa ada apa pun di antara keduanya, atau menggunakan jenis larik byte yang lebih baru yang tersedia di Pythons 2.6, 3.0, dan kemudian
Specific Method
Setiap operasi string yang telah kita pelajari sejauh ini benar-benar merupakan operasi rangkaian — yaitu, operasi ini akan bekerja pada rangkaian lain di Python juga, termasuk daftar dan tupel. Selain operasi urutan generik, string juga memiliki operasi sendiri, tersedia sebagai metode — fungsi yang dilekatkan dan bertindak pada objek tertentu, yang dipicu dengan ekspresi panggilan.
Sebagai contoh, string findmethod adalah operasi pencarian substring dasar (ia kembali
offset substring yang dilewatkan, atau −1 jika tidak ada), dan string diganti
metode melakukan pencarian dan penggantian global; keduanya bertindak berdasarkan subjek bahwa mereka dilampirkan dan dipanggil :
Metode lain
membagi string menjadi substring pada pemisah (berguna sebagai bentuk
sederhana dari parsing), melakukan konversi kasus, menguji isi string
(digit, huruf, dan sebagainya), dan menghapus karakter spasi putih dari
ujung string :
Perhatikan perintah terakhir di sini — strip sebelum split karena Python berjalan dari kiri ke kanan, membuat hasil sementara di sepanjang jalan. String juga mendukung operasi substitusi lanjutan yang dikenal sebagai pemformatan, tersedia sebagai ekspresi (asli) dan pemanggilan metode string (baru pada 2.6 dan 3.0); yang kedua ini memungkinkan Anda untuk menghilangkan nomor nilai argumen relatif pada 2.7 dan 3.1:
Format kaya dengan fitur, yang akan kita tunda untuk dibicarakan nanti, dan yang paling penting ketika Anda harus membuat laporan numerik:
Cara lain untuk code String
Sejauh ini, kami telah melihat operasi urutan objek string dan metode khusus jenis. Python juga menyediakan berbagai cara bagi kita untuk membuat kode string, yang akan kita telusuri lebih dalam nantinya. Sebagai contoh, karakter khusus dapat direpresentasikan sebagai urutan escape backslash, yang ditampilkan Python dalam notasi pelepasan heksadesimal xNN, kecuali mereka mewakili karakter yang dapat dicetak:
Python memungkinkan string diapit dalam karakter single atau doublequote — artinya
hal yang sama tetapi izinkan jenis kutipan lainnya untuk disematkan dengan pelarian (sebagian besar programmer lebih menyukai tanda kutip tunggal). Ini juga memungkinkan literal string multiline yang dilingkupi dalam triplequotes (tunggal atau ganda) - ketika formulir ini digunakan, semua garis digabungkan bersama-sama, dan karakter akhir-baris ditambahkan di mana garis putus-putus muncul. Ini adalah kenyamanan sintaksis kecil, tetapi berguna untuk menyematkan hal-hal seperti kode HTML, XML, atau JSON multiline dalam skrip Python, dan mematikan baris kode sementara — cukup tambahkan tiga tanda kutip di atas dan di bawah:
Python juga mendukung literal rawstring yang mematikan mekanisme escape backslash. Literal tersebut dimulai dengan huruf rand yang berguna untuk string seperti jalur direktori pada Windows (misalnya, r'C: \ text \ new ').
Unicode Strings
String Python juga datang dengan dukungan Unicode penuh yang diperlukan untuk memproses teks dalam rangkaian karakter yang diinternasionalkan. Karakter dalam huruf Jepang dan Rusia, misalnya, berada di luar set ASCII. Teks non-ASCII tersebut dapat muncul di halaman web, email, GUI, JSON, XML, atau di tempat lain. Ketika itu terjadi, penanganannya dengan baik membutuhkan dukungan Unicode. Python memiliki dukungan yang dibangun di dalamnya, tetapi bentuk dukungan Unicode bervariasi per garis Python, dan merupakan salah satu perbedaan paling menonjol. Dalam Python 3.X, strstring normal menangani teks Unicode (termasuk ASCII, yang hanya jenis Unicode sederhana); tipe bytesstring yang berbeda mewakili nilai raw byte (termasuk media dan teks yang disandikan); dan 2.X Unicode literal didukung dalam 3.3 dan yang lebih baru untuk kompatibilitas 2.X (mereka diperlakukan sama dengan strukting 3.X normal):
Perhatikan perintah terakhir di sini — strip sebelum split karena Python berjalan dari kiri ke kanan, membuat hasil sementara di sepanjang jalan. String juga mendukung operasi substitusi lanjutan yang dikenal sebagai pemformatan, tersedia sebagai ekspresi (asli) dan pemanggilan metode string (baru pada 2.6 dan 3.0); yang kedua ini memungkinkan Anda untuk menghilangkan nomor nilai argumen relatif pada 2.7 dan 3.1:
Format kaya dengan fitur, yang akan kita tunda untuk dibicarakan nanti, dan yang paling penting ketika Anda harus membuat laporan numerik:
Cara lain untuk code String
Sejauh ini, kami telah melihat operasi urutan objek string dan metode khusus jenis. Python juga menyediakan berbagai cara bagi kita untuk membuat kode string, yang akan kita telusuri lebih dalam nantinya. Sebagai contoh, karakter khusus dapat direpresentasikan sebagai urutan escape backslash, yang ditampilkan Python dalam notasi pelepasan heksadesimal xNN, kecuali mereka mewakili karakter yang dapat dicetak:
Python memungkinkan string diapit dalam karakter single atau doublequote — artinya
hal yang sama tetapi izinkan jenis kutipan lainnya untuk disematkan dengan pelarian (sebagian besar programmer lebih menyukai tanda kutip tunggal). Ini juga memungkinkan literal string multiline yang dilingkupi dalam triplequotes (tunggal atau ganda) - ketika formulir ini digunakan, semua garis digabungkan bersama-sama, dan karakter akhir-baris ditambahkan di mana garis putus-putus muncul. Ini adalah kenyamanan sintaksis kecil, tetapi berguna untuk menyematkan hal-hal seperti kode HTML, XML, atau JSON multiline dalam skrip Python, dan mematikan baris kode sementara — cukup tambahkan tiga tanda kutip di atas dan di bawah:
Python juga mendukung literal rawstring yang mematikan mekanisme escape backslash. Literal tersebut dimulai dengan huruf rand yang berguna untuk string seperti jalur direktori pada Windows (misalnya, r'C: \ text \ new ').
Unicode Strings
String Python juga datang dengan dukungan Unicode penuh yang diperlukan untuk memproses teks dalam rangkaian karakter yang diinternasionalkan. Karakter dalam huruf Jepang dan Rusia, misalnya, berada di luar set ASCII. Teks non-ASCII tersebut dapat muncul di halaman web, email, GUI, JSON, XML, atau di tempat lain. Ketika itu terjadi, penanganannya dengan baik membutuhkan dukungan Unicode. Python memiliki dukungan yang dibangun di dalamnya, tetapi bentuk dukungan Unicode bervariasi per garis Python, dan merupakan salah satu perbedaan paling menonjol. Dalam Python 3.X, strstring normal menangani teks Unicode (termasuk ASCII, yang hanya jenis Unicode sederhana); tipe bytesstring yang berbeda mewakili nilai raw byte (termasuk media dan teks yang disandikan); dan 2.X Unicode literal didukung dalam 3.3 dan yang lebih baru untuk kompatibilitas 2.X (mereka diperlakukan sama dengan strukting 3.X normal):
Dalam Python 2.X, strstring normal menangani string karakter 8-bit (termasuk Teks ASCII) dan nilai raw byte; jenis unicode string yang berbeda mewakili teks Unicode; dan 3.X byte literal didukung di 2.6 dan kemudian untuk 3.X kompatibilitas (mereka diperlakukan sama dengan strukting 2.X normal):
beberapa pengkodean termasuk poin kode karakter terlalu besar untuk satu byte, dan bahkan teks ASCII 7-bit sederhana tidak disimpan satu byte per karakter di bawah beberapa penyandian dan skema penyimpanan memori:
Pattern Matching
Satu hal yang perlu diperhatikan sebelum kita melanjutkan adalah bahwa tidak satu pun dari metode objek string sendiri yang mendukung pemrosesan teks berbasis pola. Pencocokan pola teks adalah alat canggih di luar cakupan buku ini, tetapi pembaca dengan latar belakang dalam bahasa scripting lainnya mungkin tertarik untuk mengetahui bahwa untuk melakukan pencocokan pola dengan Python, kami mengimpor modul yang disebut re. Modul ini memiliki panggilan analog untuk pencarian, pemisahan, dan penggantian, tetapi karena kita dapat menggunakan pola untuk menentukan substring, kita bisa jauh lebih umum:
Contoh ini mencari substring yang diawali dengan kata "Hello," diikuti oleh nol atau lebih tab atau spasi, diikuti oleh karakter tersendiri untuk disimpan sebagai grup yang cocok, diakhiri oleh kata "World." Jika substring seperti itu ditemukan , bagian dari substring yang dicocokkan oleh bagian dari pola yang dilingkupi dalam tanda kurung tersedia sebagai kelompok. Pola berikut, misalnya, memilih tiga kelompok yang dipisahkan oleh garis miring, dan mirip dengan pemisahan dengan pola alternatif:
Pattern matching adalah alat pemrosesan teks tingkat lanjut dengan sendirinya, tetapi ada juga dukungan dalam Python untuk pemrosesan teks dan bahasa yang lebih canggih, termasuk penguraian XML dan HTML serta analisis bahasa alami
Ok sobat sampai disini Dulu pembahsan kita soal String
jika ada pertanyaan silahkan ajukan di kolom komentar Trim's





















No comments:
Post a Comment