Ciąg Pythona | Split() i jak go używać

© metamorworks / Shutterstock.com

Python jest najpopularniejszym językiem programowania na świecie, a to dzięki narzędziom takim jak Ciąg | Dzielić(). Widzisz, Python zawiera wiele natywnych skrótów i alternatywnych sposobów kodowania, co znacznie ułatwia życie początkującym programistom.

Ciąg | Split() jest jedną z takich metod i przyda się podczas pracy z ciągami znaków, dokumentami tekstowymi lub długimi bazami danych. W tym artykule dowiesz się wszystkiego, co musisz o nim wiedzieć, od jego składni po najczęstsze błędy popełniane przez początkujących i jak ich unikać.

Zanurzmy się!

Co to jest łańcuch | Metoda Split()?

Podczas kodowania w Pythonie możemy poradzić sobie z ogromną gamą danych. Dane te otrzymują nazwę lub klasę zgodnie z ich charakterem. Ciągi to klasa danych, która zazwyczaj zawiera tekst, liczby i inne informacje wyświetlane jako znaki Unicode.

Możesz podejść do zajęć za pomocą różnych narzędzi natywnie zawartych w Pythonie. Split() jest jedną z tych predefiniowanych klas i działa wyłącznie z ciągami znaków.

Ciągi mają własną kolekcję metod. Metody działają jako funkcja specjalnie zaprojektowana dla jednej klasy i nie mogą działać w żadnej innej poza przypisaną.

Tak więc metoda split() może (jak sugeruje nazwa) podzielić ciąg znaków, a następnie zwrócić nową listę na podstawie wyników. Możemy określić, co chcemy, aby zwróciło na podstawie określonych parametrów, ale najpierw przejdźmy do podstaw.

Ciąg | Składnia Split().

Składnia podczas pracy z Split() jest bardzo prosta, co czyni ją naprawdę atrakcyjną zarówno dla nowych, jak i doświadczonych programistów.

Najpierw ustalamy zmienną łańcuchową dołączoną do metody. Następnie pierwszy parametr w nawiasach, o nazwie separator, określa, kiedy łańcuch się rozdziela. Jeśli nie jest zdefiniowany, każda biała spacja będzie działać jako separator.

Drugi parametr, maksymalny podział, to maksymalna liczba podziałów łańcucha. Jeśli tego nie określimy, to domyślnie ustawione jest -1, co oznacza nieskończoną liczbę podziałów.

Zobaczmy teraz, jak to wszystko wygląda:

©Histoire-Informatique.com

Jak widać, stworzyliśmy nową listę ze słowami z oryginalnego ciągu.

W tym przykładzie parametry nie są określone, co oznacza, że ​​parametry separator i maxsplit pozostają w stanie domyślnym. Tak więc oryginalny ciąg jest dzielony, ilekroć jest spacja, tyle razy, ile to możliwe.

Przykładowe kody

Zobaczmy, jak działa Split, gdy zdefiniujemy a separator.

©Histoire-Informatique.com

Jak widać, w tym przykładzie określiliśmy parametr separatora w miejscu, w którym chcieliśmy podzielić łańcuch. Należy zauważyć, że chociaż użyliśmy znaków interpunkcyjnych jako przykładów, parametr separatora może być wszystkim, czego potrzebujesz. Wydrukowany kod jest taki sam w obu przypadkach.

Ciąg | Split() z maksymalną liczbą podziałów

Gdy parametr maxsplit otrzyma wartość, sprzężenie zwrotne zatrzymuje się na określonej liczbie.

©Histoire-Informatique.com

Jak widać, dzielić() Metoda odczytuje kod od lewej do prawej, co oznacza, że ​​jeśli określimy maksymalnie 1 podział w tym ciągu z 4 elementami, otrzymamy pierwszy element w oddzielnym ciągu z kolejnych trzech.

Dlaczego warto używać String | Dzielić()?

Właśnie widzieliśmy, co potrafi metoda split na prostych przykładach, ale są one dalekie od pokazania rzeczywistej sytuacji.

Teraz poświęć chwilę i wyobraź sobie, że pracujesz z bardzo dużym dokumentem, pełnym tekstu i treści, które musisz przetworzyć. Zwykle projekty w Pythonie zajmują się dużymi ilościami danych, więc są dość dokładne.

To wtedy możesz docenić pełną moc funkcji split().

Możesz przekonwertować dowolny tekst na wielkie lub małe litery, utworzyć listę elementów lub zastąpić zawartość za pomocą kombinacji innych metod łańcuchowych.

Za pomocą metody split() możesz modyfikować dowolny dokument tekstowy tak, jakby był ciągiem znaków. Po prostu określ parametry (w razie potrzeby) i gotowe. Zostanie utworzona nowa lista, gotowa na wszelkie zmiany, jakie tylko przyjdą Ci do głowy.

Napiszmy przykładowy tekst, abyśmy mogli go przetworzyć. Wyobraźmy sobie, że importujemy do kodu dokument .txt:

©Histoire-Informatique.com

Teraz, gdy mamy dokument, zobaczmy, jak działa składnia.

©Histoire-Informatique.com

Funkcja „z” to menedżer kontekstu, który pozwala nam wywoływać i używać pliku w projekcie Pythona.

Używając metody read() przechowujesz dokument w nowej zmiennej. Następnie stosujemy Split() do zmiennej zawierającej tekst i ustawiamy wykrzyknik jako separator. Następnie tworzona jest nowa lista pozycji.

Na koniec każdy element na liście jest drukowany przy użyciu pętli for. Rzućmy okiem na dane wyjściowe:

©Histoire-Informatique.com

To ratunek podczas pracy z długimi dokumentami tekstowymi! Możesz zacząć dostrzegać, że metoda string.split() jest naprawdę użyteczna: oszczędza czas i zasoby, jednocześnie czyniąc kod bardziej uporządkowanym i łatwiejszym do debugowania.

Typowe błędy, których należy unikać

Częstym błędem podczas używania metody split() jest wprowadzanie separatora lub znaku, którego nie zawiera wybrany ciąg znaków. Zobaczmy, co zwróci Split() w tym przypadku:

©Histoire-Informatique.com

Jak widać, Split() nie zgłasza błędu, ale zamiast tego wyświetla pojedynczy element z listy zawierającej łańcuch. W rzeczywistości może być gorzej niż wtedy, gdy jakaś część kodu zgłasza błąd, ponieważ znalezienie i debugowanie może być trudniejsze. Należy o tym pamiętać podczas pracy z dużymi bazami danych, ponieważ ten błąd może spowodować, że kod będzie generował bezsensowne ciągi danych.

Inną częstą sytuacją jest otrzymanie grupy kolejnych białych znaków w jednym ciągu. Wynika to w dużej mierze ze sposobu, w jaki ta metoda interpretuje parametry, które jej nadajemy.

Kiedy dwie lub więcej białych spacji pojawia się kolejno w łańcuchu, Split() traktuje to tak, jakby to była pojedyncza biała spacja w wierszu.

Zobaczmy przykład:

©Histoire-Informatique.com

Teraz otrzymujemy coś zupełnie innego, gdy określimy spację jako separator. Zwrócony wynik będzie się różnił, ponieważ Split() traktuje dwa dodatkowe białe spacje jako różne znaki.

©Histoire-Informatique.com

Może to być trudny błąd, ponieważ możesz nie wiedzieć, jakie parametry określić, aby uzyskać pożądany zwrot. Dlatego spróbuj napisać oba argumenty i wybierz ten, który zwraca to, czego potrzebujesz. Przyzwyczaj się także do przeglądania łańcucha, z którym pracujesz, aby uniknąć błędów.

Wniosek: łańcuch Pythona | Dziel i jak z tego korzystać

To była niezła jazda! Przeanalizujmy to, czego się nauczyliśmy.

Split() to prosta, ale niezwykle użyteczna metoda, która pozwala nam manipulować wszelkimi informacjami przechowywanymi jako łańcuch, takimi jak nazwiska, adresy i wszelkie dane reprezentowane jako znaki Unicode.

Możesz użyć metody split() z innymi metodami łańcuchowymi, takimi jak slice() i format(), aby uzyskać interesujące kombinacje. Jak widać w powyższych przykładach, składnia jest prosta i łatwa w użyciu, dzięki czemu Twój kod będzie wyglądał bardziej profesjonalnie, wydajnie i łatwiej będzie debugować.

Metoda split() okaże się szczególnie przydatna podczas pracy z długimi dokumentami tekstowymi lub długimi bazami danych reprezentowanymi jako łańcuchy znaków. Niezależnie od tego, czy jesteś programistą gier, czy analitykiem danych, ta metoda z pewnością pomoże Ci w Twojej programistycznej podróży.

Nadszedł czas, aby otworzyć edytor kodu i wypróbować funkcję Split() w swoich projektach. Powodzenia!

Ciąg Pythona | Split() i jak go używać FAQ (najczęściej zadawane pytania)

Kiedy wydano Pythona?

Python został wydany w 1991 roku przez jego twórcę Guido van Rossuma jako następca języka programowania ABC. Python 2.0 pojawił się po raz pierwszy w 2000 roku. Obecna wersja, Python 2.7.18, została wydana w 2020 roku.

Jaka jest różnica między metodą a funkcją?

Technicznie są one takie same, ale generalnie dotyczą różnych zadań. Metoda to funkcja, która może działać tylko na określonej klasie. Z drugiej strony możesz przypisać funkcje do pracy z dowolnym typem zmiennej.

Czy Python jest popularnym językiem programowania?

Wraz z C, Javą i wieloma innymi, Python jest jednym z najpopularniejszych języków programowania na świecie ze względu na swoją prostotę i możliwość zastosowania w rozwijającym się świecie analizy danych.

Czy mogę użyć Split() do zwrócenia części łańcucha?

NIE. Do takiego zadania będziesz potrzebować innego narzędzia Pythona, zwanego operatorem Slicing. Metoda Split zawsze zwraca pełny ciąg rozdzielony na nową listę.

Czy Split() jest dostępny w innym języku programowania?

Tak. Split() to metoda natywnie reprezentowana w wielu językach programowania poza Pythonem, takich jak C i Java. Każdy język używa innej składni, ale ostatecznie metoda prowadzi do podobnych wyników.

Aby przeczytać także