Python-tekenreeks | Split() en hoe het te gebruiken

© metamorworks / Shutterstock.com

Python is de meest populaire programmeertaal ter wereld, en dat is te danken aan tools zoals Tekenreeks | Verdeling(). Zie je, Python bevat veel native snelkoppelingen en alternatieve manieren van coderen, wat het leven voor nieuwe programmeurs oneindig veel gemakkelijker maakt.

Tekenreeks | Split() is zo'n methode en is handig bij het werken met strings, tekstdocumenten of lange databases. Dit artikel vertelt je alles wat je moet weten, van de syntaxis tot de meest voorkomende fouten die nieuwkomers maken en hoe je ze kunt vermijden.

Laten we erin duiken!

Wat is de ketting | Split() methode?

Bij het coderen met Python kunnen we omgaan met een breed scala aan gegevens. Deze gegevens krijgen een naam of een klasse volgens hun aard. Tekenreeksen zijn gegevensklassen die doorgaans tekst, cijfers en andere informatie bevatten die worden weergegeven als Unicode-tekens.

U kunt klassen benaderen met een verscheidenheid aan tools die standaard in Python zijn opgenomen. Split() is een van deze vooraf gedefinieerde klassen en werkt uitsluitend met strings.

Strings hebben hun eigen verzameling methoden. Methoden werken als een functie die specifiek is ontworpen voor een enkele klasse en kunnen niet werken in een andere dan de toegewezen klasse.

De methode split() kan dus (zoals de naam al doet vermoeden) een string splitsen en vervolgens een nieuwe lijst retourneren op basis van de resultaten. We kunnen specificeren wat we willen dat het retourneert op basis van bepaalde parameters, maar laten we eerst naar de basis gaan.

Tekenreeks | Split()-syntaxis

De syntaxis bij het werken met Split() is heel eenvoudig, wat het erg aantrekkelijk maakt voor zowel nieuwe als ervaren programmeurs.

Eerst stellen we de stringvariabele vast die aan de methode is gekoppeld. Dan is de eerste parameter tussen haakjes, genaamd de separator, definieert wanneer de tekenreeks splitst. Indien niet gedefinieerd, fungeert elke witruimte als scheidingsteken.

De tweede parameter, maximale splitsing, is het maximale aantal keren dat de tekenreeks wordt gesplitst. Als we het niet specificeren, wordt -1 standaard ingesteld, wat een oneindig aantal delingen betekent.

Laten we nu eens kijken hoe het er allemaal uitziet:

©Histoire-Informatique.com

Zoals je kunt zien, hebben we een nieuwe lijst gemaakt met de woorden uit de originele string.

In dit voorbeeld zijn de parameters niet gespecificeerd, wat betekent dat de separator- en maxsplit-parameters in hun standaardstatus blijven. Dus de originele string wordt gesplitst wanneer er een spatie is, zo vaak mogelijk.

Voorbeeldcodes

Laten we eens kijken hoe Split werkt als we a definiëren separator.

©Histoire-Informatique.com

Zoals u kunt zien, hebben we in dit voorbeeld de separatorparameter gespecificeerd waar we de string wilden splitsen. Opgemerkt moet worden dat hoewel we leestekens als voorbeeld hebben gebruikt, de separator-parameter misschien alles is wat u nodig hebt. De gedrukte code is in beide gevallen gelijk.

Tekenreeks | Split() met maximaal aantal splitsingen

Wanneer de parameter maxsplit een waarde ontvangt, stopt de feedback bij dat gespecificeerde nummer.

©Histoire-Informatique.com

Zoals je kunt zien, is de verdeling() De methode leest de code van links naar rechts, wat betekent dat als we maximaal 1 splitsing specificeren in deze string met 4 elementen, we het eerste element in een aparte string krijgen van de volgende drie.

Waarom String | Verdeling()?

We hebben zojuist gezien wat de split-methode kan doen aan de hand van eenvoudige voorbeelden, maar ze laten nog lang niet een echte situatie zien.

Neem nu even de tijd en stel je voor dat je met een heel groot document werkt, vol met tekst en inhoud die je moet verwerken. Gewoonlijk hebben Python-projecten te maken met grote hoeveelheden gegevens, dus het is behoorlijk nauwkeurig.

Dit is wanneer u de volledige kracht van split() kunt waarderen.

U kunt elke tekst naar hoofdletters of kleine letters converteren, een lijst met items maken of inhoud vervangen met een combinatie van andere tekenreeksmethoden.

Met de methode split() kunt u elk tekstdocument wijzigen alsof het een string is. Geef gewoon de parameters op (indien nodig) en u bent klaar om te gaan. Er wordt een nieuwe lijst gemaakt, klaar voor alle mogelijke wijzigingen.

Laten we wat voorbeeldtekst schrijven zodat we deze kunnen verwerken. Laten we ons voorstellen dat het een .txt-document is dat we in de code importeren:

©Histoire-Informatique.com

Nu we een document hebben, laten we eens kijken hoe de syntaxis werkt.

©Histoire-Informatique.com

De "with"-functie is een contextmanager waarmee we een bestand in een Python-project kunnen aanroepen en gebruiken.

Door de methode read() te gebruiken, slaat u het document op in een nieuwe variabele. Vervolgens passen we Split() toe op de variabele die de tekst bevat en stellen we het uitroepteken in als scheidingsteken. Vervolgens wordt een nieuwe lijst met items gemaakt.

Ten slotte wordt elk item in de lijst afgedrukt met een for-lus. Laten we eens kijken naar de uitvoer:

©Histoire-Informatique.com

Het is een redder in nood bij het werken met lange tekstdocumenten! U kunt beginnen te zien dat de methode string.split() echt bruikbaar is: het bespaart tijd en middelen, terwijl de code netter en gemakkelijker te debuggen is.

Veelvoorkomende fouten om te vermijden

Een veelgemaakte fout bij het gebruik van split() is het invoeren van een scheidingsteken of teken dat de gekozen tekenreeks niet bevat. Laten we eens kijken wat Split() in dit geval zou retourneren:

©Histoire-Informatique.com

Zoals je kunt zien, genereert Split() geen fout, maar drukt in plaats daarvan een enkel item af uit een lijst die de tekenreeks bevat. Het kan zelfs erger zijn dan wanneer een deel van uw code een fout genereert, omdat het moeilijker te vinden en te debuggen is. Houd hier rekening mee wanneer u met grote databases werkt, aangezien deze fout ervoor kan zorgen dat uw code onzinnige gegevensreeksen produceert.

Een andere veel voorkomende situatie is het ontvangen van een groep opeenvolgende witruimten in een enkele string. Dit komt grotendeels door de manier waarop deze methode de parameters interpreteert die we eraan geven.

Wanneer twee of meer witruimten achter elkaar in een tekenreeks verschijnen, behandelt Split() deze alsof het een enkele inline witte ruimte is.

Laten we een voorbeeld bekijken:

©Histoire-Informatique.com

Nu krijgen we iets heel anders als we een spatie specificeren als scheidingsteken. Het geretourneerde resultaat zal variëren omdat Split() de twee extra witruimten als verschillende tekens beschouwt.

©Histoire-Informatique.com

Dit kan een lastige vergissing zijn, omdat u misschien niet weet welke parameters u moet specificeren om het gewenste rendement te krijgen. Probeer daarom beide argumenten op te schrijven en kies degene die retourneert wat je nodig hebt. Wen er ook aan om de string waarmee u werkt te bekijken om fouten te voorkomen.

Conclusie: Python String | Verdeel en hoe het te gebruiken

Het was een hele rit! Laten we eens kijken wat we hebben geleerd.

Split() is een eenvoudige maar ongelooflijk handige methode waarmee we alle informatie kunnen manipuleren die is opgeslagen als een tekenreeks, zoals namen, adressen en alle gegevens die worden weergegeven als Unicode-tekens.

U kunt split() gebruiken met andere stringmethoden zoals slice() en format() voor interessante combinaties. Zoals te zien is in de bovenstaande voorbeelden, is de syntaxis eenvoudig en gebruiksvriendelijk, waardoor uw code er professioneler, efficiënter en gemakkelijker te debuggen uitziet.

U zult de methode split() vooral handig vinden wanneer u werkt met lange tekstdocumenten of lange databases die worden weergegeven als tekenreeksen. Of je nu een gameprogrammeur bent of een data-analist, deze methode zal je zeker helpen tijdens je programmeerreis.

Dit is het moment om uw code-editor te openen en Split() in uw projecten uit te proberen. Good luck!

Python-tekenreeks | Split() en hoe het te gebruiken FAQ (veelgestelde vragen)

Wanneer is Python uitgebracht?

Python werd in 1991 uitgebracht door de maker Guido van Rossum, als opvolger van de programmeertaal ABC. Python 2.0 verscheen voor het eerst in 2000. De huidige versie, Python 2.7.18, werd uitgebracht in 2020.

Wat is het verschil tussen een methode en een functie?

Ze zijn technisch hetzelfde, maar ze zijn over het algemeen van toepassing op verschillende taken. Een methode is een functie die alleen op een specifieke klasse kan werken. Aan de andere kant kunt u functies toewijzen om met elk type variabele te werken.

Is Python een populaire programmeertaal?

Samen met C, Java en vele anderen is Python een van de meest populaire programmeertalen ter wereld vanwege zijn eenvoud en toepasbaarheid in de groeiende wereld van data-analyse.

Kan ik Split() gebruiken om een ​​deel van een string terug te geven?

Neen. Voor een dergelijke taak moet u een andere Python-tool gebruiken, de Slicing-operator. De Split-methode retourneert altijd de volledige string gescheiden in een nieuwe lijst.

Is Split() beschikbaar in een andere programmeertaal?

Ja. Split() is een methode die naast Python in veel programmeertalen is vertegenwoordigd, zoals C en Java. Elke taal gebruikt een andere syntaxis, maar uiteindelijk behaalt de methode vergelijkbare resultaten.

Lees ook