Chuỗi Python | Split() và cách sử dụng nó

© metamorworks / Shutterstock.com

Python là ngôn ngữ lập trình phổ biến nhất trên thế giới và đó là nhờ các công cụ như Chuỗi | Chia(). Bạn thấy đấy, Python kết hợp nhiều lối tắt gốc và các cách mã hóa thay thế, giúp cuộc sống của các lập trình viên mới trở nên dễ dàng hơn rất nhiều.

Chuỗi | Split() là một trong những phương pháp như vậy và sẽ hữu ích khi làm việc với các chuỗi, tài liệu văn bản hoặc cơ sở dữ liệu dài. Bài viết này sẽ cho bạn biết mọi thứ bạn cần biết về nó, từ cú pháp của nó đến những lỗi phổ biến nhất mà người mới mắc phải và cách tránh chúng.

Hãy đi sâu vào!

chuỗi là gì | Phương pháp tách ()?

Khi mã hóa bằng Python, chúng ta có thể xử lý một lượng lớn dữ liệu. Những dữ liệu này nhận được một tên hoặc một lớp theo bản chất của chúng. Chuỗi là một loại dữ liệu thường chứa văn bản, số và thông tin khác được hiển thị dưới dạng ký tự Unicode.

Bạn có thể tiếp cận các lớp học với nhiều công cụ vốn có trong Python. Split() là một trong những lớp được xác định trước này và chỉ hoạt động với các chuỗi.

Các chuỗi có bộ sưu tập các phương thức riêng. Các phương thức hoạt động như một chức năng được thiết kế đặc biệt cho một lớp duy nhất và không thể hoạt động trong bất kỳ lớp nào khác ngoại trừ lớp được chỉ định.

Vì vậy, phương thức split() có thể (như tên gợi ý) tách một chuỗi và sau đó trả về một danh sách mới dựa trên kết quả. Chúng tôi có thể chỉ định những gì chúng tôi muốn nó trả về dựa trên các tham số nhất định, nhưng trước tiên hãy tìm hiểu những điều cơ bản.

Chuỗi | cú pháp chia()

Cú pháp khi làm việc với Split() rất đơn giản, khiến nó thực sự hấp dẫn đối với cả lập trình viên mới và có kinh nghiệm.

Đầu tiên, chúng ta thiết lập biến chuỗi gắn liền với phương thức. Sau đó, tham số đầu tiên trong ngoặc đơn, được gọi là máy phân ly, xác định thời điểm tách chuỗi. Nếu không được xác định, mọi khoảng trắng sẽ đóng vai trò là dấu phân cách.

Tham số thứ hai, phân chia tối đa, là số lần tối đa chuỗi được chia. Nếu chúng ta không chỉ định nó, thì -1 được đặt theo mặc định, có nghĩa là vô số phép chia.

Bây giờ hãy xem tất cả trông như thế nào:

©Histoire-Informatique.com

Như bạn có thể thấy, chúng tôi đã tạo một danh sách mới với các từ trong chuỗi ban đầu.

Trong ví dụ này, các tham số không được chỉ định, có nghĩa là các tham số dấu tách và maxsplit được để ở trạng thái mặc định. Vì vậy, chuỗi gốc được chia bất cứ khi nào có khoảng trắng, càng nhiều lần càng tốt.

Mã mẫu

Hãy xem Split hoạt động như thế nào khi chúng ta xác định một máy phân ly.

©Histoire-Informatique.com

Như bạn có thể thấy, trong ví dụ này, chúng tôi đã chỉ định tham số dấu tách nơi chúng tôi muốn chuỗi được tách. Cần lưu ý rằng mặc dù chúng tôi đã sử dụng dấu chấm câu làm ví dụ, tham số dấu phân cách có thể là tất cả những gì bạn cần. Mã được in giống nhau trong cả hai trường hợp.

Chuỗi | Split() với số lần chia tối đa

Khi tham số maxsplit nhận được một giá trị, phản hồi sẽ dừng ở số được chỉ định đó.

©Histoire-Informatique.com

Như bạn có thể thấy, các chia() Phương thức đọc mã từ trái sang phải, có nghĩa là nếu chúng ta chỉ định tối đa 1 lần phân tách trong chuỗi có 4 phần tử này, thì chúng ta sẽ nhận được phần tử đầu tiên trong một chuỗi riêng biệt từ ba phần tử tiếp theo.

Tại sao nên sử dụng Chuỗi | Chia()?

Chúng ta vừa thấy những gì phương pháp phân chia có thể làm bằng cách sử dụng các ví dụ đơn giản, nhưng chúng còn lâu mới thể hiện được tình huống thực tế.

Bây giờ hãy dành một chút thời gian và tưởng tượng rằng bạn đang làm việc với một tài liệu rất lớn, chứa đầy văn bản và nội dung mà bạn cần xử lý. Thông thường, các dự án Python xử lý lượng dữ liệu lớn, vì vậy nó khá chính xác.

Đây là lúc bạn có thể đánh giá cao toàn bộ sức mạnh của split().

Bạn có thể chuyển đổi bất kỳ văn bản nào thành chữ hoa hoặc chữ thường, tạo danh sách các mục hoặc thay thế nội dung bằng cách sử dụng kết hợp các phương thức chuỗi khác.

Với phương thức split(), bạn có thể sửa đổi bất kỳ tài liệu văn bản nào như thể nó là một chuỗi. Chỉ cần chỉ định các tham số (nếu cần) và bạn đã sẵn sàng. Một danh sách mới được tạo, sẵn sàng cho bất kỳ thay đổi nào bạn có thể nghĩ đến.

Hãy viết một số văn bản mẫu để chúng tôi có thể xử lý nó. Hãy tưởng tượng đó là một tài liệu .txt mà chúng ta nhập vào mã:

©Histoire-Informatique.com

Bây giờ chúng ta đã có một tài liệu, hãy xem cú pháp hoạt động như thế nào.

©Histoire-Informatique.com

Tính năng "với" là trình quản lý ngữ cảnh cho phép chúng tôi gọi và sử dụng tệp trong dự án Python.

Bằng cách sử dụng phương thức read(), bạn lưu trữ tài liệu trong một biến mới. Sau đó, chúng tôi áp dụng Split() cho biến chứa văn bản và đặt dấu chấm than làm dấu phân cách. Sau đó, một danh sách các mục mới được tạo.

Cuối cùng, mỗi mục trong danh sách được in bằng vòng lặp for. Chúng ta hãy nhìn vào đầu ra:

©Histoire-Informatique.com

Đó là cứu cánh khi làm việc với các tài liệu văn bản dài! Bạn có thể bắt đầu thấy rằng có một tiện ích thực sự trong phương thức string.split(): nó tiết kiệm thời gian và tài nguyên trong khi làm cho mã gọn gàng hơn và dễ gỡ lỗi hơn.

Những sai lầm phổ biến cần tránh

Một lỗi phổ biến khi sử dụng split() là nhập dấu phân cách hoặc ký tự mà chuỗi đã chọn không chứa. Hãy xem những gì Split() sẽ trả về trong trường hợp này:

©Histoire-Informatique.com

Như bạn có thể thấy, Split() không đưa ra lỗi mà thay vào đó in một mục từ danh sách chứa chuỗi. Nó thực sự có thể tồi tệ hơn khi một số phần mã của bạn gây ra lỗi, bởi vì nó có thể khó tìm và gỡ lỗi hơn. Hãy ghi nhớ điều này khi làm việc với cơ sở dữ liệu lớn, vì lỗi này có thể khiến mã của bạn tạo ra các chuỗi dữ liệu vô nghĩa.

Một tình huống phổ biến khác là nhận được một nhóm các khoảng trắng liên tiếp trong một chuỗi. Điều này phần lớn là do cách phương pháp này diễn giải các tham số mà chúng tôi cung cấp cho nó.

Khi hai hoặc nhiều khoảng trắng xuất hiện liên tiếp trong một chuỗi, Split() coi nó như thể đó là một khoảng trắng nội tuyến duy nhất.

Hãy xem một ví dụ:

©Histoire-Informatique.com

Bây giờ chúng tôi nhận được một cái gì đó rất khác khi chúng tôi chỉ định một khoảng trắng làm dấu phân cách. Kết quả trả về sẽ thay đổi vì Split() coi hai khoảng trắng thừa là các ký tự khác nhau.

©Histoire-Informatique.com

Đây có thể là một sai lầm khó hiểu vì bạn có thể không biết cần chỉ định tham số nào để nhận được kết quả mong muốn. Do đó, hãy cố gắng viết cả hai đối số và chọn đối số trả về những gì bạn cần. Ngoài ra, hãy làm quen với việc xem lại chuỗi bạn đang làm việc để tránh mắc lỗi.

Kết luận: Chuỗi Python | Chia và cách sử dụng

Đó là một chuyến đi khá thú vị! Hãy xem lại những gì chúng ta đã học.

Split() là một phương thức đơn giản nhưng vô cùng hữu ích cho phép chúng ta thao tác với bất kỳ thông tin nào được lưu trữ dưới dạng chuỗi, chẳng hạn như tên, địa chỉ và bất kỳ dữ liệu nào được biểu thị dưới dạng ký tự Unicode.

Bạn có thể sử dụng split() với các phương thức chuỗi khác như slice() và format() để có những kết hợp thú vị. Như đã thấy trong các ví dụ trên, cú pháp đơn giản và dễ sử dụng sẽ làm cho mã của bạn trông chuyên nghiệp hơn, hiệu quả hơn và dễ gỡ lỗi hơn.

Bạn sẽ thấy phương thức split() đặc biệt hữu ích khi làm việc với tài liệu văn bản dài hoặc cơ sở dữ liệu dài được biểu diễn dưới dạng chuỗi. Cho dù bạn là lập trình viên trò chơi hay nhà phân tích dữ liệu, phương pháp này chắc chắn sẽ giúp bạn trong suốt hành trình lập trình của mình.

Bây giờ là lúc để mở trình chỉnh sửa mã của bạn và thử Split() trong các dự án của bạn. Chúc may mắn!

Chuỗi Python | Split() và cách sử dụng nó Câu hỏi thường gặp (Câu hỏi thường gặp)

Python được phát hành khi nào?

Python được phát hành vào năm 1991 bởi người tạo ra nó là Guido van Rossum, với tư cách là người kế thừa ngôn ngữ lập trình ABC. Python 2.0 xuất hiện lần đầu tiên vào năm 2000. Phiên bản hiện tại, Python 2.7.18, được phát hành vào năm 2020.

Sự khác biệt giữa một phương thức và một chức năng là gì?

Chúng giống nhau về mặt kỹ thuật, nhưng chúng thường áp dụng cho các nhiệm vụ khác nhau. Một phương thức là một hàm chỉ có thể hoạt động trên một lớp cụ thể. Mặt khác, bạn có thể gán hàm để làm việc với bất kỳ loại biến nào.

Python có phải là ngôn ngữ lập trình phổ biến không?

Cùng với C, Java và nhiều ngôn ngữ khác, Python là một trong những ngôn ngữ lập trình phổ biến nhất trên thế giới do tính đơn giản và khả năng ứng dụng của nó vào thế giới phân tích dữ liệu đang phát triển.

Tôi có thể sử dụng Split() để trả về một phần của chuỗi không?

KHÔNG. Đối với một nhiệm vụ như vậy, bạn sẽ cần sử dụng một công cụ Python khác có tên là toán tử Slicing. Phương thức Split luôn trả về chuỗi đầy đủ được tách thành một danh sách mới.

Split() có sẵn trong ngôn ngữ lập trình khác không?

Đúng. Split() là một phương thức được thể hiện nguyên bản trong nhiều ngôn ngữ lập trình ngoài Python, chẳng hạn như C và Java. Mỗi ngôn ngữ sử dụng một cú pháp khác nhau, nhưng cuối cùng phương pháp này đạt được kết quả tương tự.

Cũng đọc