Tại sao Python in chữ U?

Ước gì bạn có thể nhận được Å trong chuỗi của mình? . Chúng tôi có thể lấy nó để in bằng Python, nhưng chúng tôi phải tạo nó trong một chuỗi unicode và in chuỗi được mã hóa chính xác. Hãy để chúng tôi thử nó

print u'\u212B'.encode['utf-8']

Chúng tôi sử dụng u'' để biểu thị một chuỗi unicode. Lưu ý chúng tôi phải mã hóa chuỗi để in nó, nếu không sẽ gặp lỗi này

Traceback [most recent call last]:
  File "", line 1, in 
UnicodeEncodeError: 'ascii' codec can't encode character u'\u212b' in position 0: ordinal not in range[128]

Làm nhiều hơn nữa, làm nhiều hơn nữa, chúng tôi ước chúng tôi có thể. Unicode cũng hỗ trợ một số chỉ số trên và chỉ số dưới [http. // vi. wikipedia. org/wiki/Unicode_subscripts_and_superscripts ]. Hãy để chúng tôi thấy rằng trong hành động

print u'\u212B\u00B3'.encode['utf-8']

ų

Khá ngọt ngào. Mã không phải là thứ có thể đọc được nếu bạn không thông thạo unicode, nhưng nếu nó được chôn trong thư viện nào đó, nó sẽ in ra một cái gì đó đẹp mắt. Chúng ta cũng có thể sử dụng điều này để in các công thức hóa học

print u'''The chemical formula of water is H\u2082O.
Water dissociates into H\u207A and OH\u207B'''.encode['utf-8']

= Công thức hóa học của nước là H₂O. Nước phân ly thành H⁺ và OH⁻

Ngoài ra còn có các bảng mã khác. Xem các ký hiệu tại đây. http. // vi. wikipedia. org/wiki/Number_Forms

print u'1/4 or \u00BC'.encode['latin-1']

1/4 or ¼

Điều đó có vẻ như

The volume is 125 Angstrom^3
0

The volume is 125 Angstrom^3
1

Tôi không thể nói làm thế nào bạn biết chính xác nên sử dụng mã hóa nào. Nếu bạn sử dụng utf-8 trong ví dụ trên, bạn sẽ có một ký tự đi lạc phía trước ký hiệu nhãn hiệu mong muốn. Tuy nhiên, thật thú vị khi bạn có thể nhận được các biểu tượng đẹp hơn

Việc gán một chuỗi cho một biến được thực hiện với tên biến theo sau là dấu bằng và chuỗi

Chuỗi nhiều dòng

Bạn có thể gán một chuỗi nhiều dòng cho một biến bằng cách sử dụng ba dấu ngoặc kép

Ví dụ

Bạn có thể sử dụng ba dấu ngoặc kép

a = """Lorem ipsum dolor sit amet,
consectetur adipiscing elit,
sed do eiusmod tempor incididunt
ut labore et dolore magna aliqua."""
in[a]

Tự mình thử »

Hoặc ba dấu nháy đơn

Ví dụ

a = '''Lorem ipsum dolor sit amet,
consectetur adipiscing elit,
sed do eiusmod tempor incididunt
ut labore et dolore magna aliqua.'''
in[a]

Tự mình thử »

Ghi chú. kết quả là các ngắt dòng được chèn vào cùng một vị trí như trong mã

Chuỗi là Mảng

Giống như nhiều ngôn ngữ lập trình phổ biến khác, chuỗi trong Python là mảng byte đại diện cho các ký tự unicode

Tuy nhiên, Python không có kiểu dữ liệu ký tự, một ký tự đơn giản chỉ là một chuỗi có độ dài là 1

Dấu ngoặc vuông có thể được sử dụng để truy cập các phần tử của chuỗi

Ví dụ

Lấy ký tự ở vị trí 1 [nhớ rằng ký tự đầu tiên có vị trí 0]

a = "Xin chào, Thế giới. "
in[a[1]]

Tự mình thử »

Vòng qua một chuỗi

Vì chuỗi là mảng nên chúng ta có thể lặp qua các ký tự trong chuỗi bằng vòng lặp

2

Ví dụ

Vòng qua các chữ cái trong từ "banana"

cho x trong "chuối".
  in[x]

Tự mình thử »

Tìm hiểu thêm về Vòng lặp For trong chương Python For Loops của chúng tôi

Chiều dài chuỗi

Để lấy độ dài của một chuỗi, hãy sử dụng hàm

3

Ví dụ

Hàm

3 trả về độ dài của một chuỗi

a = "Xin chào, Thế giới. "
in[len[a]]

Tự mình thử »

Chuỗi kiểm tra

Để kiểm tra xem một cụm từ hoặc ký tự nào đó KHÔNG có trong chuỗi hay không, chúng ta có thể sử dụng từ khóa

5

Trên trang này. nhận xét với #, chuỗi nhiều dòng với """ """, in nhiều đối tượng, dấu gạch chéo ngược "\" làm ký tự thoát, '\t', '\n', '\r' và '\\'

Bắt đầu

Video Tổng Hợp

  • Hầu hết các câu lệnh in trong tập lệnh này đã được nhận xét ban đầu, không được chú thích trong suốt video. Đây là đầu ra vỏ
  • Như đã nêu trong các hướng dẫn trước, hàm print yêu cầu Python hiển thị ngay một chuỗi đã cho sau khi lệnh được thực thi. Để chỉ định một chuỗi cho chức năng in hiển thị, hãy đặt chuỗi đó trong dấu nháy đơn [' '] hoặc dấu nháy kép [" "]. Cả hai tùy chọn đều khả dụng nên bạn vẫn có thể sử dụng dấu ngoặc kép trong chuỗi của mình nếu cần. Bán tại. in "hôm nay bạn thế nào?"
  • Nếu ký hiệu thăng [#] được đặt trước một lệnh hoặc bất kỳ loại chuỗi ký tự nào, lệnh sẽ xuất hiện màu đỏ và Python sẽ bỏ qua nó trong quá trình thực thi mã. Điều này có thể được sử dụng trong Python để cung cấp nhận xét hữu ích cho những người đang xem mã của bạn hoặc để "tắt" một số dòng mã nhất định để kiểm tra lỗi
  • Bao quanh một chuỗi có ba dấu ngoặc kép [""" """] cho phép bạn có bất kỳ sự kết hợp nào giữa dấu ngoặc kép và ngắt dòng trong một chuỗi và Python sẽ vẫn diễn giải chuỗi đó dưới dạng một thực thể duy nhất

Tìm hiểu thêm

  • Bạn có thể chỉ định nhiều chuỗi với câu lệnh in. Chỉ cần tách chúng ra bằng dấu phẩy ',' và chúng sẽ được in với khoảng trắng ở giữa

    0

  • Trong các chuỗi Python, dấu gạch chéo ngược "\" là một ký tự đặc biệt, còn được gọi là ký tự "thoát". Nó được sử dụng để đại diện cho các ký tự khoảng trắng nhất định. "\t" là một tab, "\n" là một dòng mới và "\r" là một xuống dòng

    1

  • Ngược lại, đặt trước một ký tự đặc biệt với "\" sẽ biến ký tự đó thành một ký tự thông thường. Cái này gọi là "thoát". Ví dụ: "\'" là ký tự trích dẫn đơn. 'It\'s raining' do đó là một chuỗi hợp lệ và tương đương với "It's raining". Tương tự như vậy, '"' có thể được thoát. "\"hello\"" là một chuỗi bắt đầu và kết thúc bằng ký tự trích dẫn kép theo nghĩa đen. Cuối cùng, "\" có thể được sử dụng để tự thoát. "\\" là ký tự gạch chéo ngược theo nghĩa đen
  • Có rất nhiều hàm tiện dụng được định nghĩa trên các chuỗi, được gọi là các phương thức chuỗi. Tìm hiểu về những cái trên substringhood và cả về thao tác case trong hướng dẫn này. Hướng dẫn phần 2 này bao gồm các phương pháp chuỗi để tìm vị trí của một chuỗi con cụ thể và cũng để kiểm tra xem điều kiện nhất định có đúng với mọi ký tự hay không
  • Khi bạn cảm thấy thoải mái với các danh sách [sắp ra mắt], bạn cũng nên xem Tách và nối các chuỗi

Khám phá

U in Python là gì?

[u'String'] là đại diện văn bản của danh sách chứa chuỗi Unicode trên Python 2 . Nếu bạn chạy print[some_list] thì nó tương đương với. in'[%s]' % ', '. tham gia [bản đồ [repr, some_list]] tôi. e. , để tạo một biểu diễn văn bản của một đối tượng Python với kiểu list , hàm repr[] được gọi cho mỗi mục.

Chữ U có nghĩa là gì trong Python?

Chữ 'u' phía trước các giá trị chuỗi có nghĩa là chuỗi này là một chuỗi Unicode . Unicode là một cách để thể hiện nhiều ký tự hơn ASCII bình thường có thể quản lý. Việc bạn nhìn thấy u có nghĩa là bạn đang sử dụng Python 2 - các chuỗi là Unicode theo mặc định trên Python 3, nhưng trên Python 2, u ở phía trước phân biệt các chuỗi Unicode.

Bảng mã nào bắt đầu bằng chữ U?

Unicode hiện là tiêu chuẩn chung để mã hóa tất cả các ngôn ngữ của loài người. Và vâng, nó thậm chí còn bao gồm các biểu tượng cảm xúc. Dưới đây là một số ví dụ về các ký tự văn bản và các điểm mã phù hợp của chúng. Mỗi điểm mã bắt đầu bằng “U” cho “Unicode”, theo sau là một chuỗi ký tự duy nhất để đại diện cho ký tự.

Tại sao Python sử dụng Unicode?

Kiểu chuỗi của Python sử dụng Tiêu chuẩn Unicode để biểu thị các ký tự, cho phép các chương trình Python hoạt động với tất cả các ký tự có thể khác nhau này . Unicode [https. //www. unicode. org/] là một đặc điểm kỹ thuật nhằm mục đích liệt kê mọi ký tự được sử dụng bởi ngôn ngữ của con người và cung cấp cho mỗi ký tự một mã duy nhất của riêng nó.

Chủ Đề