Chuyển đổi biểu tượng cảm xúc thành văn bản Python

Bạn đã bao giờ nhận được một biểu tượng cảm xúc mà bạn không biết hoặc không hiểu nó là gì chưa? . Có rất nhiều biểu tượng cảm xúc mà chúng tôi không hiểu, việc sử dụng dữ liệu đó để tạo mô hình NLP có thể dẫn đến sự khác biệt

Điều gì sẽ xảy ra nếu tôi nói với bạn rằng bạn có thể thay đổi những biểu tượng cảm xúc này thành văn bản? . Nó sẽ không chỉ dễ hiểu mà còn làm cho dữ liệu sẵn sàng cho mô hình NLP

Emot là một thư viện python mã nguồn mở mà chúng ta có thể sử dụng để chuyển đổi biểu tượng cảm xúc thành mô tả văn bản. Trong bài viết này, chúng ta sẽ khám phá cách sử dụng Emot

Bắt đầu nào…

Cài đặt các thư viện cần thiết

Chúng tôi sẽ bắt đầu bằng cách cài đặt Emot bằng pip. Lệnh đưa ra dưới đây sẽ làm điều đó

pip install emot
Nhập các thư viện cần thiết

Trong bước này, chúng tôi sẽ nhập thư viện cần thiết i. e. cảm xúc

import emot as e
Chuyển đổi biểu tượng cảm xúc thành văn bản

Đây là bước cuối cùng mà chúng tôi sẽ chuyển một số văn bản có chứa biểu tượng cảm xúc vào thư viện biểu tượng cảm xúc và chuyển đổi biểu tượng cảm xúc thành văn bản

text = "I am a coder😎"
con = e.emoji(text)
con

Nguồn. Tác giả

Ở đây bạn có thể thấy nó dễ dàng chuyển đổi biểu tượng cảm xúc thành văn bản như thế nào. Hãy thử với một số biểu tượng cảm xúc khác

text = "😁😆😅😂😇🙃"
con = e.emoji(text)
con

Nguồn. Tác giả

Bạn thấy emot tuyệt vời như thế nào khi tạo văn bản từ biểu tượng cảm xúc. Hãy thử cái cuối cùng với một biểu tượng cảm xúc rất độc đáo

text = "🤡"
con = e.emoji(text)
con

Nguồn. Tác giả

Bạn có thể sử dụng điều này để xử lý trước dữ liệu văn bản của mình trước khi chuyển nó sang các mô hình NLP. Hãy tiếp tục thử điều này với các biểu tượng cảm xúc khác nhau và cho tôi biết nhận xét của bạn trong phần phản hồi

Bài viết này được cộng tác với Piyush Ingale

Trước khi bạn đi

Cảm ơn vì đã đọc. Nếu bạn muốn liên lạc với tôi, vui lòng liên hệ với tôi theo địa chỉ hmix13@gmail. com hoặc Hồ sơ LinkedIn của tôi. Bạn có thể xem hồ sơ Github của tôi để biết các hướng dẫn gói và dự án khoa học dữ liệu khác nhau. Ngoài ra, vui lòng khám phá hồ sơ của tôi và đọc các bài báo khác nhau mà tôi đã viết liên quan đến Khoa học dữ liệu

Chương trình Giáo dục Kỹ thuật (EngEd) này được hỗ trợ bởi Mục. Triển khai tức thì các container trên nhiều nhà cung cấp đám mây trên toàn cầu

Dùng thử miễn phí

Cách chuyển đổi văn bản thành biểu tượng cảm xúc bằng Python

1 Tháng Tư, 2021
  • chủ đề
  • ngôn ngữ

Biểu tượng cảm xúc thường được sử dụng trên phương tiện truyền thông xã hội để truyền đạt biểu cảm và cảm xúc. Hầu hết các lập trình viên có thể đã cân nhắc viết mã Python tạo biểu tượng cảm xúc. Vâng, đây là bài viết để đọc

Trong hướng dẫn này, các lập trình viên sẽ tìm hiểu cách xây dựng trình chuyển đổi biểu tượng cảm xúc từ văn bản bằng từ điển trong Python

Mục lục

  • điều kiện tiên quyết
  • Biến
  • Chuỗi và chuỗi được định dạng
  • Câu lệnh IF và ELSE
  • Chức năng Nhập và in
  • từ điển
  • Trình chuyển đổi văn bản thành biểu tượng cảm xúc
  • Phần kết luận

điều kiện tiên quyết

Tải xuống phiên bản Python mới nhất và cài đặt nó

Ngoài ra, hãy tải xuống trình chỉnh sửa mã Python tốt hơn PyCharm, đây là môi trường phát triển tích hợp dành cho các nhà phát triển chuyên nghiệp và nó cũng hướng đến sinh viên, thân thiện và dễ sử dụng

Biến

Biến là các nhãn biểu thị nơi dữ liệu có thể được lưu trữ trong bộ nhớ máy tính và chúng chứa các giá trị. Chúng lưu trữ các giá trị như chuỗi, số nguyên và giá trị Boolean. Các biến phải luôn ở dạng chữ thường, tốt nhất là

Chuỗi và chuỗi định dạng

Chuỗi là một dãy các ký tự. Các lập trình viên xác định các chuỗi bằng cách sử dụng cả hai dấu nháy đơn (“ ”) và dấu nháy đơn (‘ ’). Các chuỗi được định dạng rất hữu ích trong các tình huống mà người ta có thể muốn tạo một số văn bản có biến

Các chuỗi được định dạng giúp người dùng và người đọc dễ dàng hình dung chuỗi nối trong đầu và đầu ra của họ. Để xác định các chuỗi được định dạng, thêm tiền tố 'f' vào mã và sử dụng dấu ngoặc nhọn {} để chèn giá trị vào chuỗi

Xem ví dụ bên dưới

first_name='john'
last_name='smith'
message=f"{first_name} {last_name} is a coder"
print(message)

Xem đầu ra thiết bị đầu cuối bên dưới

john smith is a coder

Câu lệnh IF và ELSE

Câu lệnh IF và ELSE cho phép lập trình viên xây dựng chương trình có thể quyết định dựa trên một số điều kiện (TRUE hoặc FALSE). Họ kiểm tra một điều kiện và sau đó trả về một giá trị tùy thuộc vào kết quả, cho dù điều kiện thành công hay thất bại

is_hot=False
is_cold=False

if is_hot:
   print("its a hot day")
   print("please drink plenty of water")
elif is_cold:
   print("its a cold day")
   print("please waer something warm")
else:
   print("its a lovely day")
print("have a nice day ahead")

Xem đầu ra thiết bị đầu cuối bên dưới

________số 8_______

Chức năng nhập và in

Bản in và đầu vào là các hàm có mục đích chung được tích hợp trong Python. Người lập trình sử dụng chức năng in để in một thông báo được chỉ định trên màn hình

Chức năng nhập liệu được sử dụng để nhận đầu vào từ người dùng. Chức năng này có thể hướng dẫn chương trình tạm dừng và đợi người dùng nhập thông tin cần thiết

Xem ví dụ bên dưới

name=input("what is your name? ")
favourite_colour=input("what is your favorite colour? ")
print(name + " likes " + favourite_colour)

Xem đầu ra thiết bị đầu cuối bên dưới

what is your name? maji
what is your favorite colour? red
maji likes red

Từ điển

Từ điển lưu trữ giá trị dữ liệu trong các cặp khóa. Từ điển là một danh sách các đối tượng có thể được sắp xếp lại mà không cần lặp lại các giá trị dữ liệu của nó

Các khóa và giá trị trong từ điển được viết trong dấu ngoặc nhọn. Tên khóa đề cập đến các đối tượng từ điển, được trình bày trong các khóa;

details = { "brand": "Ford",
           "model": "Mustang",
           "year" : 2001}
print(details.get("brand"))
print(details.get("model"))
print(details.get("year"))

Xem đầu ra thiết bị đầu cuối bên dưới

Ford
Mustang
2001

Từ hình minh họa ở trên, người ta có thể quyết định sử dụng phương pháp

john smith is a coder
2 để lấy các giá trị được lưu trữ trong từ điển

john smith is a coder
3 phương thức sẽ cập nhật các mục từ một đối số. Nếu mục không tồn tại, thì nó sẽ thêm mục đó vào từ điển

các phương pháp khác là

john smith is a coder
4 phương pháp này xóa mục có tên khóa được chỉ định

john smith is a coder
5 phương thức này trả về một bản sao của từ điển

john smith is a coder
6 phương pháp này làm trống từ điển

Hãy thử nhiều thủ thuật hơn bằng cách sử dụng phương pháp

john smith is a coder
7

Để xác định có bao nhiêu mục trong từ điển, hãy sử dụng

john smith is a coder
8

Trình chuyển đổi văn bản thành biểu tượng cảm xúc

Các lập trình viên tin rằng việc in biểu tượng cảm xúc sẽ yêu cầu một thuật toán phức tạp. Tuy nhiên, đây không phải là trường hợp; . Đây là một ứng dụng tuyệt vời khác của việc sử dụng từ điển

Bước đầu tiên là gọi hàm đầu vào được lưu trữ trong một chuỗi. Tiếp theo, gọi phương thức

john smith is a coder
9. Phương thức này đi qua chuỗi này và bất cứ nơi nào nó tìm thấy khoảng trắng, nó sẽ sử dụng khoảng trắng đó để tách chuỗi này thành nhiều từ và trả về dưới dạng danh sách

Ngoài ra, hãy xác định từ điển cho các ký tự ánh xạ đặc biệt tới các thuộc tính biểu tượng cảm xúc, sau đó kết hợp các giá trị khóa của cặp và ánh xạ chúng tới một ký tự biểu tượng cảm xúc cụ thể

Nhấn phím Ctrl, Command và Space trên bàn phím để hiển thị hộp biểu tượng cảm xúc trên Hệ thống Mac. Đối với Windows, nhấn và giữ nút Window và nút Fullstop (. ) hoặc dấu chấm phẩy (;) cho đến khi bộ chọn biểu tượng cảm xúc xuất hiện

Cuối cùng, lặp qua chuỗi bằng phương thức

john smith is a coder
2

Xem ví dụ bên dưới

message = input("> ")
words = message.split( " ")
emojis = {
   ":)" : "😀",
   ":(" : "😞",
   "lol" : "😂",
   "sick":"😨",
   "happy": "😀",
   "mermaid": "🧜‍"
}
outcome = " "
for word in words:
   outcome += emojis.get(word, word) + " "
print(outcome)

Xem đầu ra thiết bị đầu cuối bên dưới

> today is a good day because I woke up happy
 today is a good day because I woke up 😀 

Sử dụng hàm

is_hot=False
is_cold=False

if is_hot:
   print("its a hot day")
   print("please drink plenty of water")
elif is_cold:
   print("its a cold day")
   print("please waer something warm")
else:
   print("its a lovely day")
print("have a nice day ahead")
1 để chuyển đổi mã này thành một hàm có thể tái sử dụng có thể được sử dụng trong các ứng dụng khác

john smith is a coder
0

Xem đầu ra thiết bị đầu cuối bên dưới

john smith is a coder
1

Khá dễ dàng, phải không?

Phần kết luận

Viết mã để chuyển đổi văn bản thành biểu tượng cảm xúc tương đối dễ thực hiện và yêu cầu kiến ​​thức cơ bản về ngôn ngữ Python. Các lập trình viên nên hiểu rõ nguyên tắc này và cách thức hoạt động của nó

Biểu tượng cảm xúc có thể được mã hóa bằng UTF không

Biểu tượng cảm xúc trông giống như hình ảnh hoặc biểu tượng nhưng không phải vậy. Chúng là các chữ cái (ký tự) từ bộ ký tự UTF-8 (Unicode) . UTF-8 bao gồm gần như tất cả các ký tự và biểu tượng trên thế giới.

Demoji là gì?

Tìm hoặc xóa chính xác các biểu tượng cảm xúc khỏi một cụm văn bản bằng cách sử dụng dữ liệu từ kho lưu trữ mã biểu tượng cảm xúc của Unicode Consortium .

Mô-đun biểu tượng cảm xúc trong Python là gì?

Mô-đun Biểu tượng cảm xúc là gói Python cho phép chúng tôi sử dụng và in biểu tượng cảm xúc thông qua chương trình Python và thậm chí chúng tôi có thể sử dụng mô-đun này để .

Tôi nên sử dụng mã hóa nào cho biểu tượng cảm xúc?

biểu tượng cảm xúc yêu cầu 4 byte để mã hóa bằng cách sử dụng UTF-8 , giờ đây chúng tôi thấy 4 ký tự khi diễn giải tệp bằng mã hóa Windows-1258. Lựa chọn mã hóa ký tự sai có tác động trực tiếp đến những gì chúng ta có thể nhìn và hiểu bằng cách cắt xén các ký tự thành một mớ hỗn độn khó hiểu.