Nhận dạng giọng nói ngoại tuyến Python GitHub

Bộ công cụ lời nói dễ sử dụng bao gồm mô hình Học tập tự giám sát, SOTA/Truyền phát ASR với dấu chấm câu, Truyền phát TTS với giao diện người dùng văn bản, Hệ thống xác minh người nói, Dịch giọng nói từ đầu đến cuối và Phát hiện từ khóa. Giành giải thưởng Demo hay nhất NAACL2022

biến áp tổng hợp giọng nói tts nhận dạng giọng nói nhận dạng giọng nói thì thầm asr vocoder tuân thủ phân loại âm thanh kws tự học giám sát sao chép giọng nói dịch giọng nói dấu chấm câu-khôi phục wav2vec2 streaming-asr căn chỉnh giọng nói streaming-tts

  • Cập nhật ngày 30 tháng 12 năm 2022
  • con trăn

não lời nói / speechbrain

Sao 5. 1k

  • Mã số
  • Vấn đề
  • Yêu cầu kéo
  • thảo luận

Bộ công cụ phát biểu dựa trên PyTorch

máy biến áp học sâu âm thanh pytorch nhận dạng giọng nói nhận dạng giọng nói chuyển lời nói thành văn bản ngôn ngữ mô hình loa-nhận dạng người nói-xác minh giọng nói xử lý âm thanh asr loa-diarization nhận dạng giọng nói-tách lời nói-nâng cao giọng nói-ngôn ngữ-hiểu bài phát biểu ôm mặt

  • Cập nhật 29/12/2022
  • con trăn

bảng chữ cái / vosk-api

Sao 5k

  • Mã số
  • Vấn đề
  • Yêu cầu kéo

API nhận dạng giọng nói ngoại tuyến cho Android, iOS, Raspberry Pi và máy chủ với Python, Java, C# và Node

android python raspberry-pi ios quyền riêng tư mạng nơ-ron sâu học sâu ngoại tuyến nhận dạng giọng nói nhận dạng giọng nói chuyển lời nói thành văn bản kaldi stt xác minh người nói asr nhận dạng giọng nói thành giọng nói sâu giọng nói thành văn bản android google-speech-to-

  • Cập nhật 29/12/2022
  • Máy tính xách tay Jupyter

theajack / cnchar

Sao 1. 7k

  • Mã số
  • Vấn đề
  • Yêu cầu kéo

🇨🇳功能全面的汉字工具库 [拼音 笔画 偏旁 成语 语音 可视化等] [Chinese character util]

vẽ nhận dạng giọng nói bính âm ký tự tiếng Trung nói chính tả nét

  • Cập nhật15/12/2022
  • bản đánh máy

coqui-ai/STT

Sao 1. 7k

  • Mã số
  • Vấn đề
  • Yêu cầu kéo
  • thảo luận

🐸STT - Bộ công cụ học sâu dành cho Speech-to-Text. Đào tạo và triển khai mô hình STT chưa bao giờ dễ dàng đến thế

deep-learning tensorflow nhận dạng giọng nói nhận dạng giọng nói tự động nhận dạng giọng nói chuyển lời nói thành văn bản stt asr nhận dạng giọng nói nhận dạng giọng nói-api

  • Cập nhật19/12/2022
  • C++

Reac-native-voice / giọng nói

Sao 1. 4k

  • Mã số
  • Vấn đề
  • Yêu cầu kéo
  • thảo luận

🎤React Thư viện nhận dạng giọng nói gốc cho iOS và Android [Hỗ trợ trực tuyến và ngoại tuyến]

android ios nhận dạng giọng nói gốc phản ứng nhận dạng giọng nói

  • Cập nhật10/12/2022
  • Mục tiêu-C

rắn4 / silero-vad

Sao 1. 1k

  • Mã số
  • Vấn đề
  • Yêu cầu kéo
  • thảo luận

Silero VAD. Trình phát hiện hoạt động giọng nói, Trình phân loại ngôn ngữ và Trình phát hiện số đã nói cấp doanh nghiệp được đào tạo trước

lệnh bằng giọng nói pytorch nhận dạng giọng nói điều khiển giọng nói phát hiện giọng nói phát hiện hoạt động giọng nói phân loại ngôn ngữ onnx

  • Cập nhật 29/12/2022
  • con trăn

jim-schwoebel / voice_datasets

Sao 1. 1k

  • Mã số
  • Vấn đề
  • Yêu cầu kéo

🔊Danh sách đầy đủ các bộ dữ liệu mã nguồn mở dành cho điện toán giọng nói và âm thanh [hơn 95 bộ dữ liệu]

dữ liệu giọng nói lệnh thoại bộ dữ liệu nhận dạng giọng nói tiếng ồn bộ dữ liệu trò chuyện bằng giọng nói điều khiển bằng giọng nói chuyển đổi giọng nói trợ lý giọng nói phát hiện hoạt động tổng hợp giọng nói bộ dữ liệu âm thanh bộ dữ liệu tính toán giọng nói bộ dữ liệu giọng nói bộ dữ liệu âm thanh

  • Cập nhật ngày 9 tháng 3 năm 2022

coqui-ai / open-speech-corpora

Sao 902

  • Mã số
  • Vấn đề
  • Yêu cầu kéo
  • thảo luận

💎Danh sách kho ngữ liệu giọng nói có thể truy cập cho ASR, TTS và các Công nghệ giọng nói khác

chuyển văn bản thành giọng nói tts tổng hợp giọng nói nhận dạng giọng nói nhận dạng giọng nói chuyển giọng nói thành văn bản stt xử lý giọng nói phát hiện hoạt động giọng nói tách giọng nói nhận dạng cảm xúc nhân bản giọng nói

  • Cập nhật ngày 27 tháng 7 năm 2022

alexylem / jarvis

Sao 773

  • Mã số
  • Vấn đề
  • Yêu cầu kéo

Jarvis. sh là một trợ lý đa ngôn ngữ có thể cấu hình đơn giản

tự động hóa gia đình raspberry-pi trợ lý ra lệnh bằng giọng nói nhận dạng giọng nói trợ lý cá nhân jasper jarvis điều khiển bằng giọng nói sarah

  • Cập nhật29 tháng 5 năm 2021
  • Vỏ bọc

EDDiscovery / EDDiscovery

Sao 674

  • Mã số
  • Vấn đề
  • Yêu cầu kéo

Nhật ký thuyền trưởng và bản đồ sao 3d cho Elite Dangerous

văn bản thành giọng nói giọng nói tạp chí ưu tú-nhật ký tạp chí ưu tú-tạp chí ưu tú-nguy hiểm-nhận dạng giọng nói edsm 3d-map eddn inara edDiscovery thuyền trưởng-log

  • Cập nhật ngày 31 tháng 12 năm 2022
  • C#

MycroftAI / mycroft chính xác

Sao 647

  • Mã số
  • Vấn đề
  • Yêu cầu kéo

Trình nghe từ đánh thức RNN nhẹ, dễ sử dụng

raspberry-pi hệ thống nhúng nhận dạng giọng nói nhận dạng giọng nói điều khiển giọng nói phát hiện từ nóng phát hiện từ khóa đánh thức phát hiện từ

  • Cập nhật 21/11/2022
  • con trăn

evancohen / sonus

Sao 589

  • Mã số
  • Vấn đề
  • Yêu cầu kéo

💬/vậy. nus/STT [speech to text] cho Node với tính năng phát hiện từ nóng ngoại tuyến

nút alexa nhận dạng giọng nói nhận dạng giọng nói điều khiển giọng nói thành văn bản stt phát hiện từ nóng phát hiện từ khóa

  • Cập nhật24/10/2021
  • JavaScript

ggeop / Python-ai-trợ lý

Sao 579

  • Mã số
  • Vấn đề
  • Yêu cầu kéo
  • thảo luận

Trợ lý AI của Python🧠

python nlp ai mongodb sklearn pymongo lệnh bằng giọng nói nhận dạng giọng nói nltk điều khiển giọng nói trò chuyện bằng giọng nói

  • Cập nhật ngày 8 tháng 12 năm 2022
  • con trăn

Picovoice / điểm chuẩn chuyển giọng nói thành văn bản

Sao 548

  • Mã số
  • Vấn đề
  • Yêu cầu kéo

khung điểm chuẩn lời nói thành văn bản

quyền riêng tư deep-neural network học sâu ngoại tuyến nhận dạng giọng nói nhận dạng giọng nói thành văn bản pocketsphinx cheetah deepspeech aws-transcribe mozilla-deepspeech edge-ai google-speech-to-text picovoice

  • Cập nhật ngày 9 tháng 10 năm 2022
  • con trăn

Picovoice / tê giác

Sao 510

  • Mã số
  • Vấn đề
  • Yêu cầu kéo

Công cụ chuyển lời nói thành ý định trên thiết bị được hỗ trợ bởi deep learning

nodejs javascript android python raspberry-pi iot ios deep-learning cortex-m lệnh thoại nhận dạng giọng nói nhận dạng giọng nói chuyển lời nói thành văn bản điều khiển giọng nói cortex-a giọng nói hiểu ngôn ngữ tự nhiên như một giao diện-công cụ ý định

  • Cập nhật ngày 22 tháng 12 năm 2022
  • bản đánh máy

algolia / lớp phủ giọng nói-ios

Sao 490

  • Mã số
  • Vấn đề
  • Yêu cầu kéo

🗣Một lớp phủ nhận được sự cho phép bằng giọng nói của người dùng của bạn và nhập dưới dạng văn bản trong giao diện người dùng có thể tùy chỉnh

tìm kiếm swift ios object-c quyền đối với lớp phủ đầu vào giọng nói hội thoại-ui hội thoại nhận dạng giọng nói chatbot nhận dạng giọng nói tìm kiếm tức thì văn bản giọng nói chuyển lời nói thành văn bản tìm kiếm tức thì trợ lý giọng nói giao diện đàm thoại bot đàm thoại

  • Cập nhậtngày 6 tháng 10 năm 2022
  • Nhanh

Picovoice / con báo

Sao 469

  • Mã số
  • Vấn đề
  • Yêu cầu kéo

Công cụ chuyển giọng nói thành văn bản trực tuyến trên thiết bị được hỗ trợ bởi deep learning

android python c raspberry-pi iot ios machine-learning arm học sâu lắp ráp web ngoại tuyến nhận dạng giọng nói nhận dạng giọng nói chuyển lời nói thành văn bản stt asr

Nhận dạng giọng nói python có ngoại tuyến không?

Để nhận dạng giọng nói từ dữ liệu âm thanh bằng các API khác nhau, có một lớp trình nhận dạng thực hiện tất cả công việc. Nhận dạng_sphinx[] có các lợi ích vì nó có thể hoạt động ngoại tuyến với công cụ CMU Sphinx .

Vosk có ngoại tuyến không?

Vosk là bộ công cụ nhận dạng giọng nói mã nguồn mở ngoại tuyến .

Nhận dạng giọng nói có yêu cầu Internet không?

Tùy thuộc vào ứng dụng bạn đang sử dụng, nhận dạng giọng nói đôi khi yêu cầu kết nối internet để hoạt động . Xin lưu ý rằng một số ứng dụng yêu cầu gửi lời nói của bạn đến máy chủ để chuyển đổi thành văn bản.

PyAudio có cần thiết để nhận dạng giọng nói không?

Đáng chú ý là cần có gói PyAudio để thu đầu vào micrô . Bạn sẽ thấy những phụ thuộc nào bạn cần khi đọc thêm. Bây giờ, hãy đi sâu vào và khám phá những điều cơ bản của gói.

Chủ Đề