programming python

Nhận dạng giọng nói ngoại tuyến Python GitHub

Bộ công cụ lời nói dễ sử dụng bao gồm mô hình Học tập tự giám sát, SOTA/Truyền phát ASR với dấu chấm câu, Truyền phát TTS với giao diện người dùng văn bản, Hệ thống xác minh người nói, Dịch giọng nói từ đầu đến cuối và Phát hiện từ khóa. Giành giải thưởng Demo hay nhất NAACL2022

biến áp tổng hợp giọng nói tts nhận dạng giọng nói nhận dạng giọng nói thì thầm asr vocoder tuân thủ phân loại âm thanh kws tự học giám sát sao chép giọng nói dịch giọng nói dấu chấm câu-khôi phục wav2vec2 streaming-asr căn chỉnh giọng nói streaming-tts

Cập nhật ngày 30 tháng 12 năm 2022
con trăn

não lời nói / speechbrain

Sao 5. 1k

Mã số
Vấn đề
Yêu cầu kéo
thảo luận

Bộ công cụ phát biểu dựa trên PyTorch

máy biến áp học sâu âm thanh pytorch nhận dạng giọng nói nhận dạng giọng nói chuyển lời nói thành văn bản ngôn ngữ mô hình loa-nhận dạng người nói-xác minh giọng nói xử lý âm thanh asr loa-diarization nhận dạng giọng nói-tách lời nói-nâng cao giọng nói-ngôn ngữ-hiểu bài phát biểu ôm mặt

Cập nhật 29/12/2022
con trăn

bảng chữ cái / vosk-api

Sao 5k

Mã số
Vấn đề
Yêu cầu kéo

API nhận dạng giọng nói ngoại tuyến cho Android, iOS, Raspberry Pi và máy chủ với Python, Java, C# và Node

android python raspberry-pi ios quyền riêng tư mạng nơ-ron sâu học sâu ngoại tuyến nhận dạng giọng nói nhận dạng giọng nói chuyển lời nói thành văn bản kaldi stt xác minh người nói asr nhận dạng giọng nói thành giọng nói sâu giọng nói thành văn bản android google-speech-to-

Cập nhật 29/12/2022
Máy tính xách tay Jupyter

theajack / cnchar

Sao 1. 7k

Mã số
Vấn đề
Yêu cầu kéo

🇨🇳功能全面的汉字工具库 [拼音笔画偏旁成语语音可视化等] [Chinese character util]

vẽ nhận dạng giọng nói bính âm ký tự tiếng Trung nói chính tả nét

Cập nhật15/12/2022
bản đánh máy

coqui-ai/STT

Sao 1. 7k

Mã số
Vấn đề
Yêu cầu kéo
thảo luận

🐸STT - Bộ công cụ học sâu dành cho Speech-to-Text. Đào tạo và triển khai mô hình STT chưa bao giờ dễ dàng đến thế

deep-learning tensorflow nhận dạng giọng nói nhận dạng giọng nói tự động nhận dạng giọng nói chuyển lời nói thành văn bản stt asr nhận dạng giọng nói nhận dạng giọng nói-api

Cập nhật19/12/2022
C++

Reac-native-voice / giọng nói

Sao 1. 4k

Mã số
Vấn đề
Yêu cầu kéo
thảo luận

🎤React Thư viện nhận dạng giọng nói gốc cho iOS và Android [Hỗ trợ trực tuyến và ngoại tuyến]

android ios nhận dạng giọng nói gốc phản ứng nhận dạng giọng nói

Cập nhật10/12/2022
Mục tiêu-C

rắn4 / silero-vad

Sao 1. 1k

Mã số
Vấn đề
Yêu cầu kéo
thảo luận

Silero VAD. Trình phát hiện hoạt động giọng nói, Trình phân loại ngôn ngữ và Trình phát hiện số đã nói cấp doanh nghiệp được đào tạo trước

lệnh bằng giọng nói pytorch nhận dạng giọng nói điều khiển giọng nói phát hiện giọng nói phát hiện hoạt động giọng nói phân loại ngôn ngữ onnx

Cập nhật 29/12/2022
con trăn

jim-schwoebel / voice_datasets

Sao 1. 1k

Mã số
Vấn đề
Yêu cầu kéo

🔊Danh sách đầy đủ các bộ dữ liệu mã nguồn mở dành cho điện toán giọng nói và âm thanh [hơn 95 bộ dữ liệu]

dữ liệu giọng nói lệnh thoại bộ dữ liệu nhận dạng giọng nói tiếng ồn bộ dữ liệu trò chuyện bằng giọng nói điều khiển bằng giọng nói chuyển đổi giọng nói trợ lý giọng nói phát hiện hoạt động tổng hợp giọng nói bộ dữ liệu âm thanh bộ dữ liệu tính toán giọng nói bộ dữ liệu giọng nói bộ dữ liệu âm thanh

Cập nhật ngày 9 tháng 3 năm 2022

coqui-ai / open-speech-corpora

Sao 902

Mã số
Vấn đề
Yêu cầu kéo
thảo luận

💎Danh sách kho ngữ liệu giọng nói có thể truy cập cho ASR, TTS và các Công nghệ giọng nói khác

chuyển văn bản thành giọng nói tts tổng hợp giọng nói nhận dạng giọng nói nhận dạng giọng nói chuyển giọng nói thành văn bản stt xử lý giọng nói phát hiện hoạt động giọng nói tách giọng nói nhận dạng cảm xúc nhân bản giọng nói

Cập nhật ngày 27 tháng 7 năm 2022

alexylem / jarvis

Sao 773

Mã số
Vấn đề
Yêu cầu kéo

Jarvis. sh là một trợ lý đa ngôn ngữ có thể cấu hình đơn giản

tự động hóa gia đình raspberry-pi trợ lý ra lệnh bằng giọng nói nhận dạng giọng nói trợ lý cá nhân jasper jarvis điều khiển bằng giọng nói sarah

Cập nhật29 tháng 5 năm 2021
Vỏ bọc

EDDiscovery / EDDiscovery

Sao 674

Mã số
Vấn đề
Yêu cầu kéo

Nhật ký thuyền trưởng và bản đồ sao 3d cho Elite Dangerous

văn bản thành giọng nói giọng nói tạp chí ưu tú-nhật ký tạp chí ưu tú-tạp chí ưu tú-nguy hiểm-nhận dạng giọng nói edsm 3d-map eddn inara edDiscovery thuyền trưởng-log

Cập nhật ngày 31 tháng 12 năm 2022
C#

MycroftAI / mycroft chính xác

Sao 647

Mã số
Vấn đề
Yêu cầu kéo

Trình nghe từ đánh thức RNN nhẹ, dễ sử dụng

raspberry-pi hệ thống nhúng nhận dạng giọng nói nhận dạng giọng nói điều khiển giọng nói phát hiện từ nóng phát hiện từ khóa đánh thức phát hiện từ

Cập nhật 21/11/2022
con trăn

evancohen / sonus

Sao 589

Mã số
Vấn đề
Yêu cầu kéo

💬/vậy. nus/STT [speech to text] cho Node với tính năng phát hiện từ nóng ngoại tuyến

nút alexa nhận dạng giọng nói nhận dạng giọng nói điều khiển giọng nói thành văn bản stt phát hiện từ nóng phát hiện từ khóa

Cập nhật24/10/2021
JavaScript

ggeop / Python-ai-trợ lý

Sao 579

Mã số
Vấn đề
Yêu cầu kéo
thảo luận

Trợ lý AI của Python🧠

python nlp ai mongodb sklearn pymongo lệnh bằng giọng nói nhận dạng giọng nói nltk điều khiển giọng nói trò chuyện bằng giọng nói

Cập nhật ngày 8 tháng 12 năm 2022
con trăn

Picovoice / điểm chuẩn chuyển giọng nói thành văn bản

Sao 548

Mã số
Vấn đề
Yêu cầu kéo

khung điểm chuẩn lời nói thành văn bản

quyền riêng tư deep-neural network học sâu ngoại tuyến nhận dạng giọng nói nhận dạng giọng nói thành văn bản pocketsphinx cheetah deepspeech aws-transcribe mozilla-deepspeech edge-ai google-speech-to-text picovoice

Cập nhật ngày 9 tháng 10 năm 2022
con trăn

Picovoice / tê giác

Sao 510

Mã số
Vấn đề
Yêu cầu kéo

Công cụ chuyển lời nói thành ý định trên thiết bị được hỗ trợ bởi deep learning

nodejs javascript android python raspberry-pi iot ios deep-learning cortex-m lệnh thoại nhận dạng giọng nói nhận dạng giọng nói chuyển lời nói thành văn bản điều khiển giọng nói cortex-a giọng nói hiểu ngôn ngữ tự nhiên như một giao diện-công cụ ý định

Cập nhật ngày 22 tháng 12 năm 2022
bản đánh máy

algolia / lớp phủ giọng nói-ios

Sao 490

Mã số
Vấn đề
Yêu cầu kéo

🗣Một lớp phủ nhận được sự cho phép bằng giọng nói của người dùng của bạn và nhập dưới dạng văn bản trong giao diện người dùng có thể tùy chỉnh

tìm kiếm swift ios object-c quyền đối với lớp phủ đầu vào giọng nói hội thoại-ui hội thoại nhận dạng giọng nói chatbot nhận dạng giọng nói tìm kiếm tức thì văn bản giọng nói chuyển lời nói thành văn bản tìm kiếm tức thì trợ lý giọng nói giao diện đàm thoại bot đàm thoại

Cập nhậtngày 6 tháng 10 năm 2022
Nhanh

Picovoice / con báo

Sao 469

Mã số
Vấn đề
Yêu cầu kéo

Công cụ chuyển giọng nói thành văn bản trực tuyến trên thiết bị được hỗ trợ bởi deep learning

android python c raspberry-pi iot ios machine-learning arm học sâu lắp ráp web ngoại tuyến nhận dạng giọng nói nhận dạng giọng nói chuyển lời nói thành văn bản stt asr

Nhận dạng giọng nói python có ngoại tuyến không?

Để nhận dạng giọng nói từ dữ liệu âm thanh bằng các API khác nhau, có một lớp trình nhận dạng thực hiện tất cả công việc. Nhận dạng_sphinx[] có các lợi ích vì nó có thể hoạt động ngoại tuyến với công cụ CMU Sphinx .

Vosk có ngoại tuyến không?

Vosk là bộ công cụ nhận dạng giọng nói mã nguồn mở ngoại tuyến .

Nhận dạng giọng nói có yêu cầu Internet không?

Tùy thuộc vào ứng dụng bạn đang sử dụng, nhận dạng giọng nói đôi khi yêu cầu kết nối internet để hoạt động . Xin lưu ý rằng một số ứng dụng yêu cầu gửi lời nói của bạn đến máy chủ để chuyển đổi thành văn bản.

PyAudio có cần thiết để nhận dạng giọng nói không?

Đáng chú ý là cần có gói PyAudio để thu đầu vào micrô . Bạn sẽ thấy những phụ thuộc nào bạn cần khi đọc thêm. Bây giờ, hãy đi sâu vào và khám phá những điều cơ bản của gói.