Bộ công cụ lời nói dễ sử dụng bao gồm mô hình Học tập tự giám sát, SOTA/Truyền phát ASR với dấu chấm câu, Truyền phát TTS với giao diện người dùng văn bản, Hệ thống xác minh người nói, Dịch giọng nói từ đầu đến cuối và Phát hiện từ khóa. Giành giải thưởng Demo hay nhất NAACL2022
biến áp tổng hợp giọng nói tts nhận dạng giọng nói nhận dạng giọng nói thì thầm asr vocoder tuân thủ phân loại âm thanh kws tự học giám sát sao chép giọng nói dịch giọng nói dấu chấm câu-khôi phục wav2vec2 streaming-asr căn chỉnh giọng nói streaming-tts
- Cập nhật ngày 30 tháng 12 năm 2022
- con trăn
não lời nói / speechbrain
Sao 5. 1k
- Mã số
- Vấn đề
- Yêu cầu kéo
- thảo luận
Bộ công cụ phát biểu dựa trên PyTorch
máy biến áp học sâu âm thanh pytorch nhận dạng giọng nói nhận dạng giọng nói chuyển lời nói thành văn bản ngôn ngữ mô hình loa-nhận dạng người nói-xác minh giọng nói xử lý âm thanh asr loa-diarization nhận dạng giọng nói-tách lời nói-nâng cao giọng nói-ngôn ngữ-hiểu bài phát biểu ôm mặt
- Cập nhật 29/12/2022
- con trăn
bảng chữ cái / vosk-api
Sao 5k
- Mã số
- Vấn đề
- Yêu cầu kéo
API nhận dạng giọng nói ngoại tuyến cho Android, iOS, Raspberry Pi và máy chủ với Python, Java, C# và Node
android python raspberry-pi ios quyền riêng tư mạng nơ-ron sâu học sâu ngoại tuyến nhận dạng giọng nói nhận dạng giọng nói chuyển lời nói thành văn bản kaldi stt xác minh người nói asr nhận dạng giọng nói thành giọng nói sâu giọng nói thành văn bản android google-speech-to-
- Cập nhật 29/12/2022
- Máy tính xách tay Jupyter
theajack / cnchar
Sao 1. 7k
- Mã số
- Vấn đề
- Yêu cầu kéo
🇨🇳功能全面的汉字工具库 [拼音 笔画 偏旁 成语 语音 可视化等] [Chinese character util]
vẽ nhận dạng giọng nói bính âm ký tự tiếng Trung nói chính tả nét
- Cập nhật15/12/2022
- bản đánh máy
coqui-ai/STT
Sao 1. 7k
- Mã số
- Vấn đề
- Yêu cầu kéo
- thảo luận
🐸STT - Bộ công cụ học sâu dành cho Speech-to-Text. Đào tạo và triển khai mô hình STT chưa bao giờ dễ dàng đến thế
deep-learning tensorflow nhận dạng giọng nói nhận dạng giọng nói tự động nhận dạng giọng nói chuyển lời nói thành văn bản stt asr nhận dạng giọng nói nhận dạng giọng nói-api
- Cập nhật19/12/2022
- C++
Reac-native-voice / giọng nói
Sao 1. 4k
- Mã số
- Vấn đề
- Yêu cầu kéo
- thảo luận
🎤React Thư viện nhận dạng giọng nói gốc cho iOS và Android [Hỗ trợ trực tuyến và ngoại tuyến]
android ios nhận dạng giọng nói gốc phản ứng nhận dạng giọng nói
- Cập nhật10/12/2022
- Mục tiêu-C
rắn4 / silero-vad
Sao 1. 1k
- Mã số
- Vấn đề
- Yêu cầu kéo
- thảo luận
Silero VAD. Trình phát hiện hoạt động giọng nói, Trình phân loại ngôn ngữ và Trình phát hiện số đã nói cấp doanh nghiệp được đào tạo trước
lệnh bằng giọng nói pytorch nhận dạng giọng nói điều khiển giọng nói phát hiện giọng nói phát hiện hoạt động giọng nói phân loại ngôn ngữ onnx
- Cập nhật 29/12/2022
- con trăn
jim-schwoebel / voice_datasets
Sao 1. 1k
- Mã số
- Vấn đề
- Yêu cầu kéo
🔊Danh sách đầy đủ các bộ dữ liệu mã nguồn mở dành cho điện toán giọng nói và âm thanh [hơn 95 bộ dữ liệu]
dữ liệu giọng nói lệnh thoại bộ dữ liệu nhận dạng giọng nói tiếng ồn bộ dữ liệu trò chuyện bằng giọng nói điều khiển bằng giọng nói chuyển đổi giọng nói trợ lý giọng nói phát hiện hoạt động tổng hợp giọng nói bộ dữ liệu âm thanh bộ dữ liệu tính toán giọng nói bộ dữ liệu giọng nói bộ dữ liệu âm thanh
- Cập nhật ngày 9 tháng 3 năm 2022
coqui-ai / open-speech-corpora
Sao 902
- Mã số
- Vấn đề
- Yêu cầu kéo
- thảo luận
💎Danh sách kho ngữ liệu giọng nói có thể truy cập cho ASR, TTS và các Công nghệ giọng nói khác
chuyển văn bản thành giọng nói tts tổng hợp giọng nói nhận dạng giọng nói nhận dạng giọng nói chuyển giọng nói thành văn bản stt xử lý giọng nói phát hiện hoạt động giọng nói tách giọng nói nhận dạng cảm xúc nhân bản giọng nói
- Cập nhật ngày 27 tháng 7 năm 2022
alexylem / jarvis
Sao 773
- Mã số
- Vấn đề
- Yêu cầu kéo
Jarvis. sh là một trợ lý đa ngôn ngữ có thể cấu hình đơn giản
tự động hóa gia đình raspberry-pi trợ lý ra lệnh bằng giọng nói nhận dạng giọng nói trợ lý cá nhân jasper jarvis điều khiển bằng giọng nói sarah
- Cập nhật29 tháng 5 năm 2021
- Vỏ bọc
EDDiscovery / EDDiscovery
Sao 674
- Mã số
- Vấn đề
- Yêu cầu kéo
Nhật ký thuyền trưởng và bản đồ sao 3d cho Elite Dangerous
văn bản thành giọng nói giọng nói tạp chí ưu tú-nhật ký tạp chí ưu tú-tạp chí ưu tú-nguy hiểm-nhận dạng giọng nói edsm 3d-map eddn inara edDiscovery thuyền trưởng-log
- Cập nhật ngày 31 tháng 12 năm 2022
- C#
MycroftAI / mycroft chính xác
Sao 647
- Mã số
- Vấn đề
- Yêu cầu kéo
Trình nghe từ đánh thức RNN nhẹ, dễ sử dụng
raspberry-pi hệ thống nhúng nhận dạng giọng nói nhận dạng giọng nói điều khiển giọng nói phát hiện từ nóng phát hiện từ khóa đánh thức phát hiện từ
- Cập nhật 21/11/2022
- con trăn
evancohen / sonus
Sao 589
- Mã số
- Vấn đề
- Yêu cầu kéo
💬/vậy. nus/STT [speech to text] cho Node với tính năng phát hiện từ nóng ngoại tuyến
nút alexa nhận dạng giọng nói nhận dạng giọng nói điều khiển giọng nói thành văn bản stt phát hiện từ nóng phát hiện từ khóa
- Cập nhật24/10/2021
- JavaScript
ggeop / Python-ai-trợ lý
Sao 579
- Mã số
- Vấn đề
- Yêu cầu kéo
- thảo luận
Trợ lý AI của Python🧠
python nlp ai mongodb sklearn pymongo lệnh bằng giọng nói nhận dạng giọng nói nltk điều khiển giọng nói trò chuyện bằng giọng nói
- Cập nhật ngày 8 tháng 12 năm 2022
- con trăn
Picovoice / điểm chuẩn chuyển giọng nói thành văn bản
Sao 548
- Mã số
- Vấn đề
- Yêu cầu kéo
khung điểm chuẩn lời nói thành văn bản
quyền riêng tư deep-neural network học sâu ngoại tuyến nhận dạng giọng nói nhận dạng giọng nói thành văn bản pocketsphinx cheetah deepspeech aws-transcribe mozilla-deepspeech edge-ai google-speech-to-text picovoice
- Cập nhật ngày 9 tháng 10 năm 2022
- con trăn
Picovoice / tê giác
Sao 510
- Mã số
- Vấn đề
- Yêu cầu kéo
Công cụ chuyển lời nói thành ý định trên thiết bị được hỗ trợ bởi deep learning
nodejs javascript android python raspberry-pi iot ios deep-learning cortex-m lệnh thoại nhận dạng giọng nói nhận dạng giọng nói chuyển lời nói thành văn bản điều khiển giọng nói cortex-a giọng nói hiểu ngôn ngữ tự nhiên như một giao diện-công cụ ý định
- Cập nhật ngày 22 tháng 12 năm 2022
- bản đánh máy
algolia / lớp phủ giọng nói-ios
Sao 490
- Mã số
- Vấn đề
- Yêu cầu kéo
🗣Một lớp phủ nhận được sự cho phép bằng giọng nói của người dùng của bạn và nhập dưới dạng văn bản trong giao diện người dùng có thể tùy chỉnh
tìm kiếm swift ios object-c quyền đối với lớp phủ đầu vào giọng nói hội thoại-ui hội thoại nhận dạng giọng nói chatbot nhận dạng giọng nói tìm kiếm tức thì văn bản giọng nói chuyển lời nói thành văn bản tìm kiếm tức thì trợ lý giọng nói giao diện đàm thoại bot đàm thoại
- Cập nhậtngày 6 tháng 10 năm 2022
- Nhanh
Picovoice / con báo
Sao 469
- Mã số
- Vấn đề
- Yêu cầu kéo
Công cụ chuyển giọng nói thành văn bản trực tuyến trên thiết bị được hỗ trợ bởi deep learning
android python c raspberry-pi iot ios machine-learning arm học sâu lắp ráp web ngoại tuyến nhận dạng giọng nói nhận dạng giọng nói chuyển lời nói thành văn bản stt asr