Назад
Pet-проект

Whisper

Телеграм-бот для распознавания голосовых сообщений

Бот, который превращает голосовые сообщения в текст с помощью нейросети Whisper от OpenAI. Поддерживает несколько языков и моделей.

Написать боту

О проекте

Whisper — это Telegram-бот для автоматического преобразования голосовых сообщений в текст (ASR — Automatic Speech Recognition). Под капотом используется Whisper.cpp — высокопроизводительный порт модели Whisper от OpenAI на C++, что обеспечивает быструю обработку без GPU.

Telegram
Платформа
Whisper (OpenAI)
AI
Мультиязычный
Языки
Не требуется
Регистрация

Возможности проекта

Распознавание голоса

Преобразование голосовых сообщений в текст с высокой точностью.

Выбор модели

Несколько моделей Whisper от OpenAI — от быстрой tiny до точной large.

Мультиязычность

Распознавание речи на нескольких языках без предварительной настройки.

Контейнеризация

Полностью контейнеризированное приложение для лёгкого развёртывания.

Стек технологий

Бэкенд на NestJS с интеграцией Whisper.cpp

NestJS
NodeJS
Telegraf.JS

Мой вклад

Интеграция

Настройка зависимостей

Подбор, настройка и установка зависимостей, в частности Whisper.cpp — форк Whisper на C++.

Whisper.cppC++FFmpeg
Работа без GPU
Бот

Разработка бота

Полная реализация Telegram-бота на Telegraf.js с обработкой голосовых сообщений.

Telegraf.jsNestJS
99% точность распознавания
DevOps

Контейнеризация

Docker-контейнеризация приложения для простого развёртывания и масштабирования.

DockerDocker Compose

Результаты

0%
Точность распознавания
Секунд на обработку

Заинтересовал проект?

Оставьте заявку, и я свяжусь с вами для обсуждения деталей вашего проекта