Распознавание речи/Speech-to-text (STT)
  1. #1
    Всем Перцам - Перец Клуба! Аватар для FerrumB5
    Регистрация
    30.05.2007
    Адрес
    США (Чикаго)
    Возраст
    42
    Сообщений
    12,278
    Записей в дневнике
    2
    Спасибо:
    Получено: 2,430
    Отправлено: 439

    0 Вы не можете благодарить!

    По умолчанию Распознавание речи/Speech-to-text (STT)

    Ребят, а кто-нибудь занимается распознаванием речи? Интересуют бесплатные/недорогие/условно платные API, которые с MP3работают (НЕ WAV). Идеально - с библиотекой из 'R'
    (Модераторам - пускай чуток повисит здесь, а? Знаю, что есть профильная ветка, но туда, боюсь, мало ходят)
    1993 Passat B3, 1.8 ABS, 5sp МКПП; 1999 Passat B5, 2.8L AHA, 5sp Tiptronic, 2009 Passat B6, 2.0 TSI (CCTA), 6sp Tiptronic - были.
    2020 Passat NMS Typ2, 2.0 TSI, 6sp Tiptronic - есть

  2. #2
    Всем Перцам - Перец Клуба! Аватар для Kidont
    Регистрация
    27.12.2008
    Сообщений
    44,393
    Записей в дневнике
    1
    Спасибо:
    Получено: 7,308
    Отправлено: 5,287

    0 Вы не можете благодарить!

    По умолчанию

    Цитата Сообщение от FerrumB5 Посмотреть сообщение
    Ребят, а кто-нибудь занимается распознаванием речи? Интересуют бесплатные/недорогие/условно платные API, которые с MP3работают (НЕ WAV). Идеально - с библиотекой из 'R'
    (Модераторам - пускай чуток повисит здесь, а? Знаю, что есть профильная ветка, но туда, боюсь, мало ходят)
    а язык тебе какой нужен?
    Ловлю МНЛ в сети словоблудия.
    Что вам сказать за .... Я таки знаю пару существ (с)
    18+

  3. #3
    Всем Перцам - Перец Клуба! Аватар для FerrumB5
    Регистрация
    30.05.2007
    Адрес
    США (Чикаго)
    Возраст
    42
    Сообщений
    12,278
    Записей в дневнике
    2
    Спасибо:
    Получено: 2,430
    Отправлено: 439

    0 Вы не можете благодарить!

    По умолчанию

    English (US)

    --- Добавлено чуть позже ---

    WAV тоже можно, только что узнал.
    Есть Бинг Спич (мелкософтный), но я так и не смог им заслать тестовый файл, только по микрофону - а нужны именно наши тестовые файлы

    --- Добавлено чуть позже ---

    Дополнение: файлы в ВВВВАФФФ могут быть как 16 так и 8 кГц. Попробовал 8 кГц файл на IBM Watson (https://speech-to-text-demo.mybluemix.net/) - плохо, не катит
    1993 Passat B3, 1.8 ABS, 5sp МКПП; 1999 Passat B5, 2.8L AHA, 5sp Tiptronic, 2009 Passat B6, 2.0 TSI (CCTA), 6sp Tiptronic - были.
    2020 Passat NMS Typ2, 2.0 TSI, 6sp Tiptronic - есть

  4. #4
    Всем Перцам - Перец Клуба! Аватар для Kidont
    Регистрация
    27.12.2008
    Сообщений
    44,393
    Записей в дневнике
    1
    Спасибо:
    Получено: 7,308
    Отправлено: 5,287

    0 Вы не можете благодарить!

    По умолчанию

    android STT через файлы
    https://gist.github.com/alotaiba/1730160
    Ловлю МНЛ в сети словоблудия.
    Что вам сказать за .... Я таки знаю пару существ (с)
    18+

Ваши права

  • Вы не можете создавать новые темы
  • Вы не можете отвечать в темах
  • Вы не можете прикреплять вложения
  • Вы не можете редактировать свои сообщения
  •