neděle 5. února 2023

Online AI speech-to-text (STT) konvertory

To se může stát každému - najednou máte asi tak hodinu a půl nahraných rozhovorů a potřebujete je přepsat. A to ne jen že se vám nechce, ale ani to neumíte dost rychle. Pak se v době nastupující umělé inteligence obrátíte na internety s dotazem na nějaký online nástroj pro převod mluveného slova na text. Podmínkou je převod nahrávky češtině, upload hotové nahrávky a pak export do čitelného dokumentu.

Online speech-to-text (nebo-li STT) konvertory se staly nepostradatelnými nástroji pro řadu odvětví, jako je podnikový sektor, média a vzdělávání. Tyto nástroje vám umožňují převádět hlasové nahrávky na textový dokument, což vám ušetří - a to je to hlavní - čas a úsilí při ručním zapisování. 

Odpíchnete od článku Top 5 Online Speech To Text Converter For Free 2023. A z paměti vylovíte podcast DEEP TALKS 154: Filip Dřímalka – Budoucnost ve světě umělé inteligence pro načerpání nějakých postupů (zhruba uprostřed).

Filtrem prošly online speech-to-text konvertory Sonix, Amberscript, Go Transcribe a Transkriptor.

Sonix se mi jevil jako nejlepší volba, protože nabízí 30 minut zdarma a výstupem je (mimo jiných možných) funkční soubor ve formátu docx. Výsledný text lze také nejpohodlněji kontrolovat oproti nahrávce. Nahrávku lze snadno pouštět po odstavcích.

Amberscript i Go Transcribe má délku konverze zdarma omezenou na pouhých 10 minut. Transkriptor sice dovoluje až 90 minut zdarma, ale - už jsem ho nevyzkoušel.

Všechny programy se snaží rozpoznávat a odlišovat řečníky, což v horší nahrávce není spolehlivé. Na druhou stranu překvapivě dobře to odposlouchávalo text i z hlučnějšího hospodského prostředí s hlukem, hudbou i mluvením na pozadí. Je pak ale třeba provést důkladnější kontrolu a opravy.

Nestudoval jsem ale placené programy. Šlo o nárazovou akci spojenou s testováním. Podmínkou bylo také nevyžadování platebních údajů, což vyřadilo některé další aplikace, jako je třeba služba AI Transcription, Subtitles, & Translation | Simon Says, která je zaměřená na práci s videem.

Dále stojí za zmínku API od Google Speech-to-Text: Automatic Speech Recognition  |  Google Cloud a řádka "diktafonů" (bez možnosti uploadu hotové nahrávky) jako jsou SpeechTexter | Type with your voice! nebo Voice Notepad - Speech to Text with Google Speech Recognition

Také jsem pro vyčištění nahrávky vyzkoušel Auphonic. Opakovaný převod na text pak dal většinou přesnější výsledky. 

Bohužel kvůli OS jsem nemohl vyzkoušet Descript | All-in-one video editing, as easy as a doc. Je sice primárně na něco jiného, ale je to móc zajímavý.

V závěru lze říci, že volba nejlepšího online speech-to-text konvertoru závisí na vašich specifických potřebách a požadavcích. Zvažte výhody a nevýhody jednotlivých nástrojů a vyberte ten, který nejlépe vyhovuje vašim potřebám.


P.S.: Ex post jsem se dozvěděl o Good Tape. Nicméně vyzkoušel nakonec také. Na jedné horší nahrávce. Pozitivní je, že není třeba login, na druhou stranu výstup je pouze do ne zrovna přehledného textu (s časovými značkami nebo bez) nebo titulků "srt". GoodTape nerozlišuje mluvčí a výsledek je - no, přijde mi, že něco rozpozná lépe, něco jinak a něco hůř.


(S textem mi pomohl OPENAI ChatGPT.)

MAKE Magazine

Technology Review RSS Feeds

Nejčtenější příspěvky