Odborníci na řeč se specializací na zpracování audiozáznamů uvažují o tom, jestli lze nákazu koronavirem rozpoznat z nahrávky kašle. Již léta totiž analyzují plicní choroby ze zvukového záznamu. Diskutovat o tom budou příští týden v Brně.
Rozpoznávání řeči už se dnes běžně používá v domácnostech se zavedenými chytrými technologiemi. Mimo to vědečtí pracovníci v posledních letech pracují na možnosti diagnostikovat některá z dýchacích onemocnění právě z audiozáznamů. Získané zkušenosti by nyní chtěli využít také při rozpoznávání nákazy koronavirem z nahrávky kašle.
„Zatímco před pandemií jsme analyzovali různé formy kašle kvůli diagnostice chronických plicních chorob, tuberkulózy či astmatu, poslední dva roky jsme se zaměřili na zvukové projevy koronaviru,“ říká indický expert na řeč Siriam Ganapathy.
Upozorňuje, že v případě úspěchu by se ušetřily nemalé peníze vydané za testování a významně by se urychlila i diagnostika nákazy. Příležitost ve využití zvukového záznamu ve zdravotnictví do budoucna vidí také při získávání informací o aktuálním zdravotním stavu pacienta. Případně jeho duševním rozpoložení. Zdaleka tak nejde jen o nahrávky kašle.
Odborníci na řeč si zkušenosti vymění poprvé i v Česku
V příštím týdnu se vůbec prvně v historii sjedou odborníci na řeč, takzvaní řečaři, do České republiky. V Brně začne v pondělí 30. srpna pětidenní mezinárodní konference zvaná Interspeech, na kterou má dorazit stovka odborníků z celého světa. Přes tisíc hostů se ke konferenci připojí online formou.
„Heslem konference je Řeč všude. Zatímco dříve se výzkumu dolování dat z řeči věnovalo jen pár skupin, dnes je rozpoznávání řeči zahrnuto v každém chytrém telefonu a mnoha dalších zařízeních,“ říká k akci jeden z jejích organizátorů Jan Černocký z Fakulty informačních technologií Vysokého učení technického [VUT] v Brně.
Právě tam již po léta vede výzkumnou skupinu s názvem BUT Speech@FIT. Černocký ale upozorňuje, že i když se dnes audiozáznamy využívají stále na vícero místech, stejně nejsme s jeho výzkumem a rozvojem zdaleka u konce.
„Velkým tématem této doby je také trénování modelů strojového učení jen na malém množství dat,“ říká.
Získávat data z audiozáznamů je podle něj dost náročné a hlavně i finančně nákladné. Právě proto se teď výzkumné týmy z celého světa snaží naučit stoje, jak se mají učit jen z malých databází, které si může kdokoli a kdykoli jednoduše stáhnout například z YouTube či internetu obecně.
Vědci učí umělou inteligenci stále nové věci
Data získaná z audiozáznamů se podle vědců stále zpřesňují. Velkou výzvou je nyní naučit umělou inteligenci pracovat se zvukem i ve zhoršených podmínkách. Jako je například rozhovor lidí v dálce, s ozvěnou v kostele nebo třeba v restauraci plné lidí.
„Musíme řešit i jazykové pokrytí, protože nyní je velký rozvoj spíš u komerčně užívaných jazyků, jako je angličtina, francouzština, němčina a podobně, ale v budoucnu bude potřeba věnovat se i méně reprezentovaným jazykům,“ říká Černocký s tím, že některé z nich už nemají ani písemnou formu.
Brno o pořádání mezinárodní konference Interspeech usiluje již od roku 2015. Podle jejích pořadatelů i proto, že ve městě funguje mnoho IT firem, které se věnují právě zpracování dat ze zvuku. Velice aktivní jsou například již v oblasti financí a bankovních služeb.
Nahrávání hovorů o investicích nabízí i příležitost zlepšit byznys
Interspeech 2021 bude kombinovat prezenční i online podobu. Do Brna zavítá osobně přes 350 vědců, virtuálně se připojí dalších téměř 1 400. Celkově zde zastoupí všechny kontinenty. Nejvíce vědců dorazí z Evropy, Severní Ameriky a Asie. Organizační tým vybral k prezentaci 992 vědeckých článků z více než dvou tisíc zaslaných návrhů.
–RED–