Studentské práce
Detail studentské práce
Název: | Zpracování rozsáhlých textových dat |
---|---|
Typ práce: | Diplomová práce , Bakalářská práce |
Obor: | |
Rok zadání: | |
Zadáno: | volné |
Dokončeno: | dokončeno |
Zadavatel: | Švec Jan |
Detail
Zpracování rozsáhlých textových dat
Pro účely většiny praktických úloh z oblasti rozpoznávání řeči je nutné sestavit rozsáhlý textový korpus pro sestavení tzv. jazykového modelu. V současné době na KKY běží projekt Jazykového modelování z webu, který obsahuje řádově gigabajty textových dat určených pro automatické zpracování a využití jako trénovacích dat v úlohách modelování jazyka.
Předmět DP/BP
Výzkumná práce v oblasti zpracování rozsáhlých textových dat, např. zpracování "syrových" dat z webu, označení pojmenovaných entit, sumarizace textu, analýzy tématu a další
Požadavky na studenta
- Spolehlivost
- Schopnost a ochota programovat a testovat algoritmy v jazyce Python