Detail studentské práce
Název: |
Zpracování rozsáhlých textových dat
|
Typ práce: |
Bakalářská práce , Diplomová práce |
Obor: |
|
Rok zadání: |
|
Zadáno: |
volné |
Dokončeno: |
|
Zadavatel: |
Švec Jan
|
Detail
Zpracování rozsáhlých textových dat
Pro účely většiny praktických úloh z oblasti rozpoznávání řeči je nutné sestavit rozsáhlý textový korpus pro sestavení tzv. jazykového modelu. V současné době na KKY běží projekt Jazykového modelování z webu, který obsahuje řádově gigabajty textových dat určených pro automatické zpracování a využití jako trénovacích dat v úlohách modelování jazyka.
Předmět DP/BP
Výzkumná práce v oblasti zpracování rozsáhlých textových dat, např. zpracování "syrových" dat z webu, označení pojmenovaných entit, sumarizace textu, analýzy tématu a další
Požadavky na studenta
- Spolehlivost
- Schopnost a ochota programovat a testovat algoritmy v jazyce Python