Přejít na obsah

Studentské práce

Detail studentské práce

Název: Zpracování rozsáhlých textových dat
Typ práce: Diplomová práce , Bakalářská práce
Obor:
Rok zadání:
Zadáno: volné
Dokončeno: dokončeno
Zadavatel: Švec Jan

Detail

Zpracování rozsáhlých textových dat

Pro účely většiny praktických úloh z oblasti rozpoznávání řeči je nutné sestavit rozsáhlý textový korpus pro sestavení tzv. jazykového modelu. V současné době na KKY běží projekt Jazykového modelování z webu, který obsahuje řádově gigabajty textových dat určených pro automatické zpracování a využití jako trénovacích dat v úlohách modelování  jazyka.

Předmět DP/BP

Výzkumná práce v oblasti zpracování rozsáhlých textových dat, např. zpracování "syrových" dat z webu, označení pojmenovaných entit, sumarizace textu, analýzy tématu a další

Požadavky na studenta

  • Spolehlivost
  • Schopnost a ochota programovat a testovat algoritmy v jazyce Python