Nastavení
close

Verze 0.1 (alpha)

Datum zveřejnění: září 2014

Verze 0.2 (beta)

Datum zveřejnění: srpen 2015

Verze 0.3 (beta)

Datum zveřejnění: září 2015

Verze 1.0

Datum zveřejnění: říjen 2015

Verze 1.1

Datum zveřejnění: leden 2016

Kdo Treq vyvíjí?

Návrh a realizace: Martin Vavřín, Alexandr Rosen

Nástroj pro zarovnání slov a extrakci slovních párů: GIZA++ (Och, F. J. – Ney, H. (2003). A systematic comparison of various statistical alignment models. Computational Linguistics, 29(1), 19–51.), s díky Ondřeji Bojarovi a Davidu Marečkovi za pomoc s instalací. Výsledek automatické excerpce už nebyl nijak revidován.

Za podněty k vývoji trequ vděčíme Elżbietě Kaczmarské.

Uživatelské rozhraní: Martin Vavřín

Příprava dat: Pavel Procházka, Martin Vavřín

Grafická podpora: Jan Kocek

© 2015, ÚČNK
Jazyk 1:   Čeština Jazyk 2: Lemmata 1) 2):
Dotaz: Hledat v: Omezit na 3):

Nápověda

Upozornění: společně s vydáním nové verze korpusu InterCorp byla 9. 9. 2016 aktualizována i data pro Treq. Treq tedy nyní pracuje s daty korpusu InterCorp verze 9.


Nevíte, jak nejlépe přeložit nějaké slovo? Potřebujete vymyslet vhodné synonymum? Zkuste Treq! Treq je sbírka oboustranných česko-cizojazyčných slovníků, vytvořených automaticky z paralelního korpusu InterCorp.

Nejdříve zvolíme cizí jazyk (Jazyk 2:) a jazyk zadávaného slova (Hledat v:). Slovo můžeme zadat v konkrétním tvaru nebo jako lemma (Lemmata: Ano/Ne). Můžeme si také vybrat, zda má být výsledek založen na excerpci z beletristického jádra, z jednotlivých kolekcí, nebo ze všech textů v InterCorpu (Omezit na:). Pak slovo zadáme (Dotaz:) a klikneme na Hledej. Výsledkem dotazu je seznam nalezených překladů zadaného slova, implicitně setříděných sestupně podle frekvence. Pro ověření výskytu v kontextu je možné si dvojici výrazů vyhledat dotazem do korpusu InterCorp kliknutím na ekvivalent. Počet výskytů se však může lišit – paralelní dotaz najde i konkordance, v nichž potenciální ekvivalent odpovídá jinému slovu.

Treq vychází z textů 9. vydání paralelního korpusu InterCorp. Originální a překladové texty jsou nejprve na základě statistických výpočtů zarovnány po slovech pomocí programu GIZA++ (Och–Ney 2003). Zarovnané dvojice slov jsou pak setříděny a sumarizovány. Výsledek automatické excerpce není nijak revidován, jako ukazatel relevance překladového ekvivalentu však může posloužit relativní frekvence příslušné dvojice slov. Čím častěji se ekvivalent zadaného slova vyskytl ve srovnání s ostatními ekvivalenty, tím větší je pravděpodobnost, že je funkční.