• No results found

Language Recognizer View

N/A
N/A
Protected

Academic year: 2022

Share "Language Recognizer View"

Copied!
1
0
0

Loading.... (view fulltext now)

Full text

(1)

E4

Language Recognizer View

Aplikace slouží k zobrazení výsledků identifikace jazyka zvoleného textu nebo souboru. Na konsoly, případně do souboru, vypíše věty a hodnoty jejich pravděpodobností v jednotlivých modelech. Hodnota s největší pravděpodobností je pak barevně zvýrazněna (identifikovaný model jazyka).

Povinné parametry

Parametr Popis

file Soubor s texty, je možné zadat pouze jeden soubor.

text Je možné zadat pouze text (v uvozovkách), na kterém se má identifikovat jazyk, pak není povinný parametr „file“

model Model, který se použije při identifikaci jazyka a je umístěn ve složce „Models“

Volitelné parametry

Parametr Popis Možné

hodnoty

Defaultní hodnota models all Použije všechny modely ze složky „Models“, která je

v hlavní složce aplikace.

order

Stupeň n-gramů, který se použije pro identifikaci jazyka. Pokud se zvolí vyšší stupeň než mají modely, použije se nejvyšší stupeň modelů.

Celé kladné

číslo

5 encoding Kódování vstupního textového souboru. Stejné

kódování se použije pro výstupní soubory.

Textový

řetězec UTF-8 separators

Oddělovače vět v odstavci. Oddělování odstavců je automatické. Pokud se nezadají žádné oddělovače, bude text rozdělen jen podle odstavců.

Textový řetězec min_length Minimální délka vět včetně oddělovače. *znaky+

Celé kladné

číslo

1

ignore_next_separator

Pokud je délka věty kratší než parametr

„min_lenght“, ignoruje následující oddělovač, tak aby získal delší větu.

true/false False

lower_case

Převede všechny znaky rozpoznávaného textu na malá písmena. Při použití tohoto parametru by i modely měly být natrénovány na textech s malými písmeny.

true/false False

file_out Při nastavení se výsledky nezapisují na konsoly, ale do zadaného souboru.

Textový řetězec

Příklad

LanguageRecognizerView file data.txt encoding windows-1250 model Czech model Slovak order 6 separators .?! ignore_next_separator true

Výstup

Zobrazení výsledků na konsoly. Vlevo jsou hodnoty log(p) zvolených modelů pro

rozpoznávanou větu, která je vpravo. Nejvyšší hodnota log(p) pro danou větu je pak

zvýrazněna barevně.

References

Related documents

„ano“ byla využita pro 76 rodičů, jejichž dítěti byl navržen odklad povinné školní do- cházky, což činí 91% z celkového počtu 84 rodičů dětí, kterým byl

Pokud je záporné, musíme z něj udělat kladné (změnit znaménko nebo násobit -1) a poté ho vypsat na obrazovku. Pokud je kladné, můžeme ho rovnou vypsat

Jižní fasáda se skládá z mléčného skla, má vlastní nosný sys tém, který je navázaný na ocelové sloupy nesoucí konzole, viz.. Fasáda sálu je stejně jako fasáda jižní z

Vzhledem k většímu využívání odkladů povinné školní docházky u dětí předškolního věku, jsem si vybrala téma práce s názvem Rozvoj dítěte s odkladem povinné

[r]

V práci jsou vymezeny základní a dílčí cíle, které jsou v koncepci práce patřičně rozpracovány.. Cíle jsou

5FOUP1PEGPOEVTJMVKFP[IPEOPDFOÎLBQJUÃMVWF TUǥFEOLJEPCÊNBßEMPVIPEPCÊNIPSJ[POUVJOWFTUPWÃOÎN

Teoretickii d6st je logicky dlendnS. Autor popisuje pifrodnf vlSkna rostlinndho pfivodu jejich chemickd sloZenf a mechanickd vlastnosti. Poukazuje na kritickou