Fulltextové hledání v nových předpisech

Formulář pro standardní zadání dotazu:


Formulář pro pokročilé zadání dotazu:

Search For:
Match:  Any word All words Exact phrase
Sound-alike matching
Within: 
Show:   results   summaries
Sort by: 

Odkaz na originální manuál v angličtině

Pokyny pro zadávání dotazu:

Dotaz tvořený jedním slovem:
  • vliv velikosti písmen: pokud je dotaz zadán malými písmeny, najde dokumenty s výskytem všech slov psaných jak malými, tak velkými písmeny; pokud je však v dotazu použito velké písmeno, najde dokumenty s výskytem slov ve stejném tvaru. Toho se dá využít tak, že zadáním dotazu s prvním písmenem velkým jsou vyhledány všechny výskyty na začátku vět nebo jména vlastní a nebo zadáním dotazu se všemi písmeny velkými vyhledá výskyty v nadpisech
  • hledání v určitých polích: jako např. title, alt, desc, keys, body, url. Dotaz se zadává ve tvaru např. title: sbírka. Pole body označuje vlastní text dokumentu
  • hvězdičková konvence: kromě hvězdičky na konci slova, která dovoluje vyhledat slova různých gramatických tvarech tvořených příponami, je zde možné zadat hvězdičku i na začátku slova, což umožňuje hledat gramatické tvary tvořené různými předponami

Dotaz tvořený dvěma a více slovy:
  • více podobných slov: hledání poskytne více dokumentů než kdyby byla slova zadána jednotlivě a výsledek je proto relevantnější
  • uzavření dotazu do úvozovek: umožňuje vyhledat tzv. frázi, tedy výskyty zadaných slov vedle sebe a v uvedeném pořadí. Uvnitř úvozovek smějí být použity hvězdičky
  • použití značek + a -: značka + před slovem podmiňuje povinný výskyt tohoto slova, značkou - se označují nežádoucí slova

Pokud má někdo zkušenosti se zadáváním dotazů s pomocí logických operátorů (AND, OR, NOT, NEAR, ...) a má pocit, že je zde postrádá, tak je to jen zdání. Při zadávání více slov je výsledek stejný, jako kdyby byl použit operátor OR. Pokud je u některých vyhledávacích systémů použit operátor AND, může být výsledkem hledání takový dokument, kde se jedno slovo vyskytuje na začátku a druhé na konci dokumentu, což má většinou jen minimální relevanci. Proto byl zaveden operátor NEAR, který funguje jako AND, ale podmiňuje blízkost obou slov. Zde takto funguje hledání frází. Konečně operátor NOT je zde nahrazen použitím značky - před slovem. Stejný efekt jako operátor AND má zaškrtnutí volby All words ve formuláři pro pokročilé hledání. Dá se řící, že tento způsob zadávání dotazu je více intuitivní a že logické operátory nebudou nikomu chybět.

Příklady z oblasti právní informatiky:
  • daně: pokud někoho zajímá oblast daní, může zadat dotaz: daň* daně* daní* dani, který demonstruje víceslovný dotaz s využitím hvězdičkové konvence a řeší tak problém různých gramatických tvarů hledaného pojmu;
    když zadáte jako dotaz pouze slovo daň, vyhledají se i dokumenty s výskytem dalších gramatických tvarů tohoto slova (ale ne všechny). Vysvětlení je následující: fulltextový systém Atomz.com obsahuje i lingvistiku pro češtinu (říkají tomu "Word Endings Dictionary"), ale zatím o ní nevíme žádné podrobnosti. Budeme kontaktovat jejich "support" a s výsledky Vás seznámíme.