Jak hledat předky pomocí google efektivněji

Čas čtení: 7 min.

Asi každý z nás často vyhledává pomocí služby google. Mnozí používají i nějaké ty „fígly“, díky nimž se dají vyřadit některé výsledky, které nás nezajímají. Ne každý ale nosí v hlavě všechny použitelné operátory, proto si je sem vypíšu. Snad se budou hodit i vám.

Kde vlastně google hledá?

Nebojte, je to jen takový stručný a zhuštěný úvod pro laiky. Google hledá v textech. Je-li tedy někde na internetu uloženo cokoliv v textovém formátu, je vysoká pravděpodobnost, že to dříve nebo později dokážeme přes google najít. Webové stránky obsahují kromě textů (a obrázků), které vidíme, ještě nějaké texty, které nevidíme a které pomáhají google a jiným vyhledávačům k tomu, aby nám poskytly relevantní výsledky vyhledávání. V nich tedy, logicky, google také hledá. Typicky jde o různá klíčová slova nebo stručné výpisy obsahu stránky, či popisy obrázků, které zadává tvůrce daného webu. Na něm pak záleží, nakolik jsou tyto texty přesné a konkrétní nebo pouze všeobecné.
Sám google ještě nedokáže přečíst text jen z obrázku, pokud není někde uložen výsledek někým jiným provedeného OCR (strojové čtení textu z obrázku). Dokáže však přečíst texty z většiny běžných PDF či DOC souborů. V obrázcích dokáže hledat buď podle výše zmíněného popisu obrázku, podle textu na stránce, kde se obrázek nachází, nebo dokáže hledat podobný obrázek tomu, jaký mu určíte (o tom budu psát dál).
Google nedokáže sám od sebe většinou přečíst texty z databází, pokud tvůrci databáze nedali na webovou stránku odkazy na výstupy z jejich databáze.
Dál také nedokáže přečíst texty na webech, které je možné si číst pouze po přihlášení, pokud k tomu tvůrce daného webu neposkytl google oprávnění.

Po tomto stručném úvodu už se budu věnovat operátorům (to jsou klíčové znaky nebo slova, kterým google rozumí jako pokynům, co má dělat, kde nebo jak má vyhledávat) a k dalším „fíglům“.

Důležité je hned na začátku uvést, že operátory můžeme v jednom dotazu kombinovat a používat jeden operátor víckrát.

Uvozovky

Uvozovky jsou asi nejčastěji používaný operátor při vyhledávání. Google totiž dnes už vyhledává poměrně „chytře“ a zadáme-li mu nějaké slovo nebo výraz, dokáže už i v češtině najít jeho výskyt na stránkách v různých časech a pádech. Někdy se ale hodí vyřadit ze hry toto „chytřejší“ vyhledávání, protože hledáme určitou frázi. Například nás zajímá spisovatel Václav Beneš Třebízský. Zadáme-li do vyhledávání pouze:

Václav Beneš

a ještě navíc bez uvozovek, dostaneme asi 1,4 milionů výsledků.
Zadáme-li:

„Václav Beneš“

takto s uvozovkami, dostaneme už pouze necelých 76 tisíc výsledků.
Po zadání výrazu:

„Václav Beneš Třebízský“

se už ale dobereme ke snesitelným (a mnohem přesnějším) necelým 14 tisícům výsledků.
Podobně je dobré omezit počet výsledků i v případě, kdy hledáme nějakou frázi, například:

„soupis poddaných podle víry“.

 

 
Další využití uvozovek spočívá ve „vnucení“ googlu hledání určitého slova. Například nás zajímá pouze spojení Václava Beneše Třebízského s Klecany. Je proto výhodnější zadat vyhledávání třeba pouze jako kombinaci přídomku s názvem obce (Třebízský Klecany). Takové vyhledávání nám vypíše něco přes 53 tisíc výsledků. Zadáme-li ale hledání s pomocí uvozovek takto:

Třebízský „Klecany“

dostaneme necelých 34 tisíc výsledků.

 

 
Toto jsou pouze náhodné příklady, v nichž efekt hledání fráze nebo vnucení hledání nějakého slova není příliš velký. V praxi ale člověk poměrně brzy tyto operátory ocení.

OR

Často se přihodí, že potřebujeme hledat nějaké slovo nebo nějaké jiné slovo. Vysvětlím to opět na příkladu Václava Beneše Třebízského. Jak už jsem psala, uvozovky způsobí, že google vyhledává přesný tvar slova nebo fráze v uvozovkách. To je pro češtinu nevýhodné, protože jsou pak vynechané další pády nebo časy. V už zmíněném příkladu hledání:

Třebízský „Klecany“

dostaneme výsledky pouze těch stránek, které obsahují tvar „Klecany“. Použijeme-li ale operátor OR můžeme dostat další výsledky. Takže napíšeme například:

Třebízský „Klecany“ OR „Klecanech“

což nám vypíše výsledky v případě, že je na stránce slovo „Klecany“ NEBO slovo „Klecanech“.

– (mínus)

Někdy je naopak dobré z hledání určitá slova vyloučit. Například hledáme Václava Beneše, ale nikoli spisovatele Třebízského. Je jasné, že výsledků, které se věnují spisovateli, bude hodně, proto je můžeme omezit použitím znaku mínus (-), což je vlastně znak, který většina lidí mylně nazývá „pomlčkou“. Napíšeme tedy:

Václav Beneš -Třebízský

což vyfiltruje z výsledků stránky, na kterých se vyskytuje slovo Třebízský v různých pádech (nedali jsme slovo do uvozovek).
Je nezbytně nutné, aby znak mínus byl hned těsně (tedy bez mezery) před slovem, které chceme s hledání vyloučit.

… (tři tečky)

Velmi zajímavým (a mým oblíbeným) operátorem jsou tři tečky (…), které pomáhají hledat v rozsahu čísel, tedy i letopočtů. Chceme například vyhledat události spojené s Třebízským v prvních deseti letech od jeho úmrtí. Zadáme tedy vyhledat:

Třebízský 1885…1895.

Je nezbytně nutné, aby tři tečky byly hned těsně (tedy bez mezer) za prvním rokem a před posledním rokem hledaného rozsahu.

Číslo v závorce

Dalším užitečným operátorem je číslo v závorce, které udává vzdálenost následujícího slova od předchozího slova. Například zadání:

Třebízský (10) 1884

ukáže ve výsledcích vyhledávání pouze ty stránky, na nichž je letopočet 1884 vzdálen 10 a méně slov od slova Třebízský.

* (hvězdička)

Hvězdička, která zastupuje slovo nebo znaky, je možná trochu pozapomenutým operátorem, ale google jí stále ještě jakž takž rozumí. Nemůžeme-li nějaké slovo přečíst nebo si jej nepamatujeme, můžeme jej nahradit hvězdičkou. Například při zadání:

„poddaných * víry“

ukáže google výsledky pro frázi „poddaných podle víry“.

 

 
Hvězdičku můžeme použít i v případě, že nepřečteme celé slovo, ale pouze jeho část. Například:

„*ořák“

(takto s uvozovkami) by měla vyhledat stránky, na kterých se vyskytuje slovo „Dvořák“, ale i například „hořák“, zatímco:

„Dvořák*“

(takto s uvozovkami) by mělo vrátit stránky, na nichž se vyskytuje například „Dovořáková“ nebo „Dvořákův“ apod. Toto už ale, bohužel, není až tak přesné, protože google nám vnucuje své „chytré“ algoritmy, které tento způsob vyhledávání znesnadňují. I přesto má ale smysl to vyzkoušet. V tomto případě je nezbytně nutné, aby znak hvězdičky byl hned těsně (tedy bez mezery) před písmeny, které známe.

allintext:

Tento operátor zařídí, že google vyhledá pouze stránky na kterých se v textu nacházejí všechna slova, která následují za operátorem. Zadáme-li například:

allintext: Třebízský Beneš Václav

dostaneme jako výsledek pouze ty strany, na kterých se tyto tři slova vyskytují, ale nemusí to být nutně v tomto pořadí a navíc může jít o slova jakéhokoli pádu (tedy i Václava Beneše Třebízského).

allintitle:

Jde o stejný způsob hledání jako v případě allintext, ale všechna slova se nacházejí v titulcích. Opět nezáleží na pořadí zapsaných slov. Hledání:

allintitle: Třebízský Beneš Václav

poskytne stejný výsledek, jako hledání:

allintitle: Václav Třebízský Beneš.

site:

Použitím tohoto operátoru můžeme omezit hledání pouze na určitý web. Například při hledání:

seznamy ztrát site:https://www.neznamo.cz/genealogie/

je výsledkem pouze 5 stran z tohoto mého webu, na kterých se vyskytují slova „seznam“ a „ztráta“ v jakémkoli pádě a nikoli jako fráze (pouze jsou ta slova použita někde na stránce, a to ani ne blízko u sebe).
Takto se dá vyhledávat na jakékoli stránce, i když daná strana nemá vyhledávání. Také se tak dá hledat například v digitální knihovně, která má vyhledávání pouze v jednotlivých zapojených knihovnách, ale nikoli napříč všemi knihovnami. Výsledky ale nebývají moc přesné ani kompletní.

filetype:

Toto je další zajímavý operátor, který omezí hledání pouze v určitých typech souborů. Použít se dají například typy pdf, docx nebo zip, ale i další. Například pro hledání:

berní rula filetype:pdf

jsou výsledkem pouze PDF soubory, které obsahují obě slova.

Hledání obrazem

Chcete-li hledat, zda se na internetu nevyskytuje stejná nebo podobná fotka, jakou najdete na nějakém webu nebo jakou máte u sebe v počítači, můžete se o to pokusit v prohlížeči Chrome (v jiném prohlížeči jsem zatím nenašla, jak na to). V Chrome je to jednoduché – stačí na jakémkoli webu kliknout na fotku pravým tlačítkem myši a zvolit z nabídky „Vyhledat obrázek pomocí vyhledávače Google“. Máte-li obrázek u sebe v počítači, stačí jej jednoduše přetáhnout do okna prohlížeče a opět použít pravé tlačítko myši.

Hledání v knihách na Google Books

Vyhledávat lze i přímo v různých službách google. Jednou z nich je Google Books, v níž lze hledat rovnou z vyhledávače google – najdeme ji po kliknutí na tři svislé tečky se slovem „Více“ pod názvem „Knihy“ nebo na této adrese: https://books.google.cz/.

Hledání v odborných publikacích na Google Scholar

Další zajímavou službou je Google Scholar na adrese https://scholar.google.com/. Jde o speciální vyhledávání ve vědeckých pracích, včetně vědeckých článků, ale i například diplomek. Pro nás je to velmi užitečný pomocník.

Hledání ve starém tisku z USA

Pro ty z nás, kteří hledáme i příbuzné, jež emigrovali do Ameriky, se hodí vyhledávání ve starých denících z USA (Newspapers), které je dostupné na adrese https://news.google.com/newspapers.

Pár rad na závěr

Vyhledávání na google lze také různě omezit. Nás z toho bude asi nejvíc zajímat omezení na konkrétní jazyk. To se dá udělat kliknutím v menu googlu na odkaz „Nástroje“. Objeví se další nabídka, v níž hned jako první položka je možno zvolit buď „Jakýkoli jazyk“ nebo „Stránky pouze česky“. Můžeme ale vyhledávat v jakémkoli jazyce (což se jistě hodí těm z nás, kdo hledáme i v jiných zemích).
Pro změnu nastavení jazyka vyhledávání je třeba kliknout na odkaz „Nastavení“ a v položce „Jazyky“ si vybrat ten správný.

Doporučuji také věnovat opravdu velkou pozornost správnému výběru slov pro vyhledávání. Někdy je to dost oříšek, zvlášť pokud hledáte předka se stejným jménem a příjmením, jaké měla i nějaká hodně známá osobnost.

Také na závěr ještě jednou připomínám, že operátory lze kombinovat.

10 odpovědí na “Jak hledat předky pomocí google efektivněji”

  1. Jedná se o „operátory“, nikoliv „operáty“, viz význam slova operát ve slovníku cizích slov (nemohu sem vložit odkaz), jako koneckonců všem genealogům známé sčítací operáty.

    1. Děkuji za korekci, opravím to v článku. Důkaz slovníkem není potřeba, vím to, jen se ve mě pak při psaní textu ozvala genealožka. 🙂 Ještě, že jste si všiml, jak tu „vesele“ střídám „operátor“ s „operátem“. Alespoň to tu nebude „strašit“ moc dlouho.

  2. Upozornění:
    V textu užíváte označení „mínus“ pro znak, který údajně mnozí nazývají pomlčkou.
    Správně se tento znak jmenuje „spojovník“.

  3. Děkuji za poznámku k názvosloví. Z klávesnice nejsnadněji přístupný spojovník (my v typografii používáme také označení divis, z francouzského diviser) opravdu není pomlčkou, ale valná většina laiků tento znak pomlčkou nazývá a z numerické klávesnice je dostupný jako minus. Články, které sem píšu, nejsou určeny pouze pro mě, ale píšu je i s myšlenkou toho, že jsou veřejně přístupné a že je proto budou číst lidé různých profesí a především různé úrovně znalostí názvosloví. Občas proto i místo některých genealogických nebo historických pojmů používám označení, kterým budou i zcela laičtí čtenáři rozumět spíše. Doufám, že k tomu budete i vy tolerantní tak, jak toto tolerují ostatní genealogové a historici. Děkuji.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.