Reklama
Nepřihlášený uživatel | Zaregistrovat se
 

Téma:

Koníčky a zálibyNové

Spravují:

Misa,
ClariciaReklamaFórum o Actapublica - tam směřujte příspěvky o této aplikaci, dotazy na funkčnost apod.
Fórum o eBadatelna (SOA Praha) - připomínky k této aplikaci směřujte tam
Fórum o archivním katalogu AHMP - diskuse o (ne)fungování badatelského systému AHMP, zpřístupňovaných datech, apod.
Fórum o genetické genealogii - o testech DNA a všem souvisejícím

Rody "stěhovavých" povolání - společný projekt pro mapování mlynářů, kovářů, pivovarníků, ovčáků a dalších povolání, která se za svou prací stěhovala z místa na místo.
Rozcestník genealogických odkazů
Genebáze

Žádosti o čtení záznamů patří spíše na http://genealogie.taby.cz - tady většinou mnoho pochopení nenajdou.

Jo, ten GitHub mě napadl taky, vlastně bych to viděl stejně až na ten standard. Tam si nejsem úplně jistý. Bylo by dobré dosáhnout toho, aby tvorbu indexů mohl dělat každý, i ten, kdo ovládá třeba jen Poznámkový blok. Žádná složitá a ukecané syntaxe. Nějaký TOML třeba.
honyk Východní Čechy 
S Transcribusem jsem dělal pokusy, kdy to bylo v Beta verzi a zdarma. Používal jsem jejich výchozí modely pro kurent, ale bylo znát, že zdrojem modelu byly německé texty. Místo českých slov mi to cpalo podobně vypadající německá slova i jejich diakritiku. Vytvořit vlastní model naráží na právní otázku. Skeny je potřeba nahrát na transcribus server, jenže majitelem skenů je archiv a ten podobnou operaci nepřipouští. Ideální by tedy bylo, aby toto šlo spíše cestou přes národní instituce. Archivy by si vytvořily typizované modely a proháněly jimi matriky, výstupy by sdílely na jejich webu, ideálně tak, aby veřejnost měla možnost záznamy opravovat (moderovaně).
honyk Východní Čechy 
Ale to přepisování je spíš úkol pro stroje. MyHeritage digitalizuje miliony záznamů z různých koutů Evropy a to nedělají lidi. Jsou tam chyby, jasně, ale ty systémy se neustále vylepšují. Základem je část skenů přepsat a pak nechat stroje vytvořit "model", který se pak aplikuje na zbytek. Slibné výstupy lezou třeba z tohoto https://readcoop.eu/transkribus/
honyk Východní Čechy 
V patičce stránek je zmínka, že data jsou ve formátu XLSX a HTML na https://matriky.msts.cz/ Ideální by bylo mít nějaký mezinárodní standard (XML schéma). Konverze z Excelu do XML je celkem přímočará. A pak to hrnout do veřejného repozitáře na GitHubu. Časem by se nad tím dalo asi udělat i nějaké REST API, takže data by šla využít pro různé online aplikace.
Nechci to posuzovat na první pohled, ale když to autor zabalí, co se stane s veškerou prací přispěvatelů? O to mi jde. Jestli existuje nějaký standard, který dalece přesahuje práci jednoho člověka nebo malého kolektivu, a bude tu, až mi tu nebudem.
stoural Dějiny nejsou mrtvou historií  Stránky klanu Šemíků
Příklad pokusu o indexaci je např. zde: www.requiro.cz
Agregace indexů
Všiml jsem si, že existuje několik různých webů, kde jsou soustředěné dílčí matriční indexy, zpravidla nějak zpracované autorem webu, a zveřejněné, dokud autor webu tento web provozuje. Zabýval se někdo někdy nějakým řešením, které by agregovalo tyto indexy do jednoho celku, který by byl jednotný a provozně nezávislý na autorovi? Případně viděl někdo někdy takové řešení?