Google stále inovuje - nyní začal indexovat obsah PDF souborů a texty z obrázků

Společnost Google Inc. se zdá se „nezastaví před ničím“, alespoň ne co se týká inovace jejich služeb. Nedávno nám vývojáři Google přinesli hned dvě změny: začali s indexováním textů ve flashových souborech a možností rozpoznávat obličeje na fotografiích v nové verzi programu Picasa.

Nyní tým vývojářů od Google oznámil, že začínají s indexací textů v PDF souborech a textů z obrázků. V případě obrázků bylo nutné použít technologii OCR (Optical character recognition), jenž se pro toto používá. Google použil opensource OCR software OCRopus, jenž mimochodem také sponzoruje. Google si myslí, že tento OCR systém brzy najde využití v mnoha dalších aplikaci.

Google stále inovuje - nyní začal indexovat obsah PDF souborů a texty z obrázků (http://www.swmag.cz)

Zdroj: Anglický Google blog

Novinka Google stále inovuje - nyní začal indexovat obsah PDF souborů a texty z obrázků byla publikován 1. listopadu 2008 v 10.45. Autorem novinky je Jaroslav Nezbeda. Pro diskusi slouží komentáře (0).

Prosím čekejte ...