Android

Google: Provedli jsme průlom ve vyhledávání obrázků

Obři a megality na Sardinii

Obři a megality na Sardinii
Anonim

Lidé mohou vyniknout při rozpoznávání vzoru, ale počítače nemají při identifikaci obrazů moc chytré. Naše mozky mohou okamžitě identifikovat fotografie slavných orientačních bodů, jako je Socha svobody nebo Velká čínská zeď, ale počítače jsou obvykle bezradné bez textových štítků jako podvodník.

To může být změna, pokud výzkumný projekt Google "počítačové vidění" vyvrcholí. Pátý gigant v pondělí představil dokument o rozpoznávání mezníků na konferenci Computer Vision and Pattern Recognition (CVPR) v Miami. Nová technologie umožňuje počítačům rychlé ID. obrazy více než 50 000 světových památek s 80% přesností, tvrdí Google.

Společnost Google rychle uvádí, že její technologie rozpoznávání vzoru je stále výzkumným projektem a nikoliv novou službou. To dává smysl, protože vyhledávací nástroj, který je správný, jen 8 z deseti pokusů není připraven na hlavní čas. Přesto je tento koncept spíše v pohodě a může být prospěšný pro cestující, pokud Google jednou zvýší míru přesnosti. Schopnost zachytit fotografii neznámého orientačního bodu a nechat jej okamžitě identifikovat svůj smartphone nebo fotoaparát s podporou sítě, bude podle mého názoru populární. Samozřejmě existuje také potenciál pro vědecké a spotřebitelské aplikace, o kterých nikdo nepomyslel.

Tak jak to funguje? Jay Yagnik, vedoucí výzkumu počítačového vidění společnosti Google, vysvětluje blogový příspěvek. Prvním krokem je použití 40 milionů fotografií označených GPS z dvou služeb Google, Picasa a Panoramio a webových stránek průvodce online, které sestaví seznam orientačních bodů. "Dále jsme nalezli kandidátské snímky pro každý orientační bod s využitím těchto zdrojů a Google Image Search, které jsme pak" prořezali "pomocí efektivního přizpůsobování obrazu a bez dohledu na shlukování," píše.

Posledním krokem bylo vytvoření indexovacího systému pro rychlé rozpoznávání snímků. Ale i přes chytrý projekt, přesné vyhledávání obrázků zůstává obtížné. Jak ukazuje níže uvedená fotografie, nesouvisející orientační body mohou sdílet podobné architektonické prvky; také zahrnutí obrovského banneru nebo vlajky může vést k falešnému zápasu.

Doufejme, že výzkumný projekt společnosti Google zlepší vyhledávání obrázků, které jsou dnes příliš závislé na označování. Dalším krokem by bylo najít způsob, jak identifikovat nesčetné množství obrazů bez mezipaměti, ale tento úkol se zdá být nekonečně náročnější.