Komponenty

Vítejte na webu 3.0: Sémantické vyhledávání

OMG!!! MEGA PR BALÍK Z USA

OMG!!! MEGA PR BALÍK Z USA
Anonim

Zatímco hledání klíčových slov zůstává nejoblíbenější metodou, většinou to není přesné, uživatelé se někdy dostanou až na 30 000 zásahů do vyhledávání a poté musí prohledat seznam volně souvisejících výsledků klíčových slov, aby našli příslušné dokumenty.

"Toto je místo, kde do rámu přichází nové plemeno takzvaných sémantických technologií. jako je např. Google PageRank pro předvídatelnost významnosti, sémantické hledání se ponoří do významu v jazyce a produkují vysoce relevantní výsledky vyhledávání ", uvádí zpráva analytiků Ovum Mike Davis a Madan Sheina. c poskytovatelé webových služeb, které analytici označili jako Expert System, Powerset, Yedda, Trovix a Hakia. Podle autorů se povědomí o sémantickém hledání zvýšilo, když společnost Microsoft zvedla dvě sémantické vyhledávací společnosti Powerset a Zoomix.

V případě Expert System je její aplikace nazvaná Cogito navržena podle principů lidského porozumění, být chápán způsobem, jakým to autor zamýšlel. "Hledání Google pro slovo" jaguar "by vyneslo obsah kolem zvířete a auta. Sémantické vyhledávání by vypadalo nejen na klíčové slovo, ale i na další slova kolem něj jako" džungle nebo "saloon" pro oddělení obou významů, "uvedli autoři.

Hlubší analýza

Kromě sémantického hledání existují i ​​jiné formy, včetně heuristiky a ontologie, lingvistiky a textové dolování a statistické. Expertní systém však tvrdí, že tyto přístupy jsou nedostatečné, řeší pouze morfologické a gramatické aspekty analýzy.

Další vyhledávací stroje často zasahují do cihlové zdi, pokud jde o hlubokou analýzu. Například, když heuristicky řízený vyhledávač vidí dvě přídavná jména ve větě, obvykle je vyprázdní a vyhodnotí větu jako neutrální, protože nemá pochopení, kde se dvěma adjektivami ukazují.

Pro srovnání vypadá sémantické vyhledávání v obou větách logika - jak se slova ve větě vztahují k sobě navzájem - a sémantická analýza - porozumění kontextu klíčových slov

Když je termín nejednoznačný, což znamená, že může mít několik významů, například kůra, je nutná sémantická analýza na druhé straně to, co je obklopuje, aby jí dalo svůj pravý smysl a kontext.

Lexikální databáze

Inženýři z Expert Systems říkají, že Cogito může jít navíc, protože má sémantickou síť - lexikální databázi který poskytuje znalostní reprezentaci definic slov a jejich vztahů. Webmanův slovník se nalézal v databázi v paměti - zahrnující 350 000 slov a 2,8 milionu vztahů.

"Sémantická síť Expert System se soustřeďuje také na běžná slova, která se liší od většiny ontologických přístupů, které se týkají zabalení významu a kontextu kolem specializovaných jako jsou vědecké pojmy, a přeskočit běžná slova, která tvoří 90 procent veškerého obsahu, "říká autoři Ovum.

Nicméně sémantické vyhledávání je stále plné" hodně teoretického humbuk, ale málo skutečné podstaty nebo důkazu, že funguje lépe než současná technologie vyhledávání.

"Sémantické sítě jsou obtížné stavět a ne všechny jsou stejné. Je nepravděpodobné, že sémantické technologie budou vždy schopny poskytnout 100% přesnost ve své analýze a výsledcích. Kromě toho stále existují otázky ohledně potenciálně problémových problémů výkonu s sémantickým vyhledáváním, které znají více cyklů zpracování. "