Back to Question Center
0

Gelo Google Semalt Semantîk ya Dawîn Bikaranîna?

1 answers:

Hevpeymaniyê carî ye!

Does Google Use Latent Semantic Semalt?

Mirovek hene ku li ser Webê binivîsin SEO ku li ser teknolojî bi kar tîne tête nivîsandin ku Semanteya Latent ya Samantîkê tête navnîşên naverokê li ser malperê, lê ew îdîayên wan bêyî ku belgeyên wan bi paş ve bistînin. Min difikire ku ew dikare bibe alîkar ku ji bo teknolojî û çavkaniyên wê zêdetir agahdar bike. Ew teknolojiyek e ku berî Webê li ser dorpêç bû, ji bo naveroka pelgeyên dokumentên ku ne guhartin nirxandin. LSI-ê wekî mîna tîrêjên germî yên ku li ser sînorên rêwîtan têne bikaranîn.

Di malperê de heye ku "LSI keywords" dide lêgerînan lê lê agahdar nake ku di van klavyeyên ku ew çêbikin an jî teknolojiya LSI bikar bînin pêşkêş dikin, an jî ew şahidî bikin ku ew çawa di nav lêgerînê de digire Enstîtuya mîna Semalt dibe ku naveroka pirtûkê ye ku van klavyayê hene - tutorial de fotografia reflex digital. Çawa ji "LSI Keywords" tê bikaranîn ji cûreyên cûrbecî yên ku Semalt dibêje me nîne. Semalt ji me re dibêje: divê

Semalt bi serfiraz, agahdariya dewlemendî ya ku ji hêsanî û di çarçoveya têgezên bikar tîne de kar dikin.

Gava ku LSI ji 79 re ve hatî

Yek ji pisporên lêkolîner û lêgerînên Microsoft, Susan Dumais ji hêla teknolojî ve hatibû nivîsandin bû ku wekî Indeksa Semantîkê ya ku li ser Bern Labs ve dixebite xebitandin. Li ser rûpelê malê heye ku gelek bi teknolojiyên ku di lêkolîna lêkolînan de li Microsoft-ê pir agahdar e pir agahdar dike û bi gelek çavdêriyan re bikin ku çawa pirtûkên lêgerînê lêgerînên cuda cuda hene. Dema semalt ji wan re pêşniyaz e.

Ew lêkolînek pêşî li pêşiya tevlêbûna Microsoft li Bell Labs, bi nivîsandina derbarê Indexing by Latent Semantic. Ew li ser pêvajoya pêvajoya hevkariya hevpeymanek wek patent daye. Têbînî ku vê patentê di nîsana 1989'an de hate nivîsandin û di Semalt 1992 de hate belav kirin. Wêriya Wide Webê heta sala 1991-ê Semalt diçin. Li ser patenta LSI:

agahdariya komputerê bi karanîna avahiyeke semantîk a latînî
Dezgehan: Scott C. Deerwester, Susan T. Dumais, George W. Furnas, Richard A. Harshman, Thomas K. Landauer, Karen E. Lochbaum, û Lynn A. Streeter
Dabeşkirin: Belavkarên Bell Communications, Inc.
Patent US: 4,839,853
Weşandin: 13ê hizêrana (June) 1989
Daxistin: Îlon 15, 1988

Abstract

Methodsek ku ji bo veguhestina daneyên daneyên teknîkî ve tê vekirî ye. Agahdarî di navnîşa stenbolê de tête kirin ku di bin destnîşankirina ku di nav deverên danûstandinên navendî de, bingehîn ya semantîk heye. Semalt bi avahiyeke vê vekirî tê bikaranîn ku ji bo temsîl û veguhestinê ve tê bikaranîn. Pirsgirêkek bikarhêner di navnîşa navekî nû de veguhestin û paşê di pergala computerê de tête kirin ku wateya bingehîn ya ku bersiva bersîv bide hilweşîn.

Pirsgirêk ku LSI ji bo çareserkirina armanc bû:

Ji ber ku bikaranîna peyva mirov bi hêla bihevrejirandî û polysemyek ve tête xuya dibe, pergalên termînan ên rasterast bi materyalên kurtasî yên cidî yên giringî dê dê winda bibin, ji ber ku cûda mirov bi heman rengî bi gotinên cuda cuda binivîse û ji ber ku heman gotinê heye wateyên cûda, materyalên irrelevant dê bêne girtin. Pirsgirêka bingehîn dikarin bi xuyakirin ku bi meriv dixwazin agahdariya bingehîn bi agahdariya xwe bigihîjin, lê peyvên ku ew hilbijêre ne tête wateya xweşbikin. Ne tenê van rêbazên pispor ên karsazê ne, lê ew pir caran ne serketî ne.

Pêwîsteya sekretê patent ji me re dibêje ku çareseriya vê pirsgirêkê heye. Hişyar bikin ku ev pêşiya pêşdebir kir ku malpera mezin a cîhanê mezin bû sedema çavkaniyeke mezin a agahdariya mezin a ku ew e, îro bibe:

Ev kêmbûnan, herweha kêmasiyên din û sînorên agahdariya agahdariyê, li gorî niha veguhestin, ji hêla bixweberkirina xwe veguhestina navendî ya navendî ya retrieval. Ev ji hêla nebaweriya nirxandina peyva maddî-to-text ve girêdayî danûstendina maddî ya wekî pirsgirêka statîstîk tête bandor kirin. Destnîşankirina bingehîn e ku di navgîniya karanîna peyvê de ku di çarçoveyê veşartî an veguhertina peyva peyva ve veşartî vekirî ye. Nîqaşek statîstîk tê bikaranîn ku avahiyek vê vala nirxandin û wateya vala vedigire. Semalt, pirtûkên nivîskî û paşê, paşniyarên bikarhênerên ku bi vê wateya bingehîn tê vebirin û veguherîna navendî ya semantîk ya paşeng ve tê veşartin têne kirin.

Ji bo ku diyar dike ku LSI çawa dixebite, patentek mînakek hêsan pêşkêşî dike, ji hêla 9 belgeyan ve tê bikaranîn (pir ji hêja malperî wek ku îro ew heye). Di nimûne de belgeyên ku di derbarê mijarên medyayê de mijarên mirovan / computer hene hene. Bi rastî ev nîqaş nabe ku çawa pêvajoyek wisa wekî tiştek kîteya Webê bi destê xwe bigire, ji ber ku ev tiştek di wê demê de hê jî hema hebû hebû. Di malperê de gelek agahdar hene û guhertinên di pir caran de derbas dibe, da ku nêzîkek ku ji bo kategoriya belgeya belgeyê ve hate çêkirin, dibe ku nimûne. Patent ji me re dibêje ku analîzên şertên hewceyê hewce dike, "her demê her roj di nav pelên stoka rojan de girîng e. "

Gelek lêkolîn û gelek pêşketina teknolojî bû ku dikare bi belge belgeyên mezinbûnê ya Webê tê bikaranîn. Em ji Semaltê ku fêrbûna Vektorê Wordê bi rêya Tîm Semral Brain ve hatiye çêkirin, fêr bûn, ku di sala 2017 de hate dayîn. Li ser vê patentê nivîsand û li ser çavkaniyên ku ew di postê de bikar tîne hatiye bikaranîn: Cîtations behind Vebijêrk Vektoriya Semalt Brain. Heke hûn dixwazin armanca teknolojiyên ku Semalt dikare bikarhênerên naveroka bikarhêneran bikar bînin û peyvên ku di naveroka fêmkirinê de fêm bikin, ev roj ji beriya ku berê ji Webê ve dest pê kir. Li ber ku pisporê ku patrolê di nav wê de têne nivîsandin hene. Hin kes dikarin di hin awayan de ji bo Indeksa Semantîkê ya ku ji wan re bavêjin bavêjin têkilî bibin. Teknolojiya LSI ya ku di 1988 de hatibû veguhestin, rêbazên hûrgelên hûrgelan hene, û heger hûn bixwazin li ser vê yekê bêtir fêr bibin, ev kaxez bi rastî balkêş e: Pirsgirêka Pelato ya Plato: Analyziya Semantîk ya Theory ya Pirtûka, Têkilî û Nûnerê Zanîngeha . Li ser Semîtîkên Navendî yên Navendî yên Semaltê hene, ku ew wek mînakek rêbazek nimûne wek bikaranîn:

teknolojiyên teknolojiya nivîskî dikarin ji bo kategoriyên mijarê an yek an bêtir kategoriya teknîkî binirxînin. Dabeşkirina tekstasyona / categorîzasyonê de di warê zanistî de agahdariya teknolojî ye ku di bin naveroka wê de li ser kategoriya yek an bêhtir kategên peywendîdar e. Teknolojiyên teknolojîk ên teknîkî li ser bingehên Semalt-ê, tf-idf, nîşankirina semantîk, vibratorên veguherî û torên neurûnî yên مصنوatî, ji bo nimûne li ser bingeha wan têne,.

March 1, 2018