Archive for the 'Search Engines' Category

19
Mrz
15

Wahrheit als Rankingfaktor oder “Learning to trust is one of life’s most difficult tasks.” – Isaac Watts

In einem Paper von Dong, X. L., E. Gabrilovich, K. Murphy, V. Dang, W. Horn, C. Lugaresi, S. Sun & W. Zhang (2015). Knowledge-Based Trust: Estimating the Trustworthiness of Web Sources. Proceedings of the VLDB Endowment wird von den Googlemitarbeitern ein ganz neuer Ansatz der Releveanzbewertung von Websites – die Korrektheit der enthaltenen Fakteninformationen – als zusätzliches endogenes Signal vorgestellt. Diese Fakten werden aus den Websites extrahiert und gegen eine vorhandene  Faktendatenbasis gematched. Im Beispielfall konnte für 119 Mio. Webpages ein Glaubwürdigkeits-Score, der Knowledge Based Trust berechnet werden, indem die extrahierten Daten (Fakten) mit einer Datenbasis, bestehend aus 2,8 Mrd. Fakten, die aus dem Web extrahiert wurden, verglichen wurden. Durch manuelle Evaluierung konnte die Effektivität dieser Methode nachgewiesen werden, die vielleicht in naher Zukunft Eingang in die Rankingfaktorenwelt finden kann.

Google To Rank Pages On Knowledge Based Trust

Advertisements
19
Mrz
15

Google Ranking 2015… Alle Jahre wieder..

Google Ranking Faktoren

werden die Informationen zu den Google-Rankingfaktoren benutzt, um bei den SEO-Agenturen ordentlich Traffic zu generieren. So auch in diesem Jahr, prinzipiell ist gegen diese sehr schöne Darstellung von eliteseo nichts einzuwenden. Allerdings sind die Erläuterungen zu LSI (Rankingfaktoren 19 & 20) doch eher für einen Computerbummi geeignet und würden damit sehr wenig zur Einlösung der „Transparenzverpflichtung für meinungsrelevante Algorithmen
(#au_weia,_wie_sehen_denn_meinungsunrelevante_Algorithmen_aus?) beitragen.

20
Mrz
13

Eine der besten Suchmaschinen ever

ist Wolfram Alpha, obwohl das Label Suchmaschine die Funktionalität von WA nur unzureichend beschreibt. WA ist nicht nur lt. eigenen Aussagen eine COMPUTATION KNOWLEDGE ENGINE. Als Knowledge Repository hinter Siri hat sie sich unbemerkt von Vielen doch schon als Faktenlieferant etabliert. Aber die Ankündigung von Steve Wolfram auf der SXSW in Austin in bälde schon Nutzerbedarfe vorhersagen zu können, um die Antworten mit Augmented Reality zu kombinieren, sollte Gelegenheit genug sein, um die breite Öffentlichkeit, die schon angenehm gesäuselt hat, als mit dem Facebook-Connector eine umfassende Analyse der Facebook-Profile angeboten wurde, wieder mit der Nase auf wirklich Gutes zu stupsen.

Hier ein Potpourri der Funktionalitäten, der Lust auf mehr machen soll: (denn welche SuMa kann schon berechnen, wieviel mal Bruce Willis in den Willis-(Sears-)Tower passen würde)

btw: selbst Sergey Brin hat erste Meriten bei WA gesammelt…

06
Mrz
13

Spezialsuchmaschinen die siebte…

  • quant -  a new generation search engineQwant ist ein von französischen Entwicklern vorangetriebener Versuch sich vom großen Webcontent Kuchen wenigsten ein paar kleinere Krümel für das eigene Geschäftsmodell abzuknapsen. Inwiefern das funktioniert, oder anders gesagt, wie lange die Idee, die Ergebnisse aus den Rubriken WEB, Live, Social, Media und Shopping auf einer Ergebnisseite zu kombinieren, den Nutzer begeistern wird, werden die nächsten Monate zeigen. Momentan sind die Kinderkrankheiten jedes bisher angetreten G-Killers noch allzu offensichtlich, zu kleiner Index, intransparentes Ranking, verwirrende Darstellung … Fazit: Beobachten!
  • Search Files from the Internet, FTP, Usenet, Emule, Educational Resources and MoreFindThatFile hat sich als Nische die  Dateisuche ausgesucht. Nach eigenen Angaben erlaubt diese SuMa das Finden von 47 Dateitypen (von Audio- und Videodateien über Bittorrent Daten bis zu Fontdateien, Installern, Exen u.v.a.m.)  mit ca. 558 Extensions aus über 300 Mio. Dateien (insgesamt über 111 TB Daten). Inwiefern das Ganze urheberrechtskonform zu sehen ist, bleibt jedem Nutzer selbst überlassen. Fazit: Ausprobieren!
09
Okt
12

Insights: Relevanzbewertung bei Google S(page)=IR+B+R+LM

Der alchemistische Prozess der Transformation einer simplen Ein-Wort-Frage in ein allumfassendes Antwortset hat für die meisten der Googlenutzer auch heute noch etwas stark Metaphysisches. Daran ändern auch die Versuche, mit solchen Items wie: PageRank oder Topicality und Reputation Licht in das Relevanzbeurteilungsdunkel zu bringen, nur wenig. Ashutosh Garg, ein Ex-Googler mit Retrievalbackground,  hat in seinem Gastbeitrag „A Mathematical Model for Assessing Page Quality“ bei Stonetempleton versucht, genau dies aktuell zu erklären. Seine Weltformel sieht demnach so aus:

S = wir* IR + wbi* B + wr*R + wlm*LM

und beschreibt, dass sich die Relevanz einer Seite bezüglich einer Suchanfrage aus der Summe der gewichteten  Komponenten

  • IR (Information Retrieval Score)
  • B (Behavioral Score)
  • R (Reputation Score)
  • LM (Language Model Score)

zusammensetzt.

Interessant auch das neue Startup von Ashu: BloomResearch. Geschäftsmodell ist die Erhöhung der Sichtbarkeit von Websites für einen genau spezifizierten Kundenkreis basierend auf den Ergebnissen der Analyse einer  auf semantischen Technologien basierten Web Relevance Engine als Kernelement. Illustration of the BloomReach Web Relevance Engine

26
Apr
12

Google Suche Update März

Im Google insidesearch-Blog werden monatlich die wichtigsten Neuerungen jedwede Suchanwendung von Google betreffend publiziert. Leider schaffe ich es auch nur sporadisch, diese nachzulesen, so dass ich immer wieder überrascht bin, was es  alles an Neuerungen gibt und wieviel Fantasie die Google-Mitarbeiter in die Codenamen ihrer  Projekte stecken. Für März gab es unter dem Codenamen Blackboard die Nachricht, dass

  • Autocomplete jetzt auf mathematische Symbole erweitert wurde. D.h. nie wieder Formeln pauken „R=“eingeben reicht, um die Weltformel für den Wiederstand zu bekommen. Wird das Halbwissen jedoch etwas komplexer – bspw. bei den Maxwellschen Gleichungen – scheitert der Ansatz vorerst noch.
  • Deep Maroon steht für einen langerwarteten Ansatz zum Handling von Sonderzeichen im Google-Index wie “%”, “$”, “\”, “.”, “@”, “#”, und “+”. Wer aber denkt, nun könnten einfach und schnell Spamlisten mit Suchanfragen wie „*.*@google.com“ aufgebaut werden; weit gefehlt. Genau das geht aus verständlichen Gründen nicht, dafür aber die Twittersuche nach Personen „@swish41“ (der Dierk) oder Hashtags „#fcb“. Wer richtigen Programmcode sucht, kann als Alternative zu Google auch die SourceCode-Suche von Symbolhound verwenden.
24
Apr
12

Googles Patentsuche…

…wird der geneigt Nutzer unter den bekannten URL’s vergeblich suchen. Nach dem alljährlichen Saubermachen ist diese spezielle Art der Suche in Googles Suchschlitz verschwunden. Wer nach „Google Patent Search“ sucht, bekommt zwar noch die WebServer-Ansicht des alten Patensuchservers, allerdings reduzieren sich die Angebote nach dem Klick auf einen blassgrauen „Search patents„-Hinweis im Suchschlitz, allerdings mit der bekannten Funktionalität. Die „Advanced Patent Search“ ist nach wie vor – Page allein weiss wie lange – verfübar und hilft uns dann solche Genieblitze zu finden, wie:

(IP-)Adresse+Kreditkarte+HardDrive-ID=Nutzer

(IP-)Adresse+Kreditkarte+HardDrive-ID=Nutzer




November 2017
M D M D F S S
« Mrz    
 12345
6789101112
13141516171819
20212223242526
27282930  

RSS Digital News

Blog Stats

  • 9,616 hits

Sneak Peek vom Turner-Blog

Um neue Beiträge per E-Mail zu erhalten, hier die E-Mail-Adresse eingeben.

Schließe dich 2 Followern an