Unternehmenssuche

Definition: Die Unternehmenssuche ist die organisierte Abruf von strukturierten und unstrukturierten Daten innerhalb einer Organisation.


Unternehmenssuche ist die Praxis der Herstellung von Inhalten aus verschiedenen Unternehmenstyp Quellen wie Datenbanken und Intranets, durchsuchbare auf eine definierte Zielgruppe.

Unternehmenssuche Übersicht

"Enterprise Search" wird verwendet, um die Software von Suchinformationen innerhalb eines Unternehmens zu beschreiben. Unternehmenssuche können mit Web-Suche, der Suchtechnologie, um Dokumente auf dem offenen Web gilt, und Desktop-Suche, der Suchtechnologie, um die Inhalte auf einem einzigen Computer gilt gegenübergestellt werden.

Unternehmenssuche Systeme Indexdaten und Dokumenten aus einer Vielzahl von Quellen, wie beispielsweise: Dateisysteme, Intranet, Dokumentenmanagement-Systeme, E-Mail und Datenbanken. Viele Unternehmenssuche Systeme integrieren strukturierte und unstrukturierte Daten in ihren Sammlungen. Unternehmenssuche Systeme verwenden auch Zugriffskontrollen, um eine Sicherheitsrichtlinie auf ihre Benutzer zu erzwingen.

Die Unternehmenssuche kann als eine Art vertikale Suche eines Unternehmens gesehen werden.

Komponenten eines Unternehmenssuche System

In einer Unternehmenssuchsysteme geht Gehalt durch verschiedene Phasen von der Quell-Repository zu den Suchergebnissen:

Inhalt Bewusstsein

Inhalt Bewusstsein ist in der Regel entweder ein Push- oder Pull-Modell. In der Push-Modell wird ein Quellsystem mit der Suchmaschine in einer Weise, dass sie verbindet, um sie und schiebt neue Inhalte direkt an die APIs integriert. Dieses Modell wird verwendet, wenn Echtzeit-Indizierung ist wichtig. Im Pull-Modell, sammelt die Software Inhalte von Quellen mit einem Verbindungsstück, wie eine Web-Crawler oder einer Datenbankanschluss. Der Verbinder typischerweise Umfragen die Quelle mit bestimmten Abständen nach neuen, aktualisiert oder gelöscht Inhalten zu suchen.

Inhalt Verarbeitung und Analyse

Inhalte aus unterschiedlichen Quellen können viele unterschiedliche Formate oder Dokumenttypen, wie zB XML, HTML, Office-Dokument-Formate oder Klartext. Der Inhalt Verarbeitungsphase verarbeitet die eingehenden Dokumente in einfachen Text-Dokument mit Filter. Es ist auch oft erforderlich, Inhalte auf verschiedenen Wegen zu einem Rückruf oder Genauigkeit zu verbessern normalisieren. Dazu kann auch ergeben, Lemmatisierung, Synonym Expansion, Einheit Extraktion, Wortart Tagging.

Als Teil der Verarbeitung und Analyse wird tokenization angewendet, um den Inhalt in Token, die die grundlegende Anpassungseinheit aufgeteilt. Es ist auch üblich, um Token in Kleinbuchstaben zu normalisieren, um Groß- und Kleinschreibung Such bereitzustellen sowie um Akzente zu normalisieren, um bessere Abruf bereitzustellen.

Indexing

Der resultierende Text wird in einem Index, der für schnelle Lookups ohne Speicherung der vollständige Text des Dokuments optimiert wird gespeichert. Der Index kann das Wörterbuch aller einzigartige Wörter im Korpus sowie Informationen zu Rangliste und Zeitfrequenz enthalten.

Abfrageverarbeitung

Verwendung einer Web-Seite, gibt der Benutzer eine Anfrage an das System. Die Abfrage besteht aus irgendeinem Wort gibt der Benutzer als auch Navigationsaktionen wie Facettierung und Paging-Information.

Matching

Das verarbeitete Abfrage wird dann mit dem gespeicherten Index verglichen, und die Suchsystem liefert Ergebnisse verweisen Quelldokumente, die passen. Einige Systeme sind in der Lage, das Dokument indiziert war anwesend.

Differenzen aus der Web-Suche

Jenseits der Unterschied in den Materialarten indiziert, die Unternehmenssuche Systeme typischerweise auch Funktionen, die nicht mit den Mainstream-Web-Suchmaschinen zugeordnet ist. Diese beinhalten:

  • Adapter zu indizieren Inhalte aus einer Vielzahl von Repositories, wie Datenbanken und Content Management Systeme.
  • Verbundsuche, die besteht aus
  • Transformieren einer Abfrage und sendet es an eine Gruppe von unterschiedlichen Datenbanken oder externe Inhaltsquellen mit dem entsprechenden Syntax,
  • Zusammenführen der Ergebnisse aus den Datenbanken gesammelt,
  • präsentiert sie in einer prägnanten und einheitliches Format mit minimalen Überschneidungen, und
  • ein Mittel, erfolgt entweder automatisch oder durch den Portal-Benutzer, um das fusionierte Ergebnismenge zu sortieren.
  • Unternehmen verlinken, collaborative tagging-Systeme für die Erfassung von Wissen über strukturierte und semi-strukturierten Unternehmensdaten.
  • Entity-Extraktion, die zu lokalisieren und klassifizieren Elemente in Text in vordefinierten Kategorien wie beispielsweise die Namen der Personen, Organisationen, Orte, Ausdrücken von Zeiten, Mengen, Geldwerte, Prozentsätze usw. sucht
  • Facettensuche, eine Technik, die für den Zugriff auf eine Sammlung von Informationen mit einer Facettenklassifikation vertreten, so dass Anwender durch Filtern zur Verfügung stehenden Informationen zu erkunden.
  • Zugangskontrolle, in der Regel in Form einer Access Control List, wird oft benötigt, um Zugang zu Dokumenten auf der Grundlage individueller Benutzeridentitäten zu beschränken. Es gibt viele Arten von Zugriffssteuerungsmechanismen für verschiedene Inhaltsquellen so dass dies eine komplexe Aufgabe, umfassend in einer Unternehmenssuche Umfeld anzugehen.
  • Text-Clustering, welche Gruppen die Top mehreren hundert Suchergebnisse in Themen, die im laufenden Betrieb von den Search-Ergebnisse Beschreibungen, normalerweise Titel, Auszüge und Meta-Daten berechnet werden. Diese Technik können Benutzer navigieren die Inhalte thematisch und nicht durch die Meta-Daten, die in Facettierung verwendet wird. Clustering kompensiert das Problem der inkompatiblen Meta-Daten über mehrere Unternehmensregister, die die Nützlichkeit der Facettierung behindert.
  • Benutzerschnittstellen, die in Web-Suche sind bewusst, um nicht den Benutzer auf Anzeigen zu klicken, der die Umsatzerlöse realisiert abzulenken einfach gehalten. Obwohl das Geschäftsmodell für die Unternehmenssuche könnten, umfassen, die anzeigen, in der Praxis ist dies nicht geschehen. Um die Produktivität der Endbenutzer zu verbessern, Unternehmens Anbieter ständig experimentieren mit reichen UI-Funktionalität, die erhebliche Platz auf dem Bildschirm, die problematisch für die Web-Suche würde einnimmt.

Relevanz Faktoren für die Unternehmenssuche

Die Faktoren, die die Relevanz der Suchergebnisse im Rahmen einer Unternehmensüberdeckung mit bestimmen, sondern unterscheiden sich von denen, die auf Web-Suche an. In der Regel können Unternehmen Suchmaschinen nicht die Vorteile der reichen Link-Struktur-Nachrichten des Hypertext-Ergebnis wird jedoch eine neue Generation von Enterprise-Suchmaschinen auf Basis eines Bottom-up-Web 2.0-Technologie sind sowohl eine beitrags Ansatz und Hyperlinks innerhalb das Unternehmen. Algorithmen wie PageRank nutzen Hyperlink-Struktur der Autorität, um Dokumente zuzuordnen, und verwenden Sie dann diese Autorität als Abfrageunabhängige Relevanzfaktor. Im Gegensatz dazu, Unternehmen haben in der Regel zu anderen Abfrageunabhängige Faktoren wie Aktualität oder Beliebtheit eines Dokuments verwenden, zusammen mit Query-abhängigen Faktoren, die traditionell mit Information Retrieval-Algorithmen zugeordnet. Auch die umfangreiche Funktionalität von Enterprise Search UIs, wie Clustering und Facettierung, verringern die Abhängigkeit von Ranking als Mittel, um die Aufmerksamkeit des Benutzers zu leiten.

Suchoptionen Relevanz Testing

Suche nach Anwendungsrelevanz kann durch folgenden Relevanz Testoptionen wie bestimmt werden

  • Schwerpunktgruppen
  • Referenz Bewertungsprotokoll
  • Empirische Tests
  • A / B-Tests
  • Log-Analyse an einem Beta Produktionsstandort
  • Online Bewertungen
(0)
(0)
Kommentare - 0
Keine Kommentare

Fügen Sie einen Kommentar

smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile
Zeichen übrig: 3000
captcha