OKB-000097 | Volltextsuche in Dokumenten

Betrifft: ab orgAnice CRM 2012

Frage: 

Wie funktioniert die Volltextsuche in Dokumenten, welche Dokumente werden von der Volltextsuche gefunden?

Antwort: 

Damit die Volltextsuche den Inhalt eines Dokuments durchsuchen kann, müssen drei Voraussetzungen erfüllt sein:

• Es muss sich um ein internes Dokument handeln (externe Dokumente werden nicht unterstützt)

• Für den Dokumententyp muss eine IFilter-Schnittstelle installiert sein.

• Ihre Datenbanklizenz muss den Featurecode FT beinhalten (Sie müssen über die orgAnice-Edition Professional oder Enterprise verfügen)

IFilter ist ein von Microsoft definierter Standard, um aus Dokumenten den Textinhalt extrahieren zu können. Es gibt 32- und 64-bit-IFilter, orgAnice benötigt immer (auch unter 64-bit-Windows) den 32-bit-IFilter. Für jeden Dokumententyp (Dateiendung) gibt es eigene IFilter, die meistens vom Entwickler des  Dokumententyps stammen (Die Microsoft Office-IFilter stammen von Microsoft).

Frage: 

Ich habe bisher orgAnice ohne die Volltextsuche in Dokumenten verwendet (Standard-Edition), habe jetzt eine neue Lizenznummer mit dem Featurecode FT erhalten. Was muss ich beachten?

Antwort: 

Gehen Sie folgendermaßen vor:

1. Tragen Sie Ihre neue Lizenznummer in orgAnice ein:

a. Bitte melden Sie sich mit Datenbankverwaltungsrechten an der Datenbank an und

b. tragen Sie die Lizenznummern im Konfigurationsmodus über den Menüpunkt „Datenbank-Objekte – orgAnice Datenbank“ im Zweig „Lizenzen“ ein.

2. Übertragen Sie die Strukturänderungen auf den SQL-Server

a. Rufen Sie über das Windows-Startmenü die Anwendung „Daten in den SQL-Server verschieben“ auf:

 

b. Wählen Sie unter „Datenbank“ den Speicherort Ihrer orgAnice-Datenbank aus.

c. Tragen Sie unter „Benutzer“ und „Kennwort“ die Zugangsdaten eines Benutzers mit Datenbank-Administrationsrechten ein.

d. Klicken Sie auf „Erweiterte Optionen >>“.

e. Wählen Sie die Option „Nur Datenbankstrukturänderungen übernehmen“:

 

f. Betätigen Sie die Schaltfläche „Start“

Nun werden die für die Volltextsuche in Dokumenten notwendigen Strukturänderungen in der SQL-Datenbank erstellt. Wenn die Übertragung fertig ist, schließen Sie wieder das Programm „Daten in den SQL-Server verschieben“. Sie können sich wieder an Ihrer Datenbank anmelden und die Volltextsuche in Dokumenten verwenden.

Hinweis für versierte Benutzer: Es gibt auch andere Möglichkeiten, die Strukturänderungen auf den SQL-Server zu übertragen. Sie können alle Ihnen bekannten Möglichkeiten nutzen, ausschlaggebend ist die einmalige Übertragung der Strukturänderungen nach dem Eintragen der neuen Lizenznummer mit dem Featurecode FT.

Frage:

Wo müssen die IFilter installiert sein?

Antwort:

Die IFilter müssen auf jedem Rechner installiert sein, da der Textinhalt eines Dokuments lokal auf dem Rechner extrahiert wird.

Hinweis für Administratoren: Der vom IFilter gelieferte Textinhalt wird in der SQL-Datenbank in der Tabelle __Org_Documents, Spalte DocText gespeichert. Die Volltextsuche greift aus Geschwindigkeitsgründen nicht direkt auf die Dokumente sondern auf den zwischengespeicherten Text in der Spalte DocText zu. Der Textinhalt wird bei jeder Änderung des Dokuments neu errechnet.

Weitere Informationen finden Sie unter www.ifilter.org

Frage:

Wie prüfe ich, ob ein IFilter für den gewünschten Dokumententyp auf meinem Rechner installiert ist?

Antwort:

Erstellen Sie in der Tabelle Aktivitäten einen neuen Datensatz und fügen Sie dem Datenbank entweder ein neues oder ein bestehendes Dokument des gewünschten Typs zu.

Rufen Sie dann das Register „Dokumentvorschau“ auf:

Wenn hier der Inhalt des  abgelegten Dokuments zu sehen ist, dann ist der IFilter für den entsprechenden Dokumententyp richtig installiert.

Einen Überblick über die installierten IFilter gibt auch das Tool Opens external link in new windowIFilter Explorer:

Hier sieht man beispielweise, dass für .docm- und .docx-Dokumente ein IFilter installiert ist

Achten Sie darauf, dass Sie die 32-bit-Version (x86) vom IFilter Explorer verwenden.

Frage:

Welche IFilter gibt es und wo kann man sie herunterladen?

Antwort:

Wir haben die IFilter für die drei am häufigsten im Zusammenhang mit orgAnice verwendeten Dokumententypen (MS Office 2007 oder höher, PDF-Dokumente, MSG-Dateien) in einem Initiates file downloadInstallationspaket zusammengestellt.

Im Folgenden finden Sie eine Übersicht der IFilter mit Informationen für Einzelinstallationen (nur wenn Sie das obige Installationspaket nicht verwenden möchten):

Dokumententyp Beschreibung und Downloadlink
Microsoft Office-Dokumente im Office 97-2003-Format (.doc, .xls, .ppt) Der IFilter wird mit der Installation von Microsoft Office mitinstalliert
Microsoft Office-Dokumente im Office 2007 oder höher-Format (.docx, .xlsx, .pptx)

 Der IFilter muss gesondert installiert werden. Hier ist zwischen 32- und 64-bit-Versionen von Windows zu unterscheiden:

       • 32-bit-Windows: Laden Sie und installieren Sie die Datei FilterPackx86.exe aus dem 2007 Office System-Konverter: Opens external link in new windowMicrosoft Filter Pack

       • 64-bit-Windows: Leider stellt Microsoft keine gesonderte Installationsdatei für die 32-bit-IFilter für 64-bit-Windows zur Verfügung. Wir haben die benötigten Dateien extrahiert und Ihnen Initiates file downloadhier zur Verfügung gestellt.

PDF-Dokumente (.pdf)

Für die Textextraktion aus PDF-Dokumenten stehen unterschiedliche Softwarehersteller IFilter zur Verfügung.

Adobe: Mit dem Adobe Reader 9 wird ein funktionierender 32-bit-IFilter für PDF-Dokumente  installiert. Spätere Adobe Reader-Versionen bringen zwar auch einen IFilter  mit, der aber leider keine verwertbaren Ergebnisse liefert.

Lösung A: Verwenden Sie den Opens external link in new windowAdobe Reader 9.

Lösung B (für versierte Anwender, die eine aktuelle Version des Adobe Readers verwenden möchten):

       a. Installieren Sie den Opens external link in new windowAdobe Reader 9.

       b. Kopieren Sie die Datei „AcroRdIF.dll“ aus dem Ordner „C:\Program Files (x86)\Adobe\Reader 9.0\Reader“ in einen anderen
Ordner

       c. Installieren Sie die Opens external link in new windowaktuelle Version vom Adobe Reader.

       d. Kopieren Sie die gesicherte Datei „AcroRdIF.dll“ in den Ordner „C:\Program Files (x86)\Adobe\Reader 11.0\Reader“.
Überschreiben Sie die bereits existierende Datei

Foxit: Der Hersteller Foxit stellt den kostenpflichtigen Opens external link in new windowFoxit® PDF IFilter – Server zur Verfügung.

Outlook-E-Mails (.msg)

Der IFilter muss gesondert installiert werden. Microsoft stellt einen entsprechenden 32-bit-IFilter zur Verfügung.

Laden Sie und installieren die Datei MsgFilt.msi aus dem Opens external link in new windowAdd-in for Outlook saved mail (.msg file) indexing

Textdateien (.txt)  Der IFilter wird mit Windows mitgeliefert.

Frage:

Ich habe jetzt einen IFilter installiert, kann ich auch bereits vorhandene Dokumente für die Volltextsuche vorbereiten?

Antwort:

Ja, das ist möglich. Öffnen Sie ein vorhandenes Dokument und speichern es wieder ab. Dabei wird der Textinhalt des Dokument erneut berechnet und in der SQL-Datenbank für die Volltextsuche abgelegt.

Wir arbeiten an einer Lösung, die alle Dokumente in einem Durchlauf verarbeitet.

OKB-000096 | Volltextsuche liefert keine Ergebnisse

Betrifft: ab orgAnice CRM 2012

Problem: 

Bei der Ausführung der Volltextsuche erscheinen keine Ergebnisse, sondern nur die folgender Fehlermeldung:

Ursache:

Die Angabe des Servernamens im Verbindungsparameter entspricht nicht den Vorgaben. Die Angabe des Servernamens darf nicht mit einem Backslash „\“ beginnen:

Provider=SQLOLEDB;Data Source=\SQLEXPRESS;Integrated Security=SSPI;Initial Catalog=orgAniceCRM2012

Lösung: 

Setzen Sie im Verbindungsparameter einen Punkt oder den Rechnernamen vor den Backslash:

Provider=SQLOLEDB;Data Source=.\SQLEXPRESS;Integrated Security=SSPI;Initial Catalog=orgAniceCRM2012

Provider=SQLOLEDB;Data Source=MEINRECHNER\SQLEXPRESS;Integrated Security=SSPI;Initial Catalog=orgAniceCRM2012

OKB-000092 | Entfernen der FT-Lizenz

Betrifft: ab orgAnice CRM 2008

Problem: 

Die Strukturänderungen können nicht vollständig übernommen werden, wenn

a) die AddOn-Lizenz „FT“ entfernt wurde

b) das Feld DocExtension und/oder DocText Bestandteil eines Volltextkatalogs ist.

Ursache: 

Die orgAnice-Komponente für die Strukturänderungen funktioniert nicht richtig.

Lösung: 

Die o.g. Felder müssen in der Tabelle „__Org_Documents“ manuell mit den Mitteln des Enterprise Managers gelöscht werden.

OKB-000093 | Tipps zur Verwendung der Volltextindizierung

Betrifft: ab orgAnice CRM 2008

Störwörter

Die Prozedur der Indexerstellung ignoriert bestimmte Wörter, die als unwichtig gelten. Sie werden als Störwörter bezeichnet, die für jede Sprache anders sind. Für jede unterstützte Sprache liegt eine Liste der Störwörter als ASCII-Datei vor. Die Dateien befindet sich im selben Ordner wie die Kataloge, standardmäßig unter \Programme\Microsoft SQL Server\MSSQL$<Instanzenname>\Ftdata um Unterordner von Ftdata mit dem Namen SQL$<Instanzenname>\Config. Die Dateinamen heißen noise.<Endung>, wobei die Endung für jede Sprache anders ist:

noise.eng – britisches Englisch

noise.enu – amerikanisches Englisch

noise.deu – Deutsch

Hinweis: Um Änderungen in den o.g. Dateien abspeichern zu können, muss der „Microsoft Search“-Dienst beendet werden. Nach dem Bearbeiten der Listen muss der Volltextkatalog vollstąndig aufgefüllt werden, damit die Änderungen berücksichtigt werden.

Verfolgung von Änderungen

Die Änderungen in einer Tabelle mit einem Volltextindex können automatisch verfolgt werden. Dazu sollte im Enterprise Manager auf der Tabelle __Org_Documents die Änderungsprotokollierung mit Aktualisierung im Hintergrund eingeschaltet werden:

Klicken Sie mit der rechten Maustaste auf die Tabelle __Org_Documents und schalten Sie unter Volltextindextabelle die Optionen

• Änderungsprotokollierung und

• Index im Hintergrund aktualisieren

ein.

OKB-000091 | Die MS SQL-Volltextsuche für orgAnice SQL einrichten

Betrifft: orgAnice SQL

Frage: 

Wie richte ich die Volltextindizierung des MS SQL-Servers für die Verwendung mit den in orgAnice SQL abgelegten Dokumenten ein?

Voraussetzungen: 

1.) Die Volltextsuche muss auf Ihrem MS SQL-Server installiert ist. (s. FAQ „Volltextindizierung im SQL-Server aktivieren“

2.) Die Daten Ihrer orgAnice-Datenbank müssen in SQL-Format vorliegen. Verwenden Sie für den Export der Daten das Programm „Daten in den SQL-Server verschieben“, welches sich im Windows-Startmenü im Ordner „orgAnice SQL“ befindet.

3.) Ihre orgAnice-Datenbank muss über eine AddOn-Lizenz vom Typ „FT“ verfügen. Für Testzwecke können Sie die folgenden Lizenznummern verwenden:

a. Datenbank-Lizenz: OFFICE-4.0-002-Q-00000000-000000-8AC1 796A

b. Add-On-Lizenz: FT-4.0-002-Q-00000000-000000-93BA 0A2E

Beachten Sie, dass nach dem Eintragen der AddOn-Lizenz eine erneute Übertragung der Änderungen auf den SQL-Server mittels des gleichnamigen Menüpunktes in orgAnice Data notwendig ist.

Lösungsweg:

1.) Starten Sie den SQL Server Enterprise Manager und wählen Sie Ihre orgAnice-Datenbank aus.

2.) Klicken Sie mit der rechten Maustaste auf die Tabelle __Org_Documents und wählen Sie den Menüpunkt „Volltextindextabelle – Volltextindizierung für eine Tabelle definieren“. Wenn der Menüpunkt nicht zur Verfügung steht bzw. deaktiviert ist, dann ist auf Ihrem SQL-Server die Volltextsuche nicht installiert. Holen Sie das nach, da die weiteren Schritt sonst nicht durchgeführt werden können.

3.) Es erscheint der „Volltextindizierungs-Assistent“. Klicken Sie auf Weiter.

4.) Sie müssen für die Volltextindizierung einen eindeutigen Index auswählen. In der Tabelle __Org_Documents steht ein solcher zur Verfügung, der Assistent hat ihn bereits vorausgewählt. Der Name des Index je nach Datenbank unterschiedlich, es unterscheidet sich der Teil nach „PK____Org_Documents___“.

Klicken Sie auf Weiter.

5.) Aktivieren Sie die Checkbox in der Zeile „DocText“ und wählen Sie als „Sprache für das Worttrennungsmodul“ Deutsch (Deutschland)

Falls die Spalte DocText nicht zur Verfügung steht, dann verfügt Ihre Datenbank nicht über die erforderliche AddOn-Lizenz vom Typ „FT“ oder die Änderungen wurden nicht auf den SQL-Server übertragen (s. Voraussetzungen)

Klicken Sie auf Weiter.

6.) Geben Sie den Namen für einen neuen Volltextkatalog ein. Sie können hier einen beliebigen Namen eintragen. Der Speicherort kann ebenfalls frei gewählt werden, im Zweifelsfall belassen Sie die Standardeinstellung. Für weitere Informationen konsultieren Sie die Online-Hilfe zu dem MS SQL-Server.

Klicken Sie auf Weiter.

7.) Sie können an diesem Schritt einen Zeitplan für die Aktualisierung des Volltextkataloges erstellen. Klicken Sie auf „Neuer Tabellenzeitplan“

8.) Geben Sie einen beliebigen Namen für den Zeitplan ein, wählen Sie als Auftragstyp „Index aktualisieren“ aus und stellen Sie die Planungshäufigkeit so ein, dass der Katalog alle 10 Minuten aktualisiert wird. Die Werte sind als Vorschläge zu verstehen, für Details konsultieren Sie die Online-Hilfe zu dem MS SQL-Server. Klicken Sie auf OK und auf Weiter.

9.) Klicken Sie auf Fertig stellen.

10.) Nach der Fertigstellung erscheint der folgende Dialog. Bestätigen Sie den Dialog mit OK.

11.) Wie in dem Dialog beschrieben, muss nur der Volltextindex aufgefüllt werden. Wählen Sie im SQL Server Enterprise Manager unter Ihrer Datenbank den Zweig „Volltextkataloge“. Dort befindet sich der gerade erstellt Katalog mit dem von Ihnen vergebenen Namen. Klicken Sie mit der rechten Maustaste auf den Katalog und wählen Sie den Menüpunkt „Vollständigen Auffülen starten“ aus.

Fertig! Damit haben Sie die Volltextsuche für die in orgAnice abgelegten Dokumente aktiviert!

OKB-000094 | Volltextindizierung im SQL-Server aktivieren

Betrifft: ab orgAnice CRM 2008

Frage:

Wie aktiviere ich die Volltextindizierung im MS SQL-Server?

Lösung:

1.) Das SQL-Server 2000-Setup erneut ausführen und bei dem Schritt „Komponenten auswählen“ die Volltextsuche aktivieren.

2.) Das Service Pack 3a für den SQL-Server installieren, erst dann ist der Menüpunkt „Volltextindizierung“ im Enterprise Manager aktiv. Im Laufe der Aktualisierung sieht man dann: