Kategorie-Archive: Allgemein

Felicity Star: Vektorähnlichkeit und weitere Metriken integriert

Die letzten 1,5 Jahren waren sehr arbeitsintensiv durch meine beruflichen Aufgaben. Das Projekt ist jetzt beendet und das gibt mir etwas Zeit, einige neue Features in Felicity Star zu integrieren. Die aktuellen Erweiterungen sind im Bereich der Vektorähnlichkeit. Aktuell implementiere ich einige Content-based Recommender Systeme und Kollaborative Recommender Systems. Die nachfolgenden zwei sind nahezu integriert:… Weiterlesen »

Mysql: Big Import

Gelegentlich kommt es vor, dass man große Dumps von Datenbanken importieren muss. Die Probleme sind teilweise erheblich, da dies einiges an Gehirnschmalz kostet, um die Produktionsumgebung nicht lahm zu legen. Die nachfolgenden Tipps beziehen sich auf einen Import eines 22 GB großen Dumps in eine Datenbank vom Typ InnoDB. Es werden keine anderen Typen wie… Weiterlesen »

Felicity Star: POS Tagger integriert

In der letzten Zeit ist leider nicht viel vorwärts gegangen. Allerdings kann ich verkünden, daß ich jetzt das POS (Part of Speech) integriert habe. Damit können jetzt diese Informationen für die Bewertung hinzugezogen werden. Die Auswahl der Tagger war nicht ganz einfach, da diese sich nicht native einbinden lassen (keine .Net, kein T-SQL Version gefunden… Weiterlesen »

SQL Server: fatal error 4014

Seit ich meinen neuen Mini Server im Einsatz hatte, habe ich massiv mit SQL Fehler 4014 zu tun. Ständig bricht das Ladepaket ab. Die üblichen Verdächtigen sind natürlich bei der Fehlermeldung Treiber und Netwerk. Die Tipps im Internet weisen darauf deutlich hin (TCP/IP Chimney offloading, RSS features and NetDMA). Die Ursache sind üblicherweise veraltete Treiber.… Weiterlesen »

Felicity Star: Beladung beschleunigt und Stopwortbehandlung eingebaut

In der letzten Zeit habe ich mich hauptsächlich um die Verarbeitung der Trainingsdokumente und die Geschwindigkeit gekümmert. Durch Umsetzung der Beladepakete von DTSX auf natives T-SQL konnte ich das Beladen der ca. 5500 Artikel inkl. Training von drei verschiedenen Kategorisierungsfunktionen von 4,5 Stunden um zwei Stunden auf 2,5 Stunden reduzieren. Die Steuerung der Beladung erfolgt… Weiterlesen »

MySQL: Tipps zum Import großer Datenbank-Dumps

Gelegentlich kommt es vor, dass man große Dumps von Datenbanken importieren muss. Die Probleme sind teilweise erheblich, da dies einiges an Gehirnschmalz kostet, um die Produktionsumgebung nicht lahm zu legen. Die nachfolgenden Tipps beziehen sich auf einen Import eines 22 GB großen Dumps in eine Datenbank vom Typ InnoDB. Es werden keine anderen Typen wie… Weiterlesen »

WikiVX: MYSQL 5.7.5.1-m15 rockt

Über die Weihnachtsfeiertage habe ich sämtliche Mysql Datenbanken auf die neue Version 5.7.5.1-m15 gehoben. Der ursprüngliche Grund war, das ich bei den INNOdb einige Inkonsistenzen festgestellt habe (nach einem Serverabsturz). Ein kompletter Neuaufbau der Datenbank stand aufgrund der Menge und der Backups nicht wirklich zur Wahl. Auf der Suche nach einer Möglichkeit dies zu fixen… Weiterlesen »

WikiVX: Update auf Mediawiki 1.23 LTS

In der letzten Zeit habe ich mal wieder die Extension und alle Anpassungen für die neue Mediawiki LTS (long term support) Version vorgenommen. Dabei ist auch gleich noch ein neuer Skin rausgekommen. Die Liste der Extension ist noch nicht ganz fertig. Ich schätze aber, das das Paket im Januar fertig wird. Das wird eine komplette… Weiterlesen »

Felicity Star: ReProcessing integriert und Reports überarbeitet

In den letzten Wochen habe ich nochmal angefangen, den Code zu entrümpel und gleichzeitig diesen zu Modulen zusammen zu fassen. Damit wird es notwendig die Dokumentation nochmal zu überarbeiten. Damit verzögert sich die Freigabe. Weitere größere Änderungen sind die Reprocessing Funktionen. Bisher war das Nachladen von Konfiguration oder Trainingsdaten in eine bestehende  (bereits konfigurierte) Datenbank… Weiterlesen »

Felicity Star:Quelldatenbank Update beschleunigt

Ich habe die letzten Tage genutzt, sämtliche noch verwendeten iMacros Skripte abzulösen. IMacro ist relativ schnell einsatzbar, jedoch für meinen Zweck stellte es sich als unbrauchbar heraus. Die große Ärgernis sind die Updates, die nicht kompatibel zu den aktuellen Firefox Versionen sind, ständige Änderungen an den Encoding für Umlaute und das die Chrome Version ,… Weiterlesen »