*Linux Guide - Motori di Ricerca per il desktop

6 dei migliori Motori di Ricerca per il desktop

Il Desktop search è una applicazione software che ricerca i contenuti nel computer come i file, piuttosto che effettuare ricerche su internet. Il proposito di questo software è di rendere in grado l'utente di trovare informazioni sul proprio computer.Tipicamente questi dati comprendono email, chat logs, documenti, liste di contatti, file grafici, ma anche file multimediali compresi video e audio.

La ricerca su hard disk può essere molto lenta, specialmente in considerazione delle enormi capacità di immagazzinamento dei moderni hard disk. Per assicurare ugualmente delle ottime prestazioni, i motori di ricerca per il desktop, creano e mantengono dei database indicizzati. Riempire questi database è un grosso impegno da parte del sistema, per cui l'indicizzazione viene effettuata quando il computer non viene usato.

Uno dei benefici chiave di questo tipo di software, è quello per il quale un utente può trovare i contenuti di sua necessità, pressoché istantaneamente.
Solamente 5 delle 6 applicazioni elencate in questo articolo, sono rilasciate sotto una licenza libera. Da notare che mentre Google Desktop è liberamente scaricabile, è rilasciato sotto licenza proprietaria.

Ora esploriamo le 6 applicazioni di ricerca desktop previste. Per ognuna abbiamo indicato l'indirizzo del sito web, fornito una descrizione completa, con una analisi approfondita delle dotazioni, insieme alle risorse di rilievo ed altro.

1. Beagle

Beagle 0.3.9
  • Prezzo: - Gratuito
  • Dimensione: - 1.8MB
  • Licenza: - X11/MIT, Apache
  • Sviluppatore: - Joe Shaw, Jon Trowbridge, Nat Friedman, Todd Berman, Michael Levy ed oltre una dozzina di altri sviluppatori
  • Sito web: - beagle-project.org
  • Requisiti di sistema:
    • Mono 1.2.4 o successivo
    • glib-sharp2 2.4.0 o successivo per il demone di indicizzazione
    • gtk-sharp2 e gnome-sharp2 2.4.0 o successivo (per usare l'interfaccia basata su GNOME)
    • NDesk-DBus 0.5.2 o successivo
    • GMime 2.2.0 o successivo
    • sqlite3
    • libexif 0.5 o successivo per estrarre i metadati da file di immagine
    • taglib# per estrarre metadati da file audio
    • scrnsaver.h file da X
    • zip
    • glib-2.6 (o successivo) e libxml-2.6.19 (o successivo)
  • Siti di supporto: Planet Beagle, Beagle Demos, Peagle, Beagle++

Beagle è un sistema di ricerca per Linux e per altri sistemi Unix-like, che abilita l'utente a cercare documenti, chat logs, email e liste di contatti in modo del tutto simile a Spotlight in Mac OS X, o a Google Desktop.
Beagle è un servizio Linux indipendente dal tipo di desktop, con indicizzazione trasparente e discreta dei dati, in tempo reale.

Beagle include uno strumento grafico basato su GNOME ed una interfaccia basata sul web per la ricerca nel suo database. Comprende anche una interfaccia di programmazione (in C#, C e Python) in modo che qualsiasi applicazione possa essere collegata alla ricerca di Beagle ed alla suo potenza di indicizzazione.
Beagle usa il sistema di indicizzazione Lucene dal progetto Apache ed il prodigioso Doug Cutting.
Beagle vi consente di trovare:

  • Documenti
  • Email e allegati
  • Cronologia Web
  • Conversazioni IM/IRC
  • Rubrica dei contatti
  • Calendario degli appuntamenti
  • Note
  • Codice sorgente
  • Immagini
  • File musicali/video
  • Archivi e suoi contenuti
  • Applicazioni
Beagle supporta le seguenti fonti dati:
  • File system
  • Evolution
  • Thunderbird
  • Korganizer
  • KMail mail
  • KAddressbook
  • Gaim e Kopete
  • Firefox ed Epiphany (attraverso una estensione del Browser)
  • Konqueror
  • Blam, Liferea (1.2) e Akregator RSS feeds
  • Tomboy, KNotes e Labyrinth
  • Konversation IRC logs
  • Cronologia di Opera
  • Empathy IM
ed estrae testo e metadati dai seguenti formati di file:
  • Cartelle
  • Documenti d'ufficio
    • OpenOffice.org (sxw, sxc, sxi e altro)
    • OpenDocument (odt, ods, odp)
    • Microsoft Office (doc, xls, ppt)
    • AbiWord (abw)
    • Scribus (sla)
    • Rich Text Format (rtf)
    • PDF
  • Documenti di testo
    • HTML (xhtml, html, htm)
    • Source code (Boo, C, C++, C#, Fortran, Java, JavaScript, Lisp, Matlab, Pascal, Perl, PHP, Python, Ruby, Scilab and Shell scripts)
    • LaTeX
    • Plain text (txt e qualsiasi altro file di testo non collocato in altre categorie)
  • Documentazione/Help Documents
    • Texinfo
    • Man pages -gzip e bzip2
    • Docbook
    • Monodoc
    • Windows help files (chm)
  • Immagini (jpeg, png, bmp, tiff, gif, svg)
    • Sono indicizzati anche i tags delle immagini di F-Spot e Digikam
  • Audio (mp3, ogg, flac, ape, mpc, m4a, aac, tracker, amiga audio, wma)
    • playlist m3u e pls
  • Video (mpeg, asf, wmv, mng, mp4, quicktime ed altri formati supportati da MPlayer o Totem)
  • File di archivio (zip, tar, gzip, bzip2) e suoi contenuti
  • Lanciatori di applicazioni
  • Pacchetti Linux (ebuild, rpm, dpkg)
  • File XSLT generici

2. Recoll

Recoll

Recoll è uno strumento di ricerca testuale. L'applicazione di ricerca testuale permette di cercare i propri dati a seconda del loro contenuto e non con attributi esterni (come il nome del file).

Recoll è basato su Xapian, un motore di ricerca open source che supporta dotazioni avanzate come ricerca per frase ed approssimazione, rilevanza dei feedback, categorizzazione dei documenti, richieste booleane ed altro.

Recoll custodice tutti i dati interni in formato Unicode UTF-8 e può indicizzare i file con differenti set di caratteri, codifiche e lingue, nello stesso indice. Ha filtri per l'input per molti tipi di documento.

L'applicazione ha molti parametri che definiscono esattamente cosa indicizzare e come classificare e decodificare la sorgente dei documenti.

Dotazioni incluse:

  • Supporta la maggior parte dei tipi di documenti compresi quelli testuali, HTML, documenti di OpenOffice.org, messaggi di Mozilla Thunderbird ed Evolution e file di Lyx e Scribus
  • Con supporti esterni: pdf (pdftotext), postscript (ghostscript), msword (antiword), excel, ppt (catdoc), rtf (unrtf)
  • Facilitazioni utili alla ricerca, con ricerche booleane, frasi, filtri su tipi di file e directories
  • Strumento di esplorazione dei termini
  • Set multi-lingua e multi-carattere basato su Unicode
  • Facile installazione con requisiti minimi

3. Tracker

Tracker è uno strumento progettato per estrarre informazioni e metadati sui vostri dati personali, in modo da potere essere cercati facilmente e rapidamente. Può spaziare nel vostro hard disk ed indicizzare i dati e i file collocati al suo interno.
consiste di un comune database ad oggetti, che consente alle entità di avere un numero infinito di proprietà, metadati, un database di parole chiave/tags ed elenchi di altre entità.

Tracker
  • Prezzo: Gratuito
  • Dimensione: 1.3MB
  • Licenza: GNU GPL v2
  • Sviluppatore: Jamie McCracken, Laurent Aguerreche, Luca Ferretti, Eugenio, Michael Biebl e molti altri
  • Sito web: gnome.org/projects/tracker
  • Requisiti di sistema:
    • Sqlite 3.2+
    • libdbus (0.60 +)
    • dbus-glib bindings (0.60 +)
    • GLib (2.10)
    • zlib
    • intltool (>=0.3.5)
    • GMime
  • Opzionali:
    • gstremer 0.10 + plugins
    • xsltproc
    • w3m
    • file
    • wv (1.0.2+)
    • poppler (pdftotext)
    • libvorbis
    • libpng
    • libexif
    • libgsf
    • GTK e Gnome per strumenti grafici
    • libglade
    • unac
    • exempi
    • libxml2
  • Siti di supporto: Documentation, FAQ

Il software ha la capacità di indicizzare, immagazzinare, ritrovare e cercare tutti i tipi di file ed altri oggetti di prima classe. Tracker riconosce i mime types dei file e vi abilita a limitare la ricerca a specifici tipi di file (audio, video, file di testo, etc.).
E' progettato e realizzato per funzionare bene su sistemi a memoria limitata come 128MB o 256MB di RAM. L'uso tipico di RAM si contiene in 4-30 MB.
Le dotazioni comprendono:

  • Supporti sia per ricerca testuale (come Beagle/Google Desktop) che per ricerche strutturate come RDF Query
  • Fornisce filtri testuali per file PDF, MS Office, OpenOffice (tutte le versioni), HTML e PS
  • Risponde in tempo reale ai cambiamenti del filesystem, mantenendo aggiornati il database dei metadati, automaticamente
  • Estrae i metadati annidati in immagini, documenti e file Audio
  • Iconifica al volo
  • Usa parole multilingua per favorire il ritrovamento di risultati di maggior rilievo
  • Indexer, un demone leggeri che estrae informazioni dai file (trackerd)
  • Tracker Search Tool, una piccola GUI per cercare dati indicizzati
  • strumento a riga di comando per cercare, interrogare lo stato del demone
  • Implementa le specifiche di freedesktop per i metadati

4. Google Desktop

Google Desktop è una applicazione di ricerca sul desktop che vi offre un facile accesso alle informazioni nel vostro computer e nel web. Desktop permette la ricerca di email, files, musica, foto ed altro, nello stesso modo in cui cerchereste nel web con Google.
Vi permette di lanciare applicazioni e file, con solo alcune chiavi da tastiera.

Google Desktop

Il software indicizza automaticamente e vi consente la ricerca testuale di ogni file, compresi i seguenti:

  • Gmail
  • File di testo e di codice sorgente
  • File PDF e PS
  • File HTML
  • Email da Thunderbird
  • Documenti OpenOffice.org
  • File immagine e musicali
  • Man pages e pagine info
  • Microsoft Word, Excel e PowerPoint

Le dotazioni includono:

  • Box di ricerca rapida
  • Ricerca in Gmail e nella cronologia Web
  • Indicizzazione rapida
  • Integrazione con Google
  • Supporto Multi-lingua

5. Pinot

Pinot è un servizio D-Bus che naviga in, indicizza e monitorizza i vostri documenti. Il software ha una interfaccia grafica basata su GTK. È assistito da altri strumenti da console.
L'attivazione D-Bus assicura che il servizio funzioni ogniqualvolta uno dei suoi metodi venga invocato da una applicazione dell'utente.

Pinot
  • Prezzo: Gratuito
  • Dimensione: 1.1MB
  • Licenza: GNU GPL v2
  • Sviluppatore: Fabrice Colin e collaboratori
  • Sito web: pinot.berlios.de
Requisiti di sistema:
  • SQLite 3.3.1 o superiore
  • xapian-core 1.0.4 o superiore
  • zlib 1.2.0 o superiore
  • curl o neno
  • Google SOAP API
  • gSOAP 2.7.9e o superiore
  • gtkmm 2.10 o superiore
  • libxml++ 2.12.0
  • libtextcat 2.2 o superiore
  • gmime 2.4.0 o superiore
  • boost 1.32.0 o superiore
  • D-Bus with Glib bindings 0.61 o superiore
  • shared-mime-info 0.17 o superiore
  • desktop-file-utls 0.10 o superiore
  • TagLib 1.4 o superiore
  • libarchive 2.6.2 o superiore
  • libexif 0.6 o superiore
  • xesam-glib 0.4.0 o superiore
  • openssh-askpass 4.3 o superiore
Siti di supporto: Documentation, Blog, Mailing List Le dotazioni includono:
  • Metasearch: richieste a varie sorgenti compresi i motori di ricerca basati sul web
  • Richieste avanzate (ricerca probabilistica, filtri booleani, wildcards, per data, orario e dimensioni
  • Riconoscimento della lingua
  • Ricerca in corso di indicizzazione
  • Navigazione nei documenti
  • Modifica dei metadati
  • Etichettatura dei documenti
  • Immagazzinamento delle richieste
  • Ranking cronologico dei risultati
  • Esportazione dell'elenco dei risultati
  • Sommario dinamico dei documenti
  • scansiona ed indicizza le directories che avete scelto
  • Interfaccia D-Bus per la semplice integrazione con altre applicazioni, come Deskbar Applet, Catfish
  • Nessuna dipendenza da GNOME o KDE
  • Supporto interno per comuni tipi di file
    • Testo
    • HTML
    • XML
    • mbox
    • MP3, Ogg Vorbis, FLAC
    • JPEG
    • Comuni formati di archivio (tar, Z, gz, bzip2, deb)
    • Immagini ISO 9660
  • I seguenti tipi di documenti sono supportati da programmi esterni:
    • PDF (richiesto pdftotext)
    • RTF (richiesto unrtf)
    • OpenDocument/StarOffice files (richiesto unzip)
    • MS Word (richiesto antiword)
    • PowerPoint (richiesto catppt)
    • Excel (richiesto xls2csv)
    • DVI (richiesto catdvi)
    • DjVu (richiesto djvutext)
    • RPM (richiesto rpm)
  • Plugins di Deskbar Applet
  • Supporto a Sherlock e OpenSearch con plugins
  • Supporto CJKV
  • Utile per Laptop
  • supporto a Cinese, Giapponese e coreano

6. DocFetcher

DocFetcher è una applicazione di ricerca desktop open source. Questo software permette all'utente di cercare i contenuti di documenti.
DocFetcher è scritto in Java, ed è ampiamente personalizzabile. È molto frugale nel consumo delle risorse di sistema, in quanto non è stato progettato per indicizzare tutto l'hard disk.

DocFetcher
Le dotazioni includono:
  • Creazione di un indice permanente per ampie repositories di documenti
  • Creazione di indice temporanei per una rapida ricerca testuale in piccole cartelle
  • Aggiornamenti automatici degli indici
  • Riconoscimento dell'HTML
  • Ricerca nei file di codice sorgente
  • Varie operazioni sui file possono essere effettuate attraverso l'interfaccia di DocFetcher (come creare cartelle, inserire nuovi file)
  • Pannello di anteprima con i termini di ricerca evidenziati ed un semplice browser web incluso
  • I risultati della ricerca possono essere filtrati secondo differenti criteri (filetype, dimensione, percorso, ecc.)
  • Supporta i seguenti formati di file:
    • HTML e testo
    • PDF
    • Microsoft Office (doc, xls, ppt)
    • Microsoft Office 2007 (docx, xlsx, pptx)
    • OpenOffice.org Writer, Calc, Draw and Impress (odt, ods, odg, odp)
    • Rich Text Format (rtf)
    • AbiWord (abw, abw.gz, zabw)
    • Microsoft Compiled HTML Help (chm)
    • Microsoft Visio (vsd)
    • Scalable Vector Graphics (svg)

***

Indice | Torna in alto