Come indicizzare i file PDF nel motore di ricerca?
La ricerca standard di WordPress è piuttosto basilare e interroga solo il database. Esistono alcuni plugin che estendono la funzionalità di ricerca per includere altre parti del database come:
ma non sono in grado di cercare all'interno dei file. Conosco un plugin che dichiara di supportare l'indicizzazione di file PDF e DOC:
- Sphider for WordPress che è un po' datato e che ho provato in passato, quindi potresti volerlo verificare.
Ma la soluzione migliore che ho utilizzato per questo tipo di "lavoro" è la ricerca personalizzata di Google che cerca all'interno di PDF e DOC ed è abbastanza semplice da configurare.

Puoi utilizzare SearchBlox che fornisce un plugin per collegare il server di ricerca con Wordpress

Questo plugin effettua ricerche all'interno dei contenuti PDF:
Dalla pagina principale:
Indicizza automaticamente il contenuto dei PDF
Indicizza i PDF presenti nella tua libreria Media, permettendo ai visitatori di trovare contenuti da quei documenti nella ricerca del tuo sito.

Ho trovato una soluzione. Forse funzionerà anche per te:
Plugin Masala: https://github.com/nanodust/masala, che aggiunge un nuovo campo meta ai post durante il caricamento di qualsiasi file doc/pdf/ppt/txt. Inserirà il contenuto del file nel nuovo campo meta creato.
Questo plugin utilizza: 1) Java 2) Apache Tika – davvero fantastico 3) Il plugin Search Everything che è responsabile della ricerca nella tabella meta.
Qui, devi configurare: 1) Il percorso di Java 2) Scaricare l'ultimo jar di Apache Tika e puoi inserirlo nella cartella root del tuo progetto e configurare il percorso in masala.php 4) Specificare le estensioni dei file consentite.
FATTO!!
