Cum să indexezi fișiere PDF în motorul de căutare?
Căutarea standard în WordPress este destul de simplă și caută doar în baza de date, există câteva plugin-uri care extind funcționalitatea de căutare pentru a include și alte părți ale bazei de date, cum ar fi:
dar acestea nu au capacitatea de a căuta în fișiere. Există un singur plugin pe care îl cunosc și care susține că poate indexa fișiere PDF și DOC:
- Sphider for WordPress care este un pic învechit și pe care l-am încercat în trecut, așa că poate doriți să-l testați.
Dar cea mai bună soluție pe care am folosit-o pentru acest gen de „sarcină” este Google custom search care caută în PDF-uri și DOC-uri și este destul de ușor de configurat.

Puteți utiliza SearchBlox care oferă un plugin pentru a conecta serverul de căutare cu Wordpress

Acest plugin caută în conținutul fișierelor PDF:
De pe pagina principală:
Indexează automat conținutul PDF
Indexează fișierele PDF din biblioteca ta Media, permițând vizitatorilor să găsească conținut din acele documente în căutarea pe site.

Am găsit o soluție. Poate va funcționa și pentru tine:
Plugin-ul Masala: https://github.com/nanodust/masala, care adaugă un nou câmp meta pentru postări în timpul încărcării oricărui fișier doc/pdf/ppt/txt. Va introduce conținutul fișierului în noul câmp meta creat.
Acest plugin utilizează: 1) Java 2) Apache Tika – foarte impresionant 3) Plugin-ul Search Everything, care este responsabil pentru căutarea în tabela meta.
Aici, trebuie să configurezi: 1) Calea către Java 2) Descarcă cel mai recent fișier jar pentru Apache Tika și îl poți pune în folderul rădăcină al proiectului tău, apoi configurează calea în masala.php 3) Specifică extensiile de fișiere permise.
ȘI GATA!!
