¿Cómo hacer que el motor de búsqueda indexe archivos PDF?
La búsqueda estándar de WordPress es bastante básica y solo busca en la base de datos. Existen algunos plugins que amplían la funcionalidad de búsqueda para incluir más partes de la base de datos, como:
pero no tienen la capacidad de buscar archivos. Hay un plugin que conozco que afirma soportar la indexación de archivos PDF y DOC:
- Sphider for WordPress que está un poco desactualizado y lo he probado antes, así que quizás quieras echarle un vistazo.
Pero la mejor solución que he usado para este tipo de "trabajo" es Google custom search que busca en PDFs y DOCs y es bastante fácil de configurar.

Puedes usar SearchBlox que proporciona un plugin para conectar el servidor de búsqueda con WordPress

Este plugin busca dentro del contenido de archivos PDF:
Desde la página de inicio:
Indexa contenido PDF automáticamente
Indexa los PDFs dentro de tu biblioteca de medios, permitiendo que los visitantes encuentren contenido de esos documentos en la búsqueda de tu sitio.

He encontrado una solución. Quizás también te funcione a ti:
Plugin Masala: https://github.com/nanodust/masala, el cual añade un nuevo campo meta cuando subes cualquier archivo doc/pdf/ppt/txt. Pone el contenido del archivo en el nuevo campo meta creado.
Este plugin utiliza: 1) Java 2) Apache Tika - realmente increíble 3) El plugin Search Everything que es responsable de buscar en la tabla de metadatos.
Aquí, necesitas configurar: 1) La ruta de Java 2) Descargar el último archivo jar de Apache Tika y puedes colocarlo en la carpeta raíz de tu proyecto y configurar la ruta en masala.php 3) Indicar las extensiones de archivo permitidas.
¡ESTÁ LISTO!
