¿Cómo hacer que el motor de búsqueda indexe archivos PDF?

22 mar 2011, 11:42:32
Vistas: 30.2K
Votos: 5

Estoy buscando un plugin o una idea para que mi motor de búsqueda de WordPress 3.1 pueda indexar archivos PDF. ¿Alguien más ha tenido esta necesidad también?

¡Gracias!

0
Todas las respuestas a la pregunta 4
1

La búsqueda estándar de WordPress es bastante básica y solo busca en la base de datos. Existen algunos plugins que amplían la funcionalidad de búsqueda para incluir más partes de la base de datos, como:

pero no tienen la capacidad de buscar archivos. Hay un plugin que conozco que afirma soportar la indexación de archivos PDF y DOC:

  • Sphider for WordPress que está un poco desactualizado y lo he probado antes, así que quizás quieras echarle un vistazo.

Pero la mejor solución que he usado para este tipo de "trabajo" es Google custom search que busca en PDFs y DOCs y es bastante fácil de configurar.

22 mar 2011 12:13:44
Comentarios

Ok, escuché sobre la Búsqueda personalizada de Google pero lo mantuve como respuesta comodín ;)

¡Gracias!

Kaaviar Kaaviar
22 mar 2011 12:28:24
1

Puedes usar SearchBlox que proporciona un plugin para conectar el servidor de búsqueda con WordPress

28 mar 2011 22:05:44
Comentarios

¡Muchas gracias, no había escuchado antes sobre esta solución. ¡Excelentes publicaciones, gracias de nuevo!

Kaaviar Kaaviar
31 mar 2011 12:10:57
0

Este plugin busca dentro del contenido de archivos PDF:

https://searchwp.com/

Desde la página de inicio:

Indexa contenido PDF automáticamente

Indexa los PDFs dentro de tu biblioteca de medios, permitiendo que los visitantes encuentren contenido de esos documentos en la búsqueda de tu sitio.

4 feb 2015 20:18:14
1

He encontrado una solución. Quizás también te funcione a ti:

Plugin Masala: https://github.com/nanodust/masala, el cual añade un nuevo campo meta cuando subes cualquier archivo doc/pdf/ppt/txt. Pone el contenido del archivo en el nuevo campo meta creado.

Este plugin utiliza: 1) Java 2) Apache Tika - realmente increíble 3) El plugin Search Everything que es responsable de buscar en la tabla de metadatos.

Aquí, necesitas configurar: 1) La ruta de Java 2) Descargar el último archivo jar de Apache Tika y puedes colocarlo en la carpeta raíz de tu proyecto y configurar la ruta en masala.php 3) Indicar las extensiones de archivo permitidas.

¡ESTÁ LISTO!

2 dic 2016 12:32:11
Comentarios

¿Cómo puedo reindexar archivos que ya han sido subidos?

jsterr jsterr
13 feb 2017 17:18:16