Как индексировать PDF файлы в поиске?

22 мар. 2011 г., 11:42:32
Просмотры: 30.2K
Голосов: 5

Я ищу плагин или идею, чтобы поисковая система моего WordPress 3.1 могла индексировать PDF файлы. Кто-нибудь сталкивался с такой необходимостью?

Спасибо!

0
Все ответы на вопрос 4
1

Стандартный поиск в WordPress довольно простой и ищет только по базе данных. Существуют плагины, которые расширяют функциональность поиска, позволяя искать в дополнительных частях базы данных, например:

но они не умеют искать по файлам. Я знаю только один плагин, который заявляет о поддержке индексации PDF и DOC файлов:

  • Sphider for WordPress который немного устарел, и я пробовал его раньше, так что вы можете его проверить.

Но лучшее решение, которое я использовал для подобных задач — это Google Custom Search, который ищет по PDF и DOC файлам и довольно прост в настройке.

22 мар. 2011 г. 12:13:44
Комментарии

Ок, я слышал про Google Custom Search, но оставил его как запасной вариант ;)

Спасибо!

Kaaviar Kaaviar
22 мар. 2011 г. 12:28:24
1

Вы можете использовать SearchBlox, который предоставляет плагин для подключения поискового сервера к WordPress.

28 мар. 2011 г. 22:05:44
Комментарии

Большое спасибо, я раньше не слышал об этом решении. Отличные публикации, ещё раз благодарю!

Kaaviar Kaaviar
31 мар. 2011 г. 12:10:57
0

Этот плагин выполняет поиск внутри содержимого PDF-файлов:

https://searchwp.com/

С главной страницы:

Автоматическая индексация содержимого PDF

Индексирует PDF-файлы в вашей медиатеке, позволяя посетителям находить контент из этих документов через поиск на вашем сайте.

4 февр. 2015 г. 20:18:14
1

Я нашел одно решение. Возможно, оно подойдет и вам:

Плагин Masala: https://github.com/nanodust/masala, который добавляет новое мета-поле записи при загрузке любого файла doc/pdf/ppt/txt. Он помещает содержимое файла в новое мета-поле.

Этот плагин использует: 1) Java 2) Apache Tika – действительно впечатляющий инструмент 3) Плагин Search Everything, который отвечает за поиск в таблице метаданных.

Здесь вам нужно настроить: 1) Путь к Java 2) Скачать последнюю версию apache tika jar и поместить в корневую папку вашего проекта, затем указать путь в masala.php 4) Указать разрешенные расширения файлов.

ГОТОВО!!

2 дек. 2016 г. 12:32:11
Комментарии

Как я могу переиндексировать уже загруженные файлы?

jsterr jsterr
13 февр. 2017 г. 17:18:16