Как индексировать PDF файлы в поиске?
Стандартный поиск в WordPress довольно простой и ищет только по базе данных. Существуют плагины, которые расширяют функциональность поиска, позволяя искать в дополнительных частях базы данных, например:
но они не умеют искать по файлам. Я знаю только один плагин, который заявляет о поддержке индексации PDF и DOC файлов:
- Sphider for WordPress который немного устарел, и я пробовал его раньше, так что вы можете его проверить.
Но лучшее решение, которое я использовал для подобных задач — это Google Custom Search, который ищет по PDF и DOC файлам и довольно прост в настройке.

Вы можете использовать SearchBlox, который предоставляет плагин для подключения поискового сервера к WordPress.

Этот плагин выполняет поиск внутри содержимого PDF-файлов:
С главной страницы:
Автоматическая индексация содержимого PDF
Индексирует PDF-файлы в вашей медиатеке, позволяя посетителям находить контент из этих документов через поиск на вашем сайте.

Я нашел одно решение. Возможно, оно подойдет и вам:
Плагин Masala: https://github.com/nanodust/masala, который добавляет новое мета-поле записи при загрузке любого файла doc/pdf/ppt/txt. Он помещает содержимое файла в новое мета-поле.
Этот плагин использует: 1) Java 2) Apache Tika – действительно впечатляющий инструмент 3) Плагин Search Everything, который отвечает за поиск в таблице метаданных.
Здесь вам нужно настроить: 1) Путь к Java 2) Скачать последнюю версию apache tika jar и поместить в корневую папку вашего проекта, затем указать путь в masala.php 4) Указать разрешенные расширения файлов.
ГОТОВО!!
