Search server для сайта на PHP

Есть сайт на PHP под Linux. Нужно прикрутить поиск, чтобы очень быстро работал и смог проиндексировать много документов.
Какой?

👍ПодобаєтьсяСподобалось0
До обраногоВ обраному0
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

Был уверен, когда зашел в тему, что первым ответом будет Sphinx. Так и вышло.

Ожидаемо, т.к. последнее время проект довольно быстро развивается + недавно вышла вторая версия (хоть и альфа) с многими еще более вкусными вещами.

Использую уже чуть больше года в разных версиях (начинал с 0.9.9, потом транки 1.10-1.11). Багтрекинг есть, баги закрывают, форум набит решениями почти на все случаи жизни.

Имхо для класического поиска по контенту — сфинкс, для near real time search — lucene и производные

Максим, использовали Сфинкс для полнотекстового поиска в одном стартапе, который получил Demo God Award на конференции demo.com в Долине. После этого познакомились с автором — Андреем Аксеновым. Пригласили его дать мастер-класс. Так что совет — выбирай Сфинкс — есть документация, примеры + поддержка. Приглашаем на мастер-класс www.smartme.com.ua/...denie-v-sphinx

Я б посоветовал lucene solr lucene.apache.org/solr

можно в вкратце его преимущества над Sphinx?

— есть инкрементальный апдэйт индекса(в сфинксе я так понял эта фишка все еще в кандидат релизе)
— есть натч и эластиклюсин, которые кластеризируются(в сфинксе это тоже есть, но я когда то искал кто же эту фичу юзает, и какие отзывы, и ничего не нашел)
— есть много дочерних проектов — солр например
— более правильная лицензия на случай если захотите продавать свой продукт с люсин внутри
Преимущества сфинкса:
— производительней(в инете бенчмарки где то видел)
— нормальные типы данных для дат и чисел, в люсин когда я смотрел все нужно было превращать в стринги, т.к. она только с ними работать умеет, что в определенных ситуациях создавало проблемы
— язык запросов вроде богаче
— если хочется вытащить из индекса много данных, то у люсин огроооомный оверхед по памяти -> вылеты по OutOfMemoryException, а сфинкс намного круче в этом плане оптимизирован
— интеграция с mysql & postgres — sphinx виден из бд как обычная табличка по которой можно делать селекты с s like ’...’

ну а главный минус наверно то что он медленнее и имеет API только на java?

Можно юзать solr используя rest api.

Кстати сейчас посмотрел, под пхп клиент есть для solr.

Тут даже добавить нечего=)

Хотя конечно можно предложить google api =)

добавить таки есть что :)
lucene

:) это так для поддержания беседы

и кстати очень часто гугл апи отличный выход с точки зрения экономической.

Підписатись на коментарі