А покритикуйте и нас тогда, пожалуйста! Всё конструктивное принимается!!!
  • Здравствуйте! Мы делаем клон гугла, ориентированный исключительно на туристов (ну и, побочно, продажа всяких ништяков для туристов - отели, билеты, туры, снаряга и всё-всё-всё). Понимаю, что в нише и так переизбыток, сумасшедшие CPC и так далее, но делать всё равно будем ))) Покритикуйте нас пожалуйста, что добавить, какие оптимизации провести (мы постарались заоптимизировать всё, что только выдают фришные анализаторы онлайн), но трафик прирастает очень небольшими темпами. Тут вон в соседних темах - за 3 мес выходят на 1000-2000 уников в день, а у нас за 3 месяца всего 150 в день, но PR уже 3. ТиЦ пока вообще 0, я так и не понял, как его раздаёт яндекс. А да, собственно сайт: http://tourlenta.com

    Заранее спасибо за конструктивности!

  • Сайт очень даже неплох, правда ваш поиск находит не так уж много. Сам недавно побывал в двух небольших российских городках, где туристов бывает мало, хотя они есть. Так ваш поиск, если вбить названия этих городов, выдает в общей сложности меньше 25 результатов, хотя у Гугла - более миллиона результатов.
  • akkord, спасибо большое за отзыв, поиск пока в экспериментальном режиме, скоро наладим до конца рунет и начнём помаленьку индексировать англонет, тут вон целый форум пытается разгадать алгоритмы, а мы пытаемся сделать подобный свой :)
  • Нельзя футер сайта посмотреть потому что он постоянно новые новости выдаёт.

    Если у вас поисковик то убирайте всё нафиг со страницы и оставляйте одну поисковую форму + ссылки.

    Поиск:
    я ввожу "бронирование тайланд"
    мне выдают: "Автобусный тур Санкт-Петербург - Ивангород - Нарва"

    Короче если вы собрались делать поиск то шепните мне сколько у вас миллионов долларов на счету. А если всё же это сайт то где навигация? И зачем нужен вход на такие сайты тоже не понятно...
  • ayan, все замечания по делу, все принимаем )

    Хотя футер-таки посмотреть можно, либо новости долистываются до конца, либо на странице с 1 постом - но нам кажется, что он не сильно нужен, так как всего лишь недодублирует хедер и не вписывается в скроллинг, да. Посмотрим.

    Одна поисковая форма + ссылки задуманы с самого начала, будут на поддомене http://s.tourlenta.com или другом, более коротком, будут и другие поддомены.

    По поиску всё тоже совершенно верно, пока идёт активная разработка - экспериментальный. Там, сверху, есть галочка - искать только в интернете - нашлось бы гораздо больше результатов, а так сначала искало в собственной базе и выдало сверху результаты именно из неё. Навигация на сайте вроде как присутствует, можно интуитивно (или почитав справку) ткнуть мышкой почти во всё подряд - оно постарается среагировать.

    Вход нужен, потому что +социалка - чтобы отельеры, турфирмы и юзеры могли постить и редактировать свои посты.

    Юзкейс, например, может быть такой: подписываемся на человека/отель/турфирму, он постит посты со спецпредложениями туров и отелей, зарегистрированный пользователь жмёт "новости" и всегда видит свежие предложения от отелей/турфирм.

  • Галочку "искать только в интернете" перенес бы в верхнюю строчку. В глаза бросается "Турпоиск по интернету", остальное не читается. Я захожу на сайт, без царя в голове, у меня нет желания разбираться с интерфейсом. Вижу "Турпоиск", забиваю вопрос, получаю малый список, все, я ушел навсегда.
    В нижней бы добавил вариантов запросов. 
    Не заставляйте меня думать :-O 
    Цвета, размещение, располагает остаться.
  • Tabib, спасибо, интерфейс и дизайн пока вообще - больные места, будем править
  • Tourlenta да я понимаю что пока всё в развитии, в тестировании. Просто есть полный поиск (настоящий как в Я и Г) а есть поиск по ключам типа в kinopoisk.ru я советую вам подумать над вторым, т.к. первый уж очень дорогой.
  • ayan, всё правильно, мы делаем именно первый, чтобы по запросу "хочу в турцию на недельку в августе" выдавались адекватные результаты. Частично уже работает, запросы стеммит, раскидывает по типам поисков - отели, погода; переводит геоназвания, знает ключи и синонимы и т.п.

    Над вторым-то что думать, select-match-against. Обоснуете дороговизну первого метода? У нас в индексе уже около 2 млн страниц туристической направленности, пока рунет, потом и остальные подтянем.

  • Tourlenta, планы переплюнуть ПС? Имею в виду адекватную выдачу на НЧ запросы вида "хочу в турцию на недельку в августе".
    На главной, неплохо отразить продвижение в этой теме. 
    Например: 
    "Поиск в интернете может не дать результат, из-за неправильно составленного вопроса.
    Мы работаем над оптимизацией поисковика, любому вопросу по туризму - адекватная выдача.
    Процент готовности 30%"
    Мне бы запомнилась такая фича. Я б вернулся. Это же сделано для моего удобства.
  • Обоснуете дороговизну первого метода? У нас в индексе уже около 2 млн страниц туристической направленности, пока рунет, потом и остальные подтянем.



    Ну что бы точнее определить цену надо понять технологию по которой всё это будет работать. Значит поиск полнотекстовый, и страницы индексируете сами? Или метапоиск всё же это?

    Я тоже раздумываю над одним поисковиком но в узкой тематике и искать наверное всё же будет по ключам или тегам. Поставлю Сфинкс наверное и не буду заморачиваться )))

    Ну вот возьмем вашу фразу "хочу в Турцию на недельку в августе" - вот адекватные результаты по нему это какие? Предложения от агентств со стоимостью отеля, перелёта и т.п. (конкретика) или отзывы о каком-то отеле в этом августе от тех кто уже был в этом году (конкретика но о другом), или погода в Турции в августе, температура воды (более абстрактные результаты выдачи), или я хочу узнать ест ли вылеты в августе из Нижнего Новгорода в Турцию (региональный запрос).

    Главное в вашем запросе очевидно Турцию на недельку в августе  в целом всё понятно, но дьявол в деталях, а именно: словоформах. Из статьи на seonews:

    В русском языке несколько сотен тысяч слов, каждое из которых имеет по несколько десятков словоформ, причем каждая из них имеет полдюжины свойств (род, число, падеж, форма и т.д). Например, любое прилагательное может находиться в семи падежах, в краткой форме, в трех родах, двух числах, в сравнительной и превосходной степени, быть одушевленным или нет. В итоге, прилагательное может иметь аж 8 x 4 x 2 x 2 + 1 = 129 cловоформ, причем, больше половины из них будут иметь разные окончания.

    Когда я стал копать тему словоформ то на Хабре наткнулся на пост где человек пишет что они-таки собрали нужную им базу словоформ, весит только она 300 Гб. А ещё есть сленг и слова с грамматическими ошибками. И это только первый кирпичик поиска. 
    Основные вопросы которые могут прояснить реальность проекта: (можете не отвечать или ответить в личку) сколько у вас сейчас серверов?, а сколько планируется при выходе на запланированную мощность? Аппаратно или программно распределяется нагрузка между серверами? Сколько программистов работают над решением задачи? Применяется ли гибкая методология разработки если да то какая?
  • У меня от сайта впечатление какого-то винегрета: много разной инфы (даже и интересной), но  совершенно безсистемной.
  • Если хотите тягатся с Гуглом и Яшей - это пустая трата времени. Единственное применение такому поиску - Добавить в индекс вашего поиска ТОЛЬКО сайты партнеров (10-15 сайтов тур-фирм с которыми договоритесь сотрудничать) и таким образом сливать им потенциальных клиентов. 
    Дизайн. Если у вас просто тур-портал - все хорошо, но если это в первую очередь поисковик - с главной страницы надо все убрать.
  • zelez said:

    ... с главной страницы надо все убрать.



    На самом деле поисковик хорошо
    выделен. Дать ему больше места можно. Чутка. Тем самым акцентировать внимание.
  • Как много всего, всё полезное, отвечаем всем по порядку:

    Tabib said:

    Tourlenta, планы переплюнуть ПС? Имею в виду адекватную выдачу на НЧ запросы вида "хочу в турцию на недельку в августе".
    На главной, неплохо отразить продвижение в этой теме. 

    Tabib, Точно так, (для начала, проверить, вообще, возможно ли это) - в отдельно взятой нише - туризме.

    Идея с прогрессом в продвижении над проектом на главной хороша, но нереализуема по ряду причин, которые будут объяснены далее по тексту. Одна из них - непонятно, как вычислять этот самый процент, допустим, сегодня прогрессбар на 30%, а завтра в план внесён новый модуль, прогресс, получается, откатывается на 25% - а отрицательный прогресс явно не будет способствовать повышению интереса - время идёт, а прогресс падает? ))

    ayan said:



    Значит поиск полнотекстовый, и страницы индексируете сами? Или метапоиск всё же это?

    ayan, Полонотекстовый, сами, как гугл или яндекс, Тур-веб-мастеры рунета могут взглянуть у себя в логах - там обнаружится вот такой зверь: "Mozilla/5.0 (compatible; Tourlentabot/0.3; +http://tourlenta.com)", ну, или не обнаружится - на дорвеях, сателлитах, автопарсерах и т.д.

    Сфинкс удобный, поставил и забыл, ищет получше родного полнотекствого поиска mysql - он, кстати, за последние годы сильно продвинулся, хотят прикрутить его и к InnoDB. Есть ещё Lucene, но он почему-то среди наших не особо популярен. Пробуйте - узнать, что лучше всего подходит, можно только экспериментальным путём. Сфинкс рекомендуют сами ребята из MySQL AB в своих свежих  whitepapers.

    ayan said:

    Ну вот возьмем вашу фразу "хочу в Турцию на недельку в августе" - вот адекватные результаты по нему это какие? Предложения от агентств со стоимостью отеля, перелёта и т.п. (конкретика) или отзывы о каком-то отеле в этом августе от тех кто уже был в этом году (конкретика но о другом), или погода в Турции в августе, температура воды (более абстрактные результаты выдачи), или я хочу узнать ест ли вылеты в августе из Нижнего Новгорода в Турцию (региональный запрос).

    Главное в вашем запросе очевидно Турцию на недельку в августе  в целом всё понятно, но дьявол в деталях, а именно: словоформах.



    Хотел бы и я это тоже знать, что будет адекватным, а что - нет, а кроме того, у всех разные вкусы и мышление, одному подавай конкретику, второму отзывы, третьему философию. Тут будет вступать в действие пресловутый алгоритм ранжирования сайтов - какой сайт лучше, по мнению робота, тот и будет выше (а ещё выше - фирмы-партнёры и рекламящиеся :), как в предложении от zelez).

    Со словоформами, насколько помню, как раз и была беда у сфинкса - окончания-то он отрезает (стемминг, Портер доделанный), а вот с опечатками уже обламывается, а хэш поиска mysql fulltext - как-то нет. Правда, это было давно, сейчас уже, наверное, поправили. Поэтому, мы решили, что  незачем собирать монструозную базу словоформ - проще выделить основания слов - стемим сами (тоже доработанный Портер), и пробежаться по соответствующему индексу в базе. Ну, а остальное верно - откинув всё до 3 символов, получаем "турцию, недельку, августе, с детьми, с wi-fi, с дающими горничными" - что однозначно указывает на желание туда отправиться, период, дату и допусловия - и всё это можно радостно передать в визард подбора путешествия, который затем радостно передаст посетителя партнёру.

    С общим поиском так, конечно, не получилось бы - а вот в узкой нише (туризм) список слов, на которые нужно реагировать, очень даже конечный и занимает далеко не 300 гб. Впоследствии, возможно, прикрутим что-то наподобие нейросети для пассивного анализа статистики запросов (в логе-то видно, что искал человек и куда потом ходил, а соответственно, можно простроить путь от запроса и подпилить поиск в нужную сторону, может даже адаптивно, сам себя подпилит - но это планы на очень дальнее будущее). Очень хочется рассказать про поиск больше, но время уже поджимает.

    Про возможности - расскажу, отчего же, хотя тут всё и так понятно - я тусуюсь на мастерталке, а не на  vip-major-elite-webmastaz, а значит - чемодана денег у нас нет, есть только маленькая сумочка да пара инвесторов - сколько есть у них - не знаю, они почему-то палятся, не признаются :). Серверов - дев-онлайн-морда с готовой базой - один, почта аутсорс gmail, паук - один, обработчик паука - один, с мощным процессором и быстрым райдом. На дев-морде даже не nginx, простой апач, но всё заточено под быстрое переключение в случае возрастающей нагрузки. Слэшдот-эффект, на момент, конечно не выдержим, но переключиться на nginx плавно наращивать мощность сможем достаточно бескровно, балансировщик программный, на морде + можно подключить через Round Robin. Картинки заточены так, что их в любой момент можно переключить на тот же amazon cdn и разгрузить сервера с алгоритмами. Программистов всего двое. Если хочется красивых слов про Agile - да, применяется, только она, более всего под нашу модель разработки подходят DSDM, Extreme Programming, FDD, Бережливая разработка - все термины только что почерпнул в вики, мы так делаем всегда, никогда не думали, как всё это обзовут в красивых книжках :)

  • Reydo, вы процитировали мне мою жену и лучшего друга, причём они повторялись точно так же, слово в слово. Ещё в оценках моих близких присутствовало слово "солянка". Это с непривычки и с недоделки. Углы блока контейнера содержат ответ. Слева сверху и снизу - заголовок поста, справа таймштамп и некоторые контролы, справа снизу автор поста (клац по нему - переходим в его ленту, читаем его посты). Из-за социалки на главной и образуется солянка из лучших постов по рейтингам (как на Хабре), в остальных случаях у сформированных лент общее смысловое содержание.

    zelez, но почему? :) ayan вот обосновал, полностью и подробно )) мы всё-таки попробуем - и - чем больше людей думает, что это бесполезно - тем меньше у нас будет конкурентов :) Дизайн вот да, но это отложено на последнюю очередь - заменить css занимает полминуты. По задумке - сайт всё же, в первую очередь, турпортал/соцсеть для отельеров, турфирм, авиа и прочих относящихся к делу.

    Tabib, как говорится на востоке, "пусть собака лает, а караван всё равно идёт" - а надо ли этот прогресс на главную, ведь и так видно, что вы, как вебмастер, и без прогрессбара уже проектом нашим заинтересовались - а ведь это как раз и есть то, чего нам и хочется :)))

  • Нравится ваш запал и уверенность в своих силах, скорее всего у вас все получится, вы знаете, что хотите получить в результате и у вас есть план действий.
  • Reydo, спасибо на добром слове, будем стараться!
  • Я тоже подниму палец вверх (верю в развитие проекта) исключительно из-за того что им занимается грамотный человек. Хотелось бы спросить у Tourlenta как с ним можно связаться если что, если в разделе special/contact у вас сообщение оставить оно к вам придёт? Надумаю когда свой поиск делать - обращусь с вопросом к уже опытному в этих делах человеку!
  • Tourlenta, последний пост добавил веселого настроения. Такого же настроения в проекте :)
  • ayan, да, конечно, всё, что на веб-морде - всё рабочее

    tabib, welcome!

Привет, незнакомец!

Похоже, Вы новенький! Чтобы начать обсуждение, кликните на одну из кнопок ниже ;)

Войти с помощью OpenID

Категории

В этой теме: