WebParser 2 - автоматический парсер контента (статей)
Создан для сбора статей, текстов, любого контента со сторонних сайтов, источников. Встроенный уникализатор текста, повышает индексность поисковыми системами.
Для работы скрипта требуется только адрес(url) cайта, желаемый раздел или разделы и все, остальное делает скрипт, автоматически определяет контент и вытаскивает его, отделяя его от мусора.
Результат работы скрипта - готовые статьи для ваших сайтов, причем также готовые для импорта во многие CMS (WordPress, DLE, NewsGrabber и т.д.), также возможен любой экспорт полученных статей (TXT, HTML, PHP, XML, SQL, RSS).
Не тратьте время на ручной сбор контента!
Основной принцип:
1. Вводите в скрипт url сайта со статьями.
2. Скрипт заходит на все страницы сайта и грузит оттуда статьи.
3. Скрипт сам отбрасывает мусор со страницы, оставляя только статью.
Вы можете:
1. Указать с каких разделов сайта нужно парсить статьи.
2. Указать какие слова текст должен содержать (например, окна).
3. Указать минимальную длину текста.
4. Использовать автоопределение статьи (скрипт сам определит статью на странице), либо можете указать шаблон для парсинга (указываете между какими кусками кода страницы, должна находиться статья).
редактировать полученные статьи, как вручную, так и автоматически.
5. Использовать синонимайзер (база 308 000).
6. Использовать уникализатор (перевод на английский и обратно), можете использовать автооптимизацию.
7. Исользовать шаблоны экспорта в sql (wordpress, dle, joomla, smallnuke) (вы сможете выбрать требуемый шаблон sql чтобы импортировать статьи в движок)
8. Указывать максимальное количество статей
Вы можете экспортировать выбранные статьи:
1. ТХТ – в текстовый формат. Можете экспортировать в один текстовый файл или в несколько, по шаблону.
2. HTML – вы можете указать шаблон для экспорта, на выходе получите архив со страницами.
3. XML – скрипт экспортирует все статьи в один правильный XML файл.
4. SQL – благодаря экспорту в SQL вы можете использовать полученные статьи практически в любой CMS работающей с БД.
5. RSS – самый интересный тип экспорта. Скрипт создает RSS фид и каждые n минут добавляет новую статью. Данный вид экспорта отлично подходит для использования статей в новостных cms, например WordPress, DLE, NewsGrabber…
Работает локально на компьютере на денвере и на хостинге(сервере).
Внимание! Мы не даем гарантии что скрипт будет работать на любом хостинге. Сами понимаете это не какая-то CMS это сложный инструмент. Обратитесь в саппорт и вам посоветуют хостинг провайдера у которого скрипт будет работать нормально.
Организатор -[highlight=#FFFF00]piton2k[/highlight]
Записываемся
Show Spoiler
Hide Spoiler