Чем больше в списке ссылок, тем раньше пишет 100%. Раньше разрыв составлял 2-3 ссылки. Сейчас проверил 60к ссылок на 50 потоках.
При парсинге Рамблер, прогессбар показывал неправильно, профиксили. Парсинг многопоточный и потоки могут работать на разных позициях списка, прогрессбар показывает САМУЮ ДАЛЬНЮЮ позицию от начала списка, находящуюся в работе. Поэтому визуально может казаться что прогресс бар показывает неверно.
В таблице сверху, где стоит сама база, в правой графе всегда стоит "не проверялась". Какую бы базу не проверял.
Это ВАЖНО!!!
Для того, чтобы программа запомнила последнюю позицию списка при проверке ссылок, после остановки
НЕОБХОДИМО В СОХРАНЕНИЕ С ВЫБОРОМ СОХРАНИТЬ ХОТЯ БЫ ОДИН ДВИЖОК. После сохранения в верхней таблице Проверки ссылок в строке с базой, в поле кол-во после кол-ва ссылок в квадратных скобках будет информация о последней позиции проверки, так же появится информация о дате проверки. Если этого не сделать, то при повторном запуске проверка начнется с начала.
Ну и обязательно уже просил выше добавить "дозапись" в файлы при смене базы.
Уже реализовано в виде вопроса.
norbiq, сообщите email, отправлю сборку для теста.
З.Ы.
Так же мы изменили алгоритм работы парсера при парсинге Яндекс. Напомню пользователи, работающие в Украине, жаловались на падение потоков при парсинге Яндекс. Оказалось что при запуске парсера, Яндекс делает редирект на yandex.ua, а там есть отличия от yandex.ru. Сейчас тестим парсер.