Page 1 of 1
Сохранение .htm страницы вместо файла
Posted: 27 Jan 2014, 23:35 Mon
by Sonator
Часто при попытке закачать какой-либо файл, вместо него закачивается .htm страница и DownLoad Master спрашивает: "Файл такой-то является текстовой html страницей. Хотите сохранить этот файл с расширением ".htm"?" Спрашивается - зачем мне вообще эта страница, если я хотел закачать файл?
Можно ли сделать так, чтобы DM всё-таки находил требуемый файл по заданной ссылке или хотя-бы сразу ДО ЗАКАЧКИ предупреждал, что будет сохранён не требуемый файл, а ".htm"? Или сделать настройку, чтобы он вообще не сохранял htm страницы?
Posted: 28 Jan 2014, 11:38 Tue
by Qwertiy
И как же он должен это узать?
Вероятно, дело в куках на сайтах, где для скачивания требуется авторизация.
PS: Опять "Вы не можете отправить следующее сообщение сразу после предыдущего. Пожалуйста, попробуйте чуть позже." 
Re: Сохранение .htm страницы вместо файла
Posted: 02 Feb 2014, 22:29 Sun
by Sonator
И как же он должен это узать?
Это вопрос к программистам. Какую информацию можно узнать о файле перед тем, как начать закачку? Расширение (.htm)? Размер (если несколько килобайт, то с большой вероятностью это htm страница, а не, например, архив)? Зачастую это ссылка на страницу, на которой уже размещена ссылка на нужный файл.
Posted: 03 Feb 2014, 15:10 Mon
by Qwertiy
Sonator wrote:Какую информацию можно узнать о файле перед тем, как начать закачку?
Сервер специально пересылает html-страницу вместо файла. Либо, чтобы помещать несанкционированному скачиванию, либо чтобы избавить сервер от лишней нагрузки и получения его ресурсов.
Возможно, можно узнать по content-type'у, но это уже при начале скачивания, либо при посылке запроса для получения размера. И не факт, что сервер выставляет его правильно.
Sonator wrote:Расширение (.htm)?
Нет.
Sonator wrote:Размер (если несколько килобайт, то с большой вероятностью это htm страница, а не, например, архив)?
Я могу и мелкие файлы DM'ом скачивать. Во-первых, ради сортировки по категориям, а во-вторых, просто если интеграция включена, так проще.
Sonator wrote:Зачастую это ссылка на страницу, на которой уже размещена ссылка на нужный файл.
См. первую часть ответа. Она там не просто так, а намеренно, чтобы нельзя было скачать. Скорее всего, эта ссылка ведёт на ту же страницу.
Re: Сохранение .htm страницы вместо файла
Posted: 04 Feb 2014, 10:12 Tue
by Sonator
Я могу и мелкие файлы DM'ом скачивать.
Ну тогда может быть в настройках добавить дополнительный запрос на подтверждение закачки, если размер меньше n kb и (или) автоматический пропуск таких закачек?
Re: Сохранение .htm страницы вместо файла
Posted: 05 Feb 2014, 3:12 Wed
by marcipan
Скачивание хтмл страницы - бородатая тема
В архиве лежит текстовый документ. В документе 16 букв. Сколько весит архив ?
ДМ скачивает не только файлы, но и страницы сайтов, по желанию - с картинками.
Частенько, скачав хтмл страницу, просматриваю её, чтобы сделать выводы: качать броузером, изменить юзер агента и т.д.
Re: Сохранение .htm страницы вместо файла
Posted: 05 Feb 2014, 7:46 Wed
by Sonator
В архиве лежит текстовый документ. В документе 16 букв. Сколько весит архив ?
Частенько, скачав хтмл страницу, просматриваю её, чтобы сделать выводы: качать броузером, изменить юзер агента и т.д.
В настройках - фильтр по размеру файла (размер ОТ и ДО задаётся пользователем).
Там подпункт (галочка):
- пропускать автоматически. (Если нет, то спрашивать - качать или нет. При автоматическом пропуске, соответствующее уведомление.).
Те, кто часто качает мелочевку, пусть фильтр не включает. Кто качает иногда - включает с запросом.
Как-то так.