Добрый день, нужна помощь с такой задачей.
У клиента есть urls dataset. Основной задачей было нужно найти поломанные страницы - при миграции контент отображается некорректно. в прошлом году программист написал скрипт - он работает и возвращает массив со страницами, которые нужно исправить.
Но скрипт работает только с одним условием(покрывает 80% случаев). Недавно обнаружились и другие варианты(условия) когда страницы можно считать поломанными.
Код текущего скрипта есть, но т.к. я не разбираюсь в Python - сложно даже понять куда заливалась база. Я предполагаю что она аплоадилась на сервер aws и там уже запускался скрипт.
В общем нужна ваша помощь.
Cсылка на архив c кодом скрипта: https://drive.google.com/open?id=1C0gl6cwIDKK3YMBAVt7pTA5Y8hiXq-M9
гитхаб репозиторий оказался приватным, но я смогу вас потом заинвайтить.
Если нужно больше информации - спрашивайте - постараюсь рассказать все что знаю.