Сколько будет стоить такое задание?

Добрый день!

Я ищу исполнителя, который сможет выполнить такие задания. Вряд ли это будет опытный программист, поскольку скраппинг сайтов и чистка данных довольно утомительное занятие, но возможно студент или фрилансер согласится. Но я не представляю, сколько я должна предложить стоимость, чтобы такой человек нашелся. Обычно про такое просят знакомых программистов или делают самому. Пыталась выставлять пост в группе ХНУРЕ, но ответов пока не было. Думаю выставить задание на биржу фриланса. Сам проект имеет антикоррупционную направленность, мне нужна бета-версия, визуализация для показа донорам.

Задания:
1. Есть Эксель таблица на примерно 1 млн. записей. Надо отсортировать записи по определенному городу и типу в отдельную таблицу А. Для этого строку с адресом надо разбить на колонки. Однако есть проблема — часть записей с адресом имеет другой порядок слов, то есть их нужно вначале переставить в нужном порядке. Возможно, нужно будет еще что-то почистить, пока не видно.
2. Проскрепить сайты госструктур. Почистить данные. Создать из полученных таблиц иерархическую структуру.
3. Связать таблицу А с иерархической структурой таблиц.
4. Есть набор данных json. Надо выбрать записи для определенного города и связать с уже имеющейся структурой таблиц.
5. Визуализировать полученные данные с помощью java библиотеки.

👍НравитсяПонравилось0
В избранноеВ избранном0
LinkedIn
Допустимые теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Допустимые теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

буду краток: full time на пол года минимум. Оплату, думаю, рассчитать сами сумеете.

Из чего у Вас состоит 1 млн. записей о госструктурах, если на текущий момент их в нашем внутреннем закрытом реестре где-то под 80 тыс — www.treasury.gov.ua/...k/publish/category/222338. Работайте с ЭДРПОУ организаций, подтягивая все что нужно по ним с — usr.minjust.gov.ua/ua/freesearch.

Будь ласка спробуйте виконати Ваш пошуковий запит пізніше.

2. Проскрепить, это распарсить?
1. Если бы был пример адресов, было бы проще что-то сказать, если все так как вы ниже писали, то там все просто.
И пример сайта, что парсить хотелось бы. Если это все не закрытая информация..

Тут все тебя настойчиво в СУБД загоняют, но очень громадное количество финансистов в мире пользуется тем самым экселем и не собираются переходить на другие инструменты.
Эксель не так плох и для автоматизации много в нем есть Basic.

Так что подумай надо-ли тебе java, субд и т.п. или экселя хватает.
Для визуализации (если различные графики) жаба не очень хороший выбор, лучше собственно Эксель ну может питон тот же. Можно конечно и в R полезть (но это имеет смысл, если нужен еще и мощный статистический пакет).

З.Ы. Мне нравиться матлаб, но он в теории очень дорогой и специалистов по нему в Украине мало.

Если дружите с Java, то есть замечательная библиотека по работе c MS Excel — Apache POI.

Однако есть проблема — часть записей с адресом имеет другой порядок слов,
Паттерн прослеживается? Те можно как-то определить, что в записи — обратный порядок слов? Можно пример данных привести?

В целом пункты 1 — 5, кроме п.2, вполне решаемы и подьемны. Оценка по срокам в днях — 5-6 дней (кроме скрейпинга).

Apache POI
Только надо сперва разбить документ на несколько отдельных документов, а то что то мне подсказывает, что эта библиотека держит всю обьектную модель в памяти и при загрузке документа на миллион строк будет OutOfMemoryError или как оно там в вашем жабомире.

Кмк есть 2 режима — выгрузить в RAM данный или batch processing. На практике 1 млн стрингов вполне поместится в 8Gb RAM (при условии, что это адреса). Или же, если по нормальному делать, то можно организовать конвеер: вытягивает строчку, процессим ее, а потом через JDBC засовываем в БД, а потом при помощи последней, сортим, агрегируем данные.

Но, на практике 1 млн стрингов вполне поместится в 8Gb RAM
Если там всего одна колонка, то да. И это не совсем стринга, а обьектная абстракция sheet, которая содержит абстракции column, row, cell и их много и они все хотят памяти.
. Или же, если по нормальному делать, то можно организовать конвеер: вытягивает строчку, процессим ее, а потом через JDBC засовываем в БД
Вот об этом я и говорил вначале. Предполагаю, что нельзя получить доступ к какой либо row в памяти документа не создавая весь документ в памяти (sheet).

1. Загнать все в СУБД (MS SQL, ORACLE, MySQL, ...) для работы с данными и их обработки.
2. С помощью КОАТТУ — www.ukrstat.gov.ua/work/klass200n.htm найти/подобрать и вырезать из строк адресов города и т.п. единицы, потом уже разбирать остаток — улица и номера.

В субд несомненно буду загонять. Про 2 подсказку — пока не знаю, это скорее используя отдельный реестр топографических названий, подставить значения в соотв. ячейки. Спасибо за ссылку, вот она интересная.

Сейчас есть проблемы из-за декоммунизации названий. То, что принимает ВР, отражено в справочниках, а вот районы городов в КОАТТУ отстают в этом плане, так как это принимают на местном уровне, и видать долго идет на верх по вертикали органов статистики. Вам еще справочник надекоммунизированного делать/искать/доставать надо.

Я прошу прощения, кому написала. Оказалось, что форум подтянул из ФБ мою старую почту, я ее уже изменила на текущую. Так что предыдущие ваши ответы, могли не дойти.

только что выслал сообщение

Однако есть проблема — часть записей с адресом имеет другой порядок слов, то есть их нужно вначале переставить в нужном порядке
Скажите, а вам надо именно все данные привести к одному формату? или просто отобрать строки, содержащие название нужного города?

теоретически — можно и просто отобрать на данном этапе.

ну это значительно упрощает первый пункт задачи. Экспорт в csv и обработка в r-studio cкорее всего будут на порядок проще и быстрее чем в экселе. Там же кстати и визуализацию можно будет замутить.

Да, r-studio и R lang. Язык для работы с данными и его среда разработки. Что-то типа экселя, но без табличных ячеек и с продвинутой командной строкой.

Гуглится по запросу «Excel фильтр по подстроке»
Один из первых результатов говорит что вам в условии достаточно задать что-то типа

*Киев*
Если на вашем ноуте открывается этатаблица то и такой фильтр должен сработать.

Единственно что если таким образом фильтровать, например, по Киеву то в выборку могут попадать адреса из разряда «г. Николаев, Киевский переулок дом № ...»

Похоже, что эксель штатно не понимает регулярные выражения. Хотя что мешает экспортировать таблицу в csv и обработать чем угодно?

Базово — ничего. В общем случае — структура. Если всё на одном листе то да, экспорт в csv — 1й шаг. И тогда уже работа вне экселя.

Если все что вам нужно — это визуализация идеи для презентации, то зачем сейчас тратить деньги на разработку? Возьмите подмножество данных, ручками сами обработайте за пару уикендов, презентуйте идею на основании кусочка данных. Если идея заинтересует доноров — придете еще раз с более конкретным ТЗ.

люто плюсую, на даном этапе можно было бы обойтись вообще без затрат

так и так я описала действия, которые необходимы, чтобы представить на маленьком кусочке — одном городке.

1. Есть Эксель таблица на примерно 1 млн. записей.
чтобы представить на маленьком кусочке — одном городке
О_о

ну так из этой большой таблицы и нужно отфильтровать по маленькому городу. А для этого исправить строку с адресом, разбить на колонки и дальше уже применить фильтры. У меня ноут это в формате функций не тянет, нужно через макросы, а это уже программирование. Тогда уже сразу и писать процедуру перестановки в строках. Я застряла на деление таблицы на части.

Я застряла на деление таблицы на части.
Потому что изначально неправильно декомпозируете задачу. Все что вам сейчас нужно — визуализация, основання на подмножестве реальных данных. Возьмите столько, сколько можете переварить руками за пару-тройку выходных. Забейте на остальные данные, и даже на полноту того что отфильтруете руками — вам просто нужно продать идею, разве нет?

да, именно это мне нужно

Отрежьте тысяч 150 строк. Выберите один мелкий город. Да, вы понимаете, что часть данных для него могла быть среди остальных 850 тыс. строк, но этим пока можно пренебречь. Далаете остальные ваши подзадачи — руками. Визуализацию рисуете руками как часть презентации — для этого можно за (сто)писят баксов нанять рисовальщика на фрилансе.
Презентуете идею. Если выстрелит, то у вас будет не только финансирование, у вас будет еще и проработанное ТЗ — ведь все ваши пункты вы уже проделали руками, и можете показать как выглядят промежуточные результаты, если нужно.

А да, забыл. Вы должны в ТЗ говорить что делать, а не как делать. Вот это — «Визуализировать полученные данные с помощью java библиотеки» — не ваш вопрос. Но это все потом...

ну не совсем — нарисовать презентацию. Это я и сама смогу. Я хотела показать именно программную модель — чтобы можно было потянуть мышкой и граф раскрылся и показал свои ветки. и чтобы видно было как примерно будет все работать..

Зря мучаетесь с экселем. Надо импортировать в базу данных и там все сделать SQL запросами.. И все влезет. Кстати, фильтру без разницы по какому городу фильтровать по большому или по маленькому.

так там в одной строке — весь адрес. и часть строк — с перепутанным порядком в адресе. Чтобы перенести в базу данных, надо в начале исправить порядок слов в строке адреса, потом разбить на колонки, а потом уже можно переносить в базу данных. Но я в экселе сама не сделаю макрос. Тестировать даже на 100 тыс — это проблема, ошибки

почитайте про сводні таблиці в екселі і буде вам щастя.

там не будут идентичные строки, везде разные адреса. оно не сгруппируется по конкретному городу. Я думала сделать через фильтрацию, но опять же — вначале нужно тогда исправить строки с адресом.

Переносите в базу как есть. Весь адрес это одно строковое поле. Добавляете еще поля под те единицы из него, что нужны. Играетесь с запросами, нарезая из единого поля нужные значения в раздельные поля, применяя справочные таблицы, подзапросы, регулярные или строковые функции, и все что придумается. Таким образом, Вы быстрее поймете как резать и какие при этом проблемы есть, так как будете работать уже с реальными последствиями и примерами разделения строки данных на единицы. При этом Вы не будете ограничены возможностями экселя. То есть какую-то часть разделите сразу, уже будет рисовать с них справочные данные. Под остальное застрявшее модифицирует алгоритм, и так пока не получится разрезать большинство.

Т.е. отфильтровать по какому-то городу в котором минимум записей? И какие именно поля оставить для визуализации?

а если сделать очень грубо — превести в CSV grep названия города, потом ручками просмотреть и grep -v весь индентифицированный мусор? выбрать данные по одному городу — максимум пол-часа работы. Рассортировать всю выборку... ну чуть-чуть больше..

Если есть Linux (в Mac тоже наверное так можно)
Экспортируете/сохраняете из Excel в CSV,

"Макеевка, Украина,дом5",Депутат,чесный чел.
"Украина, дом6, Киев",Сварщик,
"Украина, улица Шевченко, Макеевка",Депутат,ворюга

потом из коммандной строки запускаете фильтрацию с помощью команды grep по городу и все — получаете новый CSV, для Вашего города.

cat 111.csv | grep -i Макеевка > 222.csv

"Макеевка, Украина,дом5",Депутат,чесный чел.
"Украина, улица Шевченко, Макеевка",Депутат,ворюга

Может быть конечно не только 1 город будет но все же меньше чем 1млн. записей.
5 минут работы. Можете мне на почту сбросить если хотите (в личку) — я отфильтрую 1 город.
А там уже вручную переставляете в Excel остальные детали.

Если Windows — то народ пусть подскажет как сделать — там есть findstr и еще Select-String.

Линукса нет. я попробую сохранить большую таблицу в csv, прошлый раз оно плевалось, я начала думать как разбить таблицу, потом другие ошибки пошли, я начала думать о программисте :) Если получится, то тогда вас попрошу отфильтровать.

Можете отправлять даже не csv — попробую с тем что есть. Свой емейл я Вам уже отправил.
P.S. Кстати Вы можете работать не только с Excel но импортировать документ в Google документы и даже расшарить файл уже оттуда и экспорт там вряд ли будет падать.

Даже более того! Вы можете отфильтровать данные самостоятельно в Google таблицах онлайн — там есть Data :: Filter :: «птичка» над колонкой :: Filter by Condition :: Text contains ...

Но только если файл большой оно может отказаться с ним работать вообще — там лимиты есть 400,000 ячеек если не ошибаюсь. Есть еще конечно Майкрософтовский офис онлайн, но есть ли там лимиты — не знаю.

гугл эксель не хочет открывать эти файлы — пишет «не открываются файлы, защищенные паролем». Но там никакого пароля нет, не знаю.

Попробуйте сохранять в более старом формате Excel 97/2000/2003. Или наоборот — в более новом. Есть такая возможность в «Сохранить как...» меню? Какой у Вас сейчас формат файла — xls, xlsx или xml?

Можно попробовать для начала выбрать 1/5 Excel файла — скопировать вручную и сохранить в отдельный Excel файл а потом уже в Google его по частям — в 5 разных онлайн файла закачать и там отфильтровать. Или что-то похожее сделать.

Для сохранения в csv вся таблица должна быть на одном листе. Это так в вашем случае?

Приветсти все адреса к одному виду можно через какое нибудь АПИ на геокодирование
в респонсе обычно отдают координаты и унифицырованое название на картографическом сервисе
после этого у Вас не будет проблем с фильтром

да, но объем работы для нормализации/поиска данных для одного города сильно меньше

Если нормально, такая работа стоит 30-40 баксов в час. Рассчитывайте примерно на неделю работы

Думаєте 1.5к держструктура заплатить?

я не госструктура. Я частник, работаю в НГО за 500$. Ношусь с идеей уже год, но поскольку программистов знакомых нет, то не могу сделать бету. А грантодатели на текст не реагируют. И вижу как другие НГО по-частям реализуют похожие куски моей идеи. Поэтому уже и начала думать — может быть заплатить программисту, чтобы найти кто сделает.

На www.upwork.com або freelancer.com виставіть, і знайдіть українських фрілансерів.

Не советую ограничиваться украинскими.

Написано ж

сайты госструктур
куди ж без знання української мови і тонкощів нашої системи. Пам’ятаю, якось шукав на одному популярному сервісі один банкомат в Тернополі, написано було ул. Росийская 5. Довго думав, виявилося, що мала бути насправді вул. Руська 5.

все задания? или только программистская часть?

это не нормальная цена за такую работу

я такой работой не занимаюсь, по крайне мере не на заказ

Вот и не советуй чем не занимаешься :)

Знаешь кого то , кто готов сделать за меньшие деньги — посоветуй человеку. Не знаешь, не балаболь.

Там вон человек уже внизу отозвался, а вообще таких заказов на фрилансе валом, и народ за куда меньшие деньги берется

Если у человека внизу получится, буду только рад.
Те же, кто на фрилансе нанимали взявшихся за меньшие деньги приходили потом ко мне. И увы, стоило большого туда убедить что чужую недокументированную и не работающую поделку дороже «чуть — чуть подправить», чем создать заново именно то, что заказчику нужно.

Так что плавали — знаем :)

ну я видел результат работу тех кто за 10-20 у.е. в час — все нормально — работает, причем более сложных проектов чем описанный тут

Так чего же ты их не рекомендовал?

Они и так загружены по самое не хочу моими текущими клиентами.

Ну вот и пришли к тому, с чего начали: ты не можешь предложить фрилансера, который за 20 тем более 10 долларов в час сделает работу.

Так чего ж ты споришь с тем, кто таки торгует? Вот уж мне страна советов...

Ибо я работаю на рынке, и вижу че да как. Если вы продаете за 40 то это ваше дело. Ктото работает напрямую, и продает свое время за большие или меньшие деньги. Под описаную задачу обычно за меньшие деньги.

Ты сейчас рассуждаешь как пассажир такси говорящий, что в два часа ночи с Борщаговки на ДВРЗ 250 гривень дорого и можно найти за сто. Может быть и можно, и даже есть небольшой шанс, что услуга будет качественной. Но скорее всего искать ты будешь минимум минут 40. И приедет к тебе вонючая развалюха с хамом — водилой, который включит шансон на всю громкость и выест мозг разговорами за классного пацана — Януковича. Вероятность в этом случае против тебя. Тогда, как за 250 поедешь сразу, быстро, в хорошей машине и без мозгоклюйства

Я не знаю, что такое Борщаговка/ДВРЗ. Но как пассажир такси я знаю цены. Вы когда приедете на вокзал в другой город (СНГ, или ему подобная страна), вам таксисты на нем скорее всего будут говорить что вы не уедете дешевле чем они предлагают, однако найдя в интернете службу-такси и позвонив им, вы сэкономите как минимум пол суммы, проверено не однократно. Однако, предложить такси я вам по прежнему не могу, вы передергиваете понятия.

Кстати золото можно купить дешевле чем в магазинах если пойти в церковную лавку. Но опять же, я не торгую золотом

А еще я знаю место в моем городе, где мороженное дешевле чем везде где-то на 30%, при этом больше порции, и оно реально намного вкуснее — но я не продаю мороженное.

Ну если до конца проводить аналогию:
Человеку предлагают купить мороженое за 10уе. Рядом ты мимоходом заявляешь — «Я знаю место где продают крутое мороженное, лучше этого, да еще и по 7уе. Правда там щас мороженого нету, всё раскупили по моим рекомендациям, но вы знайте что 10уе за стаканчик это ненормальная цена.»

Не совсем, я просто говорю что на соседнем рыночном ряду можно купить дешевле чем на входе в рынок, просто не могу сказать конкретное место.

А еще Б\У машину можно купить сильно дешевле чем в Украине, покупая в Европе, однако я не торгую машинами и не покупал ни одной.

Вообщем я могу продолжать этот список до конца списка все возможных услуг и товаров.

Продолжать — то можешь, но не можешь порекомендовать фрилансера, который сделает дешевле и качественно при том

опять же, я ими не торгую, но то что вы написали, необоснованно дорого для данного случая

"Итоги падведём«©
Ты говоришь: «это необоснованно дорого», при этом сам же признаёшься что фрилансом и фрилансерами не торгуешь. Говоришь, что знаешь фрилансеров которые работают дешевле, но по твоим же словам «они все заняты». Дядя, купить это значит у тебя деньги — у меня товар и оба согласны произвести обмен, и производят. А «кто то делает дешевле» это не разговор. См. выше про случай с такси — чтобы узнать стоимость вещи нужно её купить/продать.

Выбиваясь из темы, потому же нет людей, которым недоплачивают и переплачивают: сколько ты получаешь — столько в данный момент и стоишь. Не нравится — пойди на рынок труда и найди лучше.

по твоим же словам «они все заняты»
это ты за меня это говоришь, заняты лишь те, с кем я конкретно пересекался, точнее сказать, они работают на моих клиентов, потому я и могу говорить что они есть, но они точно не исключения.
А «кто то делает дешевле» это не разговор. См. выше про случай с такси — чтобы узнать стоимость вещи нужно её купить/продать.
Выбиваясь из темы, потому же нет людей, которым недоплачивают и переплачивают: сколько ты получаешь — столько в данный момент и стоишь. Не нравится — пойди на рынок труда и найди лучше.
просто ты хочешь впарить подороже — я это прекрасно понимаю, это твой хлеб (хотя можно и больше брать но это отдельный разговор).

но началось все с совета человеку который хочет сделать проект, моё личное мнение что она может это сделать ни копейки не заплатив — и это найлучшее решение для нее, не для тебя, не для других людей которых автор мог бы потенциально нанять, а именно для автора лучше. но даже если бы автор решил нанять кого-то, та задача которую она хочет решить — это работа для индусов, то есть не требует хорошей квалификации от подрядчика. естественно можно нанять за 40, но зачем если на достаточном уровне сделать кто-то и за 5 у.е.??

можешь бесконечно придираться к моим словам что я не могу порекомендовать конкретного человека, но это выглядит на самом деле смешно, и абсолютно никак не меняет реалий рынка, который куда несоизмеримо больше, чем ты и твой опыт, я и мой опыт, и автор топика

естественно можно нанять за 40, но зачем если на достаточном уровне сделать кто-то и за 5 у.е.??

Это долгий разговор. В двух словах потому, что квалификация чела за 5 баксов вызывает сомнения. В ближайшем будущем планирую писать статью о фрилансе для заказчиков со стороны исполнителя

Часто этой квалификации достаточно, не зря же все в основном в Индию аутсорсят, а восточная Европа это меньший рынок

Расскажи как специалист, на хлопца ростом 147 см какой добок (100% хлопок) брать — 150 чи 160 см? Они реально на 5-6 см садятся после пары стирок?

Садятся 100% любые хлопчатобумажные вещи, поэтому бери на вырост — у тебя ребёнок после года занятий вытянется как каланча.

Готов заниматься такой халявой по 15 баксов и отдавать тебе 15-25, если организуешь поток из 3-4 заказов общей сложностью в не меньше 2 месяца.

Учту. Моя работа стоит 40-50 именно потому, что умею общаться с заказчиком

Бесплатно сделать желающие найдутся

Ну, так посоветуй человеку желающего сделать бесплатно. Если не сделает, хоть не потеряет денег. А сделает — хорошо

1-2 пункт лучше делать ручками какогонибудь студента из ПГТ

а пункты 3-5 вы сможете сделать за бесплатно при правильном подходе

Ексель на 1 млн. рядків і ручками, це жахливо.

нет в этом ничего ужасного, всего лишь 1 милион записей, а автоматом вы больше времени потратите и хуже результат будет

Допустим 10 сек на одну запись, это 10 000 000сек = 115 суток непрерывной работы..Без сна и перерывов на обед. Совсем легко :)

думаю большинство просто пролистается адресов ибо большинство будет верным.

и нанять можно не одного человека

так студенты не реагируют. Выложила пост в группе ХНУРЕ, поскольку его сама когда-то заканчивала. Никаких ответов.

так вам не нужны программисты для первых двух пунктов :)

смотрите у вас есть 2 задачи — первая это данные — автоматически вы их не соберете, ибо будет куча проблем, полуавтомически возможно

вторая задача вам уже нужны программисты, но возможно вы можете начать быстрее и проще чем вам кажется.

да, я понимаю. но если выставить задание на скраппинг данных, полуавтоматический с import.io, то сколько это может стоить?
что до эксель-таблицы — я не смогу сама посидеть, поисправлять данные. У меня ноут не тянет эту таблицу, еле открывает. Я пыталась ее бить по 100 тыс. через макрос, но там уже тогда надо писать алгоритм перестановки строки, а я уже так давно всем этим занималась, идут ошибки.

честно не знаю сколько стоит скрапинг, но не думаю что будет дороже 7 у.е. в час макс.

ексель — собственно вам нужен человек с мощным ноутом чтобы ее разбить, можете мне попробовать выслать, я могу попробовать на своем ноуте

поскольку скраппинг сайтов и чистка данных довольно утомительное занятие
Ну уж нет. Сделать нормальный, стабильно работающий парсер — не так уж просто, а значит нифига не утомительно!

там не получится через работающий парсер, поскольку это сайты госструктур, они все имеют различную структуру, выложенная там информация — в очень корявом виде.

Вы только что подтвердили мои слова выше ;).

Чисто из интереса могу заняться превращением таблиц из Экселя в то, что нужно. Что б сказать стоимость надо посмотреть насколько там сложный лексический анализатор понадобится, какая фильтрация и в какую структуру надо все это превратить. Возьму не дорого. Потому как из интереса. И что подразумевается под словом «связать».

там не очень сложно. Отличающиеся строки (из того, что я видела), набраны капслоком, и если в обычной строке идет последовательность от Украины до номера дома, то там — в начале улица, дом, а потом город, область, страна. Разделены запятой. По сути, там надо по запятой скопировать строчку в набор переменных string, переставить их местами и переназначить назад полю. А потом уже когда все будут расположены правильно — разбить на колонки по разделителю.

Это ответ на первый вопрос. А там был еще вопрос в какую структуру это превратить? Что значит иерархическую? Это отсортировать по каком-то признаку или что-то другое?

там надо восстановить структуру госорганизаций. Но у госорганизаций есть иерархическая структура — к какому министерству принадлежат и вся иерархия от кабмина до маленького городка.

Кстати, а что имеется в виду под визуализацией? Это надо еще как то обработать что бы что-то демонстрировать? Как вы представляете визуализацию?

графы на основе java библиотеки.

Графам без разницы из какой библиотеки их делают. Что должно быть в вершинах и ребрах? Или вы это уже сами сделаете?

Да. Я прочитал. В базах данных связями называют несколько другое. Ну, я понял

Я би це завдання розбив на два з приблизно одинаковою платою:

2. Проскрепить сайты госструктур. Почистить данные. Создать из полученных таблиц иерархическую структуру.
і все решта.

возможно вы правы. спасибо!

но сколько стоит скреппинг я тоже не знаю. Понятно, что зависит от количества сайтов, но хотя бы если бы представлять порядок цен.

Залежить від кількості сайтів, їхньої різноманітності і що саме треба зішкребти. Орієнтуйтеся на 10$ за год. роботи.

Скучаю дома, пенсионер, могу заняться zlotnik@ukr.net

Подписаться на комментарии