Pull to refresh
-12
0
Send message

Chrome Headless против cloudflare JS challenge

Level of difficultyMedium
Reading time41 min
Views21K

Автоматизация сбора информации с различных ресурсов - обычная задача для людей разных сфер деятельности. Жаль, что не всегда бывает достаточно сделать простой GET запрос и разобрать полученный html. Веб-сайты, с которых собираются данные, принимают защитные меры для предотвращения автоматизированных запросов. Одной из таких мер является использование cloudflare. Сегодня мы посмотрим, как cloudflare выявляет ботов через javascript и коснёмся темы деобфускации скриптов.

Читать далее
Total votes 82: ↑82 and ↓0+82
Comments6

19,6 млн рублей за 2022 год. Парсинг сайтов. 25 советов желающим заняться

Level of difficultyMedium
Reading time5 min
Views14K

Меня зовут Максим Кульгин, моя компания xmldatafeed занимается парсингом сайтов в России порядка четырёх лет. По итогам прошедшего 2022 года поделюсь советами для тех, кто думает о подобном бизнесе. Бизнес очень интересный, но наполнен нюансами, которые и расскажу в статье.

Я ранее рассказывал про наш опыт развития бизнеса на парсинге сайтов в двух статьях (часть 1 и часть 2). Теперь хочу подвести итоги 2022 года и дать некоторые советы командам, которые хотят составить нам конкуренцию (не вижу, кстати, в этом ничего страшного, т. к. рынок довольно большой и скорее всего у вас будет свой путь, отличный от нашего). Никого, разумеется, не учу, пишу только наш опыт, с ним можно согласиться или нет — но у нас именно так… Всегда рад комментариям, которые заставляют задуматься и взглянуть на то, что делаем с другого ракурса.

Читать далее
Total votes 40: ↑33 and ↓7+26
Comments29

Список ненужных задач в Планировщике заданий Windows

Reading time7 min
Views25K
Автоматическая установка операционных систем семейства Windows требует от системного администратора тщательной проработки всех этапов выполнения. Давно интересуюсь данной темой, однако, в ходе многолетнего опыта по созданию собственных настроенных и обновлённых сборок Windows мной был упущен аспект работы с Планировщиком заданий. Разработчики Windows закладывают задачи, выполняемые в будущем по-расписанию, но ненужные и порой вредные «рядовому» пользователю. Список этих задач предлагаю к рассмотрению и обсуждению в данной статье.
Читать дальше →
Total votes 36: ↑16 and ↓20-4
Comments133

Как вылечить зубы на год вперёд перед долгой поездкой

Reading time9 min
Views47K
Пришёл к нам ИТ-специалист и сказал, что уедет на год в азиатскую страну, где с медициной есть определённые вопросы. И он хотел бы заранее вылечить зубы так, чтобы как минимум год не обращаться к стоматологу.

Таких запросов всё больше и больше. Раньше они были связаны с эмиграцией в Европу и США, где лечить зубы просто очень дорого. Теперь появилась потребность лечить зубы так, чтобы не обращаться к врачу вообще.


Пациент внезапно уехал в парусную кругосветку без того, чтобы поставить коронки на импланты. Под ними снизилась трофика, через 3 года (!) кость уменьшилась и образовалась дыра в челюсти.

Классическая модель подразумевает кратность визитов: 2–4 раза в год нужно ходить к стоматологу на профессиональную гигиену, и это позволит не покупать новые зубы в зрелом возрасте.

Тем не менее мы умеем лечить и «на год вперёд». И вы можете заказать это в любой региональной клинике тоже. Это называется «протокол полярника», когда мы готовим людей к арктическим экспедициям и подобным приключениям.

Кратко: нужна глубокая санация, чтобы убрать все источники инфекции, в том числе постоянные в каналах, которые так не любят кардиологи. Мы снижаем нагрузку на иммунитет, убирая постоянные воспаления. Затем убираются все восьмёрки (зубы мудрости — это частое требование страховых и контрактов полярников). Затем проводится глубокое ТО имплантов и других конструкций.

В дорогу полярникам мы даём наборы бактерий-антагонистов стрептококков. К счастью, сейчас они очень хорошо протестированы и доступны во многих крупных аптеках. Вам нужен Blis M18.
Читать дальше →
Total votes 99: ↑91 and ↓8+83
Comments62

Загадка колец Сатурна, вероятно, разгадана после 400 лет поисков ответа

Reading time8 min
Views54K


Пожалуй, из всех планет, видимых в нашем небе невооружённым глазом или в телескоп, самой характерной и отличной от других будет Сатурн. Он выделяется в череде других своей системой гигантских колец. Впервые его увидел в телескоп Галилей в 1609 году, и описал его кольца как «уши». С улучшением технологий стало видно, что дело не в особой форме планеты, а в наличии у неё отдельных, хорошо различимых колец. Со временем выше, ниже, внутри, снаружи колец Сатурна и даже в них самих были обнаружены промежутки, спутники, мелкие луны и множество всякой всячины.

Ни у одной из скалистых планет, астероида или объектов пояса Койпера таких колец нет. Они есть у Юпитера, Урана и Нептуна, но гораздо более блеклые, разреженные, мелкие и не такие массивные, как у Сатурна. Кроме того, кольца Сатурна наклонены и состоят почти целиком из водяного льда, в связи с чем постепенно испаряются. Когда-то считалось, что эти кольца существуют почти столько же, сколько и вся Солнечная система. Теперь же мы думаем, что они образовались совсем недавно по космическим меркам – порядка 100 млн лет назад, а ещё через 100 млн лет полностью исчезнут.
Читать дальше →
Total votes 131: ↑130 and ↓1+129
Comments112

From Zero to Hero: определите ваш уровень решения LeetCode задач от 1 до 5

Reading time8 min
Views57K

В этой статье я хочу написать про мой опыт взаимодействия с платформой LeetCode, и описать свою подготовку к интервью в FAANG подобные компании путем разбиения ее на уровни.

А какой у вас уровень?

Читать далее
Total votes 26: ↑21 and ↓5+16
Comments25

Как я создавал эргономичное рабочее место для себя и теперь предлагаю другим. Часть 1

Reading time12 min
Views87K

Привет, Хабр! Меня зовут Денис Захаров. Я занимаюсь разработкой веб приложений на протяжении уже 14 лет, но история будет не об этом. Расскажу о том, как и почему я создавал эргономичное рабочее место, которое в последствии превратилось в проект Easyworkstation. Эта штука уже несколько лет полностью заменяет мне и еще нескольким десяткам пользователей привычное компьютерное кресло и рабочий стол.

Под катом поведаю, как профессия, проблемы со спиной и любовь мастерить руками довели меня до увольнения с работы, покупки сварочного аппарата и отнюдь не простого пути создания того, что вы видите на картинке.

Надеюсь, статья и блог, который планирую здесь вести, окажутся полезны тем, кто проводит много времени за компьютером. Будем разбирать особенности работы в положении сидя, полулежа, лежа. А также укажем нюансы, в целом связанные с работой в эргономичных позициях. Поговорим, о чем молчат разработчики подобных решений.

А теперь ретроспектива
Total votes 300: ↑300 and ↓0+300
Comments206

Осторожно: осознанный

Reading time4 min
Views52K

Если вы читаете этот текст, значит он не про вас. По крайней мере – пока. Я искренне за вас рад. А за ребят из провинции, к коим и сам отношусь, уже немного переживаю.

Наши местные руководители и HR тоже решают проблему дефицита и оттока программистов. Со свойственной провинциальным людям смекалкой.

Читать далее
Total votes 99: ↑62 and ↓37+25
Comments293

Использование языковой модели GPT3 для создания интерфейса 1С на естественном языке

Reading time7 min
Views13K

Я взял типовую конфигурацию Управление торговлей редакции 11.5 Немного доработал запрос к языковой модели GPT-3 и получил возможность обращаться к учетной системе на естественном языке

Читать далее
Total votes 16: ↑13 and ↓3+10
Comments99

Обзор шифра Хилла

Reading time6 min
Views11K

В современном мире, полном информационных технологий, мы доверяем свои данные интернет – сервисам. Разумно предположить, что доступ к этим данным должен иметь только определенный круг лиц. Как раз для этого и существует шифрование. Шифрование – это кодирование информации, процесс использующийся для обеспечения конфиденциальности и безопасности данных, таких как тестовые сообщения, банковские реквизиты и т.д. Исходное сообщение (данные) называется открытым текстом, зашифрованное сообщение (данные) называется шифротекстом. Процедура шифрования обычно включает в себя использование определенного алгоритма и ключа. Алгоритм - это определенный способ засекречивания сообщения, то есть список инструкций. Ключ же конкретизирует процедуру засекречивания.

В этой статье мы затронем такой вариант шифрования, как шифр Хилла, а именно алгоритм шифрования, расшифрования, криптостойкость и варианты различных модификаций.

Читать далее
Total votes 12: ↑11 and ↓1+10
Comments3

Парагвай. Как живут в одной из беднейших стран Южной Америки?

Reading time20 min
Views73K

Парагвай предоставляет самые простые в Южной Америке условия для получения ПМЖ. Поэтому сегодня о нем пишут гораздо больше, чем ожидаешь от небольшой и откровенно небогатой страны где-то на другом конце света.

Я пробыл здесь два с половиной месяца, посетил 4 города и получил от пребывания тут гораздо больше приятных впечатлений, чем предвкушал изначально. Поэтому сегодня я расскажу вам об этой интересной стране: образ и уровень жизни, облик современных городов, экономика, климат, местные гастрономические особенности и всё-всё-всё.

Читать далее
Total votes 210: ↑208 and ↓2+206
Comments103

Величайшие программисты XXI века. Марк Руссинович и его 65 системных утилит

Reading time9 min
Views46K
Кто из админов не знает утилиты SysInternals (Winternals) для администрирования и диагностики Windows? Кажется, они известны с незапамятных времён. Но не каждый в курсе, что эти незаменимые инструменты написаны вовсе не компанией Microsoft. Скорее наоборот, они написаны вопреки её желанию.

И здесь мы подходим к личности автора, талантливого и суперпродуктивного программиста Марка Руссиновича. Он показал, что один умный парень способен интеллектуально продавить мегакорпорацию. И той придётся заплатить ему огромные деньги, и даже взять на работу. Потому что повторить его программы она не сумела…
Читать дальше →
Total votes 121: ↑115 and ↓6+109
Comments62

Javarush, так ли полезно спустя 9.5 лет?

Reading time3 min
Views37K

Про Javarush, писали уже многие, в этой статье хотелось бы выразить свое мнение буквами и символами. Как вы уже наверняка знаете, Javarush - это весьма интересный проект, который предлагает обучение языку программирования Java, здесь вы изучите основы, решая простые (и не очень) практические задачи, в формате интерактивного комикса, где ВЫ главный герой.

Читать далее
Total votes 7: ↑6 and ↓1+5
Comments13

VPN Gate, или — неубиваемая Великим Китайским Файрволом распределённая сеть VPN

Reading time3 min
Views69K

Сегодня речь пойдёт о технологии распределённой сети VPN Gate, своего рода недруга Поднебесной в области интернет цензуры. На Хабре много статей на тему SoftEther VPN (нижележащий слой VPN Gate), но нет ни одной технически всесторонней статьи про саму распределённую сеть и такое чувство, что в рунете про неё вообще забыли.

VPN Gate — академический эксперимент Дайу Нобори. Проект представляет собой интернет-сервис научных исследований в Высшей Школе Университета Цукуба, Япония. Цель данного исследования заключается в расширении знаний «Глобальных распределенных открытых ретрансляторов VPN».

Отличительной особенностью данной сети является её функционирование в виде роя. То есть каждый желающий пользователь может поделиться своей пропускной способностью с другими. Я знаю, что вы подумали, очередной неудачный dVPN пиар на основе блокчейна.

Однако это не так, данный проект уже насчитывает 8634 узлов и 534 петабайта трафика за всё время существования. К примеру даже у TOR-а узлов — 7 тысяч.

Читать далее
Total votes 81: ↑80 and ↓1+79
Comments101

Как создать свою СУБД с нуля и не сойти с ума. Практическое пособие начинающему некроманту. Часть первая

Reading time43 min
Views28K

Наступил Апокалипсис.

Нет, не стоит бежать запасаться банками с консервами и крышками отечественной бай-колы! Апокалипсис произошёл только в нашей фантазии и с определённой целью — чтобы проверить, а может ли человек, обладающий только книгами по теме и стандартной библиотекой языка, воссоздать инструмент, который будет служить ему верой и правдой?

Так родился учебный проект SicQL, реляционная СУБД, чей символ — сова — это олицетворение силы знаний и мудрости. Олицетворение тех знаний и той мудрости, которые мы получим, создав с нуля то, чем мы пользуемся каждый день, может, не осознавая всей сложности таких инструментов.

Приглашаю присоединиться к увлекательному путешествию!

Принять приглашение на борт
Total votes 66: ↑65 and ↓1+64
Comments62

Образ жизни: как не грустить на фрилансе

Reading time7 min
Views6.4K

Это глава из «Книги нормального фрилансера», в которой я делюсь опытом проектировщика интерфейсов, работающего на себя.

Оказавшись на фрилансе, можно делать всё, что хочешь:
Хочешь — спи в любое время, хочешь — выйди погулять.
Можно жить, не строя планов, время есть, на жизнь хватает,
Планы строят карьеристы, а фрилансеры — живут!

Уйдя из офиса, я лишился ряда вещей, оказывавших влияние на мою жизнь. Обнаружил это не сразу: нехватку некоторых почувствовал лишь через несколько лет. Часть из них компенсировал на автомате, даже не заметив, а над остальными пришлось поработать. Итак, что же это за вещи?

Распорядок. В период офисной работы я изо дня в день совершал определённые повторяющиеся действия. Подъём в девять утра, душ, зарядка, завтрак, часовое путешествие на общественном транспорте до конторы, начало рабочего дня, обед в столовке, конец рабочего дня, дорога до дома. Такой набор действий делал каждый мой рабочий день размеренным и предсказуемым. Как позже выяснилось, мне нужна была эта предсказуемость для равномерного распределения сил и хорошего самочувствия.

На фрилансе распорядок на какое-то время исчез. Просыпайся во сколько хочешь, ехать никуда не надо. Можно сразу из кровати прыгнуть за компьютер и заниматься работой или чем угодно другим, если задач нет. Душ можно принять и позже. Зачем следить за внешним видом, если не предстоит никаких встреч? Обед можно спокойно пропустить и наверстать его за ужином или в любое время, когда проголодаешься. Захотел вздремнуть — вздремнул. Работать можно в любое время дня. Отдыхать — тоже. Красота!

Читать далее
Total votes 16: ↑13 and ↓3+10
Comments11

Как врач сделал себе ИИ помощника. Часть 1

Reading time3 min
Views12K

Всем привет, меня зовут Александр и я врач-гематолог. Для справки, это тот, кто занимается болезнями крови. Мой общий стаж перевалил за 16 лет, я кандидат медицинских наук и последние пару-тройку лет интересуюсь анализом данных, machine learning и ИИ в медицине. Под "интересуюсь" я подразумеваю исследования и публикации по этим темам, а также обучение и саморазвитие.

Так как я ни разу не программист, то мой пост будет не про это. Тем не менее последние пару лет моим рабочим инструментом является R. Это не тот язык программирования, на котором можно писать крутые сайты или приложения, но кое-что он все-таки умеет. R - больше про анализ данных, чем я и занимаюсь. Сегодня я хочу кратко рассказать и показать один из моих проектов на R, который решает вполне конкретную прикладную задачу - интерпретацию общего анализа крови.

Общий анализ крови (ОАК) – самый частый и один из самых сложных анализов человека для интерпретации, что обусловлено большим числом входящих в него параметров. Как правило, именно этот анализ является скрининговым тестом как для гематологов амбулаторного приема, так и для врачей общей практики и других специальностей. Объемы выполняемых анализов исчисляются сотнями тысяч. Моя идея не нова - машинная помощь в правильной и быстрой интерпретации общего анализа крови, которая будет содействовать развитию качественной, доступной и своевременной диагностики онкогематологических заболеваний. Зачастую врач первичного звена (терапевт) не может дифференцировать изменения в ОАК, что приводит либо к гиподиагностике, либо к повышенной настороженности и излишне частому направлению на консультацию к врачу-гематологу. Ситуацию усугубляют огромные объемы анализов, выполняемые в рамках профилактических и лечебно-диагностических процессов как в государственном, так и в частном секторе здравоохранения. Расшифровка анализов онлайн - один из востребованных запросов в Интернете. Меня часто просят об этом в социальных сетях.

Читать далее
Total votes 78: ↑74 and ↓4+70
Comments67

Плоттер для письма из 3D принтера Geeetech A10M

Reading time2 min
Views8.7K

Возникла необходимость сдать кучу конспектов в рукописном виде за короткий срок, процесс захотелось автоматизировать и вот, что из этого вышло.

Читать далее
Total votes 37: ↑37 and ↓0+37
Comments11

Boson — разработка СУБД «с нуля» (часть I)

Reading time9 min
Views18K

После разработки виртуальной машины и компилятора в рамках хобби прошел год и захотелось попробовать реализовать ёмкий по алгоритмам проект по системному программированию.

Каждый разработчик "кровавого" enterprise в своей работе использует СУБД (SQL/NoSQL) и меня всегда искренне интересовало как они устроены в самом сердце, на самом низком уровне. Почитав документацию и исходный код SQLite и MongoDB, про используемые в индексах и интерпретаторах запросов алгоритмы, осознал, что несмотря на широкую распространенность и некую привычность, системы управления базами данных (СУБД) - это сложные программные продукты, реализация которых не всем под силу. Отлично - как раз то, что мне надо. С мотивацией разобрались, перейдем к делу.

Итак, для начала хорошо бы сформулировать высокоуровневую спецификацию требований. Boson - это легкая, встраиваемая документоориентированная база данных на С/С++

Читать далее
Total votes 88: ↑85 and ↓3+82
Comments60

Разговор AI и того парня из гугла

Reading time17 min
Views21K

@im_last взял и перевёл тот самый диалог. Я прочитал, подумал и решил, что вы тоже захотите прочитать и подумать. Комментарии и пояснения тут излишни. Так даже интереснее.

Ламда разумна? - Собеседование
Total votes 20: ↑16 and ↓4+12
Comments84

Information

Rating
Does not participate
Registered
Activity